前两篇博客比较仓促,今天我把全部整理了一遍,流程图过程也全部展现,让大家更好的明白流程 ,篇幅字数上万,建议细品!





? OpenCV(开源计算机视觉库:http://opencv.org)是一个bsd授权的开源库,包含数百种计算机视觉算法。该文件描述了所谓的opencv2。x API,本质上是一个c++ API,而不是基于C的OpenCV 1。x API(自OpenCV 2.4发布以来,C API被弃用,并且没有使用“C”编译器进行测试)

? Python与C/ c++这样的语言相比,Python要慢一些,但是Python可以很容易地使用C/ c++进行扩展,这允许我们用C/ c++编写计算密集型代码,并创建可以用作Python模块的Python包装器。这给了我们两个好处:首先,代码和原始的C/c++代码一样快(因为Python在后台工作的代码实际上是c++代码);其次,用Python编写代码比用C/c++更容易。

? OpenCV支持多种编程语言,如c++、Python、Java等,可以在不同的平台上使用,包括Windows、Linux、OS X、Android和iOS。基于CUDA和OpenCL的高速GPU操作接口也在积极开发中。

? OpenCV-Python是OpenCV的Python API,是原始OpenCV c++实现的Python包装器。结合了OpenCV c++ API和Python语言的最佳特性。

支持向量机(Support Vector Machine, SVM)的基本模型是在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大。SVM是用来解决二分类问题的有监督学习算法(实际上还有多分类),在引入了核方法之后SVM也可以用来解决非线性问题。 一般SVM有下面三种:

? 硬间隔支持向量机(线性可分支持向量机):当训练数据线性可分时,可通过硬间隔最大化学得一个线性可分支持向量机。 ? 软间隔支持向量机:当训练数据近似线性可分时,可通过软间隔最大化学得一个线性支持向量机。 ? 非线性支持向量机:当训练数据线性不可分时,可通过核方法以及软间隔最大化学得一个非线性支持向量机。

? 它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。

? 支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模式的复杂性(即对特定训练样本的学习精度,Accurary)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。

1     SVM实质上是一个类分类器,是一个能够将不同类样本在样本空间分隔的超平面。


1234567class SVM(StatModel):     def __init__(self, C = 1, gamma = 0.5):         self.model = cv2.ml.SVM_create()         self.model.setGamma(gamma)         self.model.setC(C)         self.model.setKernel(cv2.ml.SVM_RBF)         self.model.setType(cv2.ml.SVM_C_SVC) 这边的cv2.ml.SVM_create()生成一个SVM模型


setC(C), 设置惩罚项, 为:1



接下来继续走: 训练svm


12345678910class SVM(StatModel):     def __init__(self, C = 1, gamma = 0.5):         self.model = cv2.ml.SVM_create()         self.model.setGamma(gamma)         self.model.setC(C)         self.model.setKernel(cv2.ml.SVM_RBF)         self.model.setType(cv2.ml.SVM_C_SVC) #训练svm     def train(self, samples, responses):         self.model.train(samples, cv2.ml.ROW_SAMPLE, responses)



1234567    def train_svm(self):         #识别英文字母和数字         self.model = SVM(C=1, gamma=0.5)         #识别中文         self.modelchinese = SVM(C=1, gamma=0.5)         if os.path.exists("svm.dat"):             self.model.load("svm.dat")


12345678910111213141516171819202122        else:             chars_train = []             chars_label = []                         for root, dirs, files in os.walk("train\\chars2"):                 if len(os.path.basename(root)) > 1:                     continue                 root_int = ord(os.path.basename(root))                 for filename in files:                     filepath = os.path.join(root,filename)                     digit_img = cv2.imread(filepath)                     digit_img = cv2.cvtColor(digit_img, cv2.COLOR_BGR2GRAY)                     chars_train.append(digit_img)                     #chars_label.append(1)                     chars_label.append(root_int)                         chars_train = list(map(deskew, chars_train))             chars_train = preprocess_hog(chars_train)             #chars_train = chars_train.reshape(-1, 20, 20).astype(np.float32)             chars_label = np.array(chars_label)             print(chars_train.shape)             self.model.train(chars_train, chars_label)







在此分成了SVC分别训练省份简称和右边的英文字符和数字 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152    def train_svm(self):         #识别英文字母和数字         self.model = SVM(C=1, gamma=0.5)         #识别中文         self.modelchinese = SVM(C=1, gamma=0.5)         if os.path.exists("svm.dat"):             self.model.load("svm.dat")         else:             chars_train = []             chars_label = []                         for root, dirs, files in os.walk("train\\chars2"):                 if len(os.path.basename(root)) > 1:                     continue                 root_int = ord(os.path.basename(root))                 for filename in files:                     filepath = os.path.join(root,filename)                     digit_img = cv2.imread(filepath)                     digit_img = cv2.cvtColor(digit_img, cv2.COLOR_BGR2GRAY)                     chars_train.append(digit_img)                     #chars_label.append(1)                     chars_label.append(root_int)                         chars_train = list(map(deskew, chars_train))             chars_train = preprocess_hog(chars_train)             #chars_train = chars_train.reshape(-1, 20, 20).astype(np.float32)             chars_label = np.array(chars_label)             print(chars_train.shape)             self.model.train(chars_train, chars_label)         if os.path.exists("svmchinese.dat"):             self.modelchinese.load("svmchinese.dat")         else:             chars_train = []             chars_label = []             for root, dirs, files in os.walk("train\\charsChinese"):                 if not os.path.basename(root).startswith("zh_"):                     continue                 pinyin = os.path.basename(root)                 index = provinces.index(pinyin) + PROVINCE_START + 1 #1是拼音对应的汉字                 for filename in files:                     filepath = os.path.join(root,filename)                     digit_img = cv2.imread(filepath)                     digit_img = cv2.cvtColor(digit_img, cv2.COLOR_BGR2GRAY)                     chars_train.append(digit_img)                     #chars_label.append(1)                     chars_label.append(index)             chars_train = list(map(deskew, chars_train))             chars_train = preprocess_hog(chars_train)             #chars_train = chars_train.reshape(-1, 20, 20).astype(np.float32)             chars_label = np.array(chars_label)             print(chars_train.shape)             self.modelchinese.train(chars_train, chars_label) 同上的,先判断我们本地是否训练好了,免得多此一举,同样的



1os.walk(top, topdown=True, onerror=None, followlinks=False)

可以得到一个三元tupple(dirpath, dirnames, filenames), 我们这里换名了: root, dirs, files


dirpath 是一个string,代表目录的路径,

dirnames 是一个list,包含了dirpath下所有子目录的名字。

filenames 是一个list,包含了非目录文件的名字。

这些名字不包含路径信息,如果需要得到全路径,需要使用os.path.join(dirpath, name).



1self.modelchinese.train(chars_train, chars_label) 特征提取:获取车牌的可能位置(以下为根据车牌颜色再定位,缩小边缘非车牌边界) 1234567891011121314151617181920212223242526272829303132333435363738    def accurate_place(self, card_img_hsv, limit1, limit2, color):         row_num, col_num = card_img_hsv.shape[:2]         xl = col_num         xr = 0         yh = 0         yl = row_num         #col_num_limit = self.cfg["col_num_limit"]         row_num_limit = self.cfg["row_num_limit"]         col_num_limit = col_num * 0.8 if color != "green" else col_num * 0.5#绿色有渐变         for i in range(row_num):             count = 0             for j in range(col_num):                 H = card_img_hsv.item(i, j, 0)                 S = card_img_hsv.item(i, j, 1)                 V = card_img_hsv.item(i, j, 2)                 if limit1 < H col_num_limit:                 if yl > i:                     yl = i                 if yh < i:                     yh = i         for j in range(col_num):             count = 0             for i in range(row_num):                 H = card_img_hsv.item(i, j, 0)                 S = card_img_hsv.item(i, j, 1)                 V = card_img_hsv.item(i, j, 2)                 if limit1 < H row_num - row_num_limit:                 if xl > j:                     xl = j                 if xr < j:                     xr = j         print('size111', xl, xr, yh, yl)         return xl, xr, yh, yl


1234567891011    def predict(self, car_pic):         if type(car_pic) == type(""):             img = imreadex(car_pic)         else:             img = car_pic         pic_hight, pic_width = img.shape[:2]         if pic_width > MAX_WIDTH:             resize_rate = MAX_WIDTH / pic_width             img = cv2.resize(img, (MAX_WIDTH, int(pic_hight*resize_rate)), interpolation=cv2.INTER_AREA)             print('tuxing', img.shape[0],img.shape[1])


传入车子图片 判定图片完整性 处理或重读图片 使用img.shape方式获取图片的高和宽 超出自定义最大高宽,就resize操作,接下来 边缘计算: 1234567891011121314151617181920blur = self.cfg["blur"]         #高斯去噪         if blur > 0:             img = cv2.GaussianBlur(img, (blur, blur), 0)#图片分辨率调整         oldimg = img         img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)         #equ = cv2.equalizeHist(img)         #img = np.hstack((img, equ))         #去掉图像中不会是车牌的区域         kernel = np.ones((20, 20), np.uint8)         img_opening = cv2.morphologyEx(img, cv2.MORPH_OPEN, kernel)         img_opening = cv2.addWeighted(img, 1, img_opening, -1, 0);         #找到图像边缘         ret, img_thresh = cv2.threshold(img_opening, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)         img_edge = cv2.Canny(img_thresh, 100, 200)         #使用开运算和闭运算让图像边缘成为一个整体         kernel = np.ones((self.cfg["morphologyr"], self.cfg["morphologyc"]), np.uint8)         img_edge1 = cv2.morphologyEx(img_edge, cv2.MORPH_CLOSE, kernel)         img_edge2 = cv2.morphologyEx(img_edge1, cv2.MORPH_OPEN, kernel) 高斯去噪:

? 高斯滤波器是一种线性滤波器,能够有效的抑制噪声,平滑图像。其作用原理和均值滤波器类似,都是取滤波器窗口内的像素的均值作为输出。其窗口模板的系数和均值滤波器不同,均值滤波器的模板系数都是相同的为1;而高斯滤波器的模板系数,则随着距离模板中心的增大而系数减小。所以,高斯滤波器相比于均值滤波器对图像个模糊程度较小。 ? 高斯滤波的基本思想是: 图像上的每一个像素点的值,都由其本身和邻域内其他像素点的值经过加权平均后得到。其具体操作是,用一个核(又称为卷积核、掩模、矩阵)扫描图像中每一个像素点,将邻域内各个像素值与对应位置的权值相称并求和。从数学的角度来看,高斯滤波的过程是图像与高斯正态分布做卷积操作。 ? 注意: 高斯滤波是将二维高斯正态分布放在图像矩阵上做卷积运算。考虑的是邻域内像素值的空间距离关系,因此对彩色图像处理时应分通道进行操作,也就是说操作的图像原矩阵时用单通道数据,最后合并为彩色图像。 ? 效果如图:右边是高斯模糊降噪处理:



1    灰度是指把白色与黑色之间按对数关系分为若干个等级,一般我们将灰度分为256阶(0-255)。用灰度表示的图像就叫做灰度图。

图像裁剪(去掉图像中不会是车牌的区域) 使用开运算和闭运算让图像边缘成为一个整体:



? A○S= (AΘS)⊕ S



? A●S= (A⊕S)Θ S






? 查找图像边缘整体形成的矩形区域,可能有很多,车牌就在其中一个矩形区域中: 例如:

12345        try:             contours, hierarchy = cv2.findContours(img_edge2, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)         except ValueError:             image, contours, hierarchy = cv2.findContours(img_edge2, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)         contours = [cnt for cnt in contours if cv2.contourArea(cnt) > Min_Area]



12345678910111213car_contours = []         for cnt in contours:             rect = cv2.minAreaRect(cnt)             area_width, area_height = rect[1]             if area_width < area_height:                 area_width, area_height = area_height, area_width             wh_ratio = area_width / area_height             #print(wh_ratio)             #要求矩形区域长宽比在2到5.5之间,2到5.5是车牌的长宽比,其余的矩形排除             if wh_ratio > 2 and wh_ratio < 5.5:                 car_contours.append(rect)                 box = cv2.boxPoints(rect)                 box = np.int0(box)



1234567891011121314151617181920212223242526272829303132333435363738394041424344        for rect in car_contours:             if rect[2] > -1 and rect[2] < 1:#创造角度,使得左、高、右、低拿到正确的值                 angle = 1             else:                 angle = rect[2]             rect = (rect[0], (rect[1][0]+5, rect[1][1]+5), angle)#扩大范围,避免车牌边缘被排除             box = cv2.boxPoints(rect)             heigth_point = right_point = [0, 0]             left_point = low_point = [pic_width, pic_hight]             for point in box:                 if left_point[0] > point[0]:                     left_point = point                 if low_point[1] > point[1]:                     low_point = point                 if heigth_point[1] < point[1]:                     heigth_point = point                 if right_point[0] < point[0]:                     right_point = point             if left_point[1] right_point[1]:#负角度                                 new_left_point = [left_point[0], heigth_point[1]]                 pts2 = np.float32([new_left_point, heigth_point, right_point])#字符只是高度需要改变                 pts1 = np.float32([left_point, heigth_point, right_point])                 M = cv2.getAffineTransform(pts1, pts2)                 dst = cv2.warpAffine(oldimg, M, (pic_width, pic_hight))                 point_limit(right_point)                 point_limit(heigth_point)                 point_limit(new_left_point)                 card_img = dst[int(right_point[1]):int(heigth_point[1]), int(new_left_point[0]):int(right_point[0])]                 card_imgs.append(card_img)


12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879        colors = []         for card_index,card_img in enumerate(card_imgs):             green = yello = blue = black = white = 0             card_img_hsv = cv2.cvtColor(card_img, cv2.COLOR_BGR2HSV)             #有转换失败的可能,原因来自于上面矫正矩形出错             if card_img_hsv is None:                 continue             row_num, col_num= card_img_hsv.shape[:2]             card_img_count = row_num * col_num             for i in range(row_num):                 for j in range(col_num):                     H = card_img_hsv.item(i, j, 0)                     S = card_img_hsv.item(i, j, 1)                     V = card_img_hsv.item(i, j, 2)                     if 11 < H 34:#图片分辨率调整                         yello += 1                     elif 35 < H 34:#图片分辨率调整                         green += 1                     elif 99 < H 34:#图片分辨率调整                         blue += 1                                         if 0 < H = card_img_count:                 color = "green"                 limit1 = 35                 limit2 = 99             elif blue*2 >= card_img_count:                 color = "blue"                 limit1 = 100                 limit2 = 124#有的图片有色偏偏紫             elif black + white >= card_img_count*0.7:#TODO                 color = "bw"             print(color)             colors.append(color)             print(blue, green, yello, black, white, card_img_count)             cv2.imshow("color", card_img)             cv2.waitKey(1110)             if limit1 == 0:                 continue             #以上为确定车牌颜色             #以下为根据车牌颜色再定位,缩小边缘非车牌边界             xl, xr, yh, yl = self.accurate_place(card_img_hsv, limit1, limit2, color)             if yl == yh and xl == xr:                 continue             need_accurate = False             if yl >= yh:                 yl = 0                 yh = row_num                 need_accurate = True             if xl >= xr:                 xl = 0                 xr = col_num                 need_accurate = True             card_imgs[card_index] = card_img[yl:yh, xl:xr] if color != "green" or yl < (yh-yl)//4 else card_img[yl-(yh-yl)//4:yh, xl:xr]             if need_accurate:#可能x或y方向未缩小,需要再试一次                 card_img = card_imgs[card_index]                 card_img_hsv = cv2.cvtColor(card_img, cv2.COLOR_BGR2HSV)                 xl, xr, yh, yl = self.accurate_place(card_img_hsv, limit1, limit2, color)                 print('size', xl,xr,yh,yl)                 if yl == yh and xl == xr:                     continue                 if yl >= yh:                     yl = 0                     yh = row_num                 if xl >= xr:                     xl = 0                     xr = col_num             card_imgs[card_index] = card_img[yl:yh, xl:xr] if color != "green" or yl < (yh-yl)//4 else card_img[yl-(yh-yl)//4:yh, xl:xr] 核心部分来了,详解一下: 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899predict_result = []         roi = None         card_color = None         for i, color in enumerate(colors):             if color in ("blue", "yello", "green"):                 card_img = card_imgs[i]                 gray_img = cv2.cvtColor(card_img, cv2.COLOR_BGR2GRAY)                 #黄、绿车牌字符比背景暗、与蓝车牌刚好相反,所以黄、绿车牌需要反向                 if color == "green" or color == "yello":                     gray_img = cv2.bitwise_not(gray_img)                 ret, gray_img = cv2.threshold(gray_img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)                 #查找水平直方图波峰                 x_histogram  = np.sum(gray_img, axis=1)                 x_min = np.min(x_histogram)                 x_average = np.sum(x_histogram)/x_histogram.shape[0]                 x_threshold = (x_min + x_average)/2                 wave_peaks = find_waves(x_threshold, x_histogram)                 if len(wave_peaks) == 0:                     print("peak less 0:")                     continue                 #认为水平方向,最大的波峰为车牌区域                 wave = max(wave_peaks, key=lambda x:x[1]-x[0])                 gray_img = gray_img[wave[0]:wave[1]]                 #查找垂直直方图波峰                 row_num, col_num= gray_img.shape[:2]                 #去掉车牌上下边缘1个像素,避免白边影响阈值判断                 gray_img = gray_img[1:row_num-1]                 y_histogram = np.sum(gray_img, axis=0)                 y_min = np.min(y_histogram)                 y_average = np.sum(y_histogram)/y_histogram.shape[0]                 y_threshold = (y_min + y_average)/5#U和0要求阈值偏小,否则U和0会被分成两半                 wave_peaks = find_waves(y_threshold, y_histogram)                 #for wave in wave_peaks:                 #   cv2.line(card_img, pt1=(wave[0], 5), pt2=(wave[1], 5), color=(0, 0, 255), thickness=2)                 #车牌字符数应大于6                 if len(wave_peaks) max_wave_dis * 0.6:                         break                     else:                         cur_dis += wave[1] - wave[0]                 if i > 0:                     wave = (wave_peaks[0][0], wave_peaks[i][1])                     wave_peaks = wave_peaks[i+1:]                     wave_peaks.insert(0, wave)                                 #去除车牌上的分隔点                 point = wave_peaks[2]                 if point[1] - point[0] < max_wave_dis/3:                     point_img = gray_img[:,point[0]:point[1]]                     if np.mean(point_img) < 255/5:                         wave_peaks.pop(2)                                 if len(wave_peaks) = 7:#1太细,认为是边缘                             continue                     predict_result.append(charactor)                 roi = card_img                 card_color = color                 break                         return predict_result, roi, card_color#识别到的字符、定位的车牌图像、车牌颜色



1gray_img = cv2.bitwise_not(gray_img)

这个是掩膜方法,我们后续再介绍吧, 大致思路就是把原图中要放logo的区域抠出来,再把logo放进去就行了。

? 根据设定的阈值和图片直方图,找出波峰,用于分隔字符

123456789101112131415161718def find_waves(threshold, histogram):     up_point = -1#上升点     is_peak = False     if histogram[0] > threshold:         up_point = 0         is_peak = True     wave_peaks = []     for i,x in enumerate(histogram):         if is_peak and x < threshold:             if i - up_point > 2:                 is_peak = False                 wave_peaks.append((up_point, i))         elif not is_peak and x >= threshold:             is_peak = True             up_point = i     if is_peak and up_point != -1 and i - up_point > 4:         wave_peaks.append((up_point, i))     return wave_peaks


12345def seperate_card(img, waves):     part_cards = []     for wave in waves:         part_cards.append(img[:, wave[0]:wave[1]])     return part_cards

12345678def deskew(img):     m = cv2.moments(img)     if abs(m['mu02']) < 1e-2:         return img.copy()     skew = m['mu11']/m['mu02']     M = np.float32([[1, skew, -0.5*SZ*skew], [0, 1, 0]])     img = cv2.warpAffine(img, M, (SZ, SZ), flags=cv2.WARP_INVERSE_MAP | cv2.INTER_LINEAR)     return img


123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263#车牌字符数应大于6                 if len(wave_peaks) max_wave_dis * 0.6:                         break                     else:                         cur_dis += wave[1] - wave[0]                 if i > 0:                     wave = (wave_peaks[0][0], wave_peaks[i][1])                     wave_peaks = wave_peaks[i+1:]                     wave_peaks.insert(0, wave)                                 #去除车牌上的分隔点                 point = wave_peaks[2]                 if point[1] - point[0] < max_wave_dis/3:                     point_img = gray_img[:,point[0]:point[1]]                     if np.mean(point_img) < 255/5:                         wave_peaks.pop(2)                                 if len(wave_peaks) = 7:#1太细,认为是边缘                             continue                     predict_result.append(charactor)                 roi = card_img                 card_color = color                 break                         return predict_result, roi, card_color



123456789101112131415161718192021222324252627if __name__ == '__main__':     c = CardPredictor()     c.train_svm()     r, roi, color = c.predict("test//car7.jpg")     print(r, roi.shape[0],roi.shape[1],roi.shape[2])     img = cv2.imread("test//car7.jpg")     img = cv2.resize(img,(480,640),interpolation=cv2.INTER_LINEAR)     r = ','.join(r)     r = r.replace(',', '')     print(r)     from PIL import Image, ImageDraw, ImageFont     cv2img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)  # cv2和PIL中颜色的hex码的储存顺序不同     pilimg = Image.fromarray(cv2img)     # PIL图片上打印汉字     draw = ImageDraw.Draw(pilimg)  # 图片上打印     font = ImageFont.truetype("simhei.ttf", 30, encoding="utf-8")  # 参数1:字体文件路径,参数2:字体大小     draw.text((0, 0), r,  (255, 0, 0), font=font)  # 参数1:打印坐标,参数2:文本,参数3:字体颜色,参数4:字体     # PIL图片转cv2 图片     cv2charimg = cv2.cvtColor(np.array(pilimg), cv2.COLOR_RGB2BGR)     # cv2.imshow("图片", cv2charimg) # 汉字窗口标题显示乱码     cv2.imshow("photo", cv2charimg)     cv2.waitKey(0)     cv2.destroyAllWindows()


OPENCV的SVM的SVC训练模型 OpenCv进行图像采集/控制摄像头 图像预处理(二值化操作,边缘计算等) 定位车牌位置,并正放置处理——>确定车牌颜色 根据车牌颜色再定位,缩小边缘非车牌边界 以下为识别车牌中的字符 返回结果 最后ptrdict返回识别到的字符、定位的车牌图像、车牌颜色 结果显示,并使用PIL方法显示中文




最后说说识别准确率,我在数百张验证集中测试,准确率大致在75左右!这是使用经典机器学习算法带来的缺点,不过他的优点是十分迅速,在极端情况下只需要0.3秒检测成功,但是他容易欠拟合,泛化能力不强,这也是需要改进的,比如数据增强,加大训练集等!继续进步 打字不易,看到最后,别忘记了关注一下~,另外欢迎大家进入我的机器&深度学习,大佬云集,大家一起进步! 上海第二工业大学 18智能A1 周小夏(CV调包侠)




