机器视觉（十）：印刷体字符识别

您所在的位置：网站首页 › 印刷体字母a › 机器视觉（十）：印刷体字符识别

机器视觉（十）：印刷体字符识别

2024-06-11 11:34| 来源: 网络整理| 查看: 265

机器视觉（一）：概述

机器视觉（二）：机器视觉硬件技术

机器视觉（三）：摄像机标定技术

机器视觉（四）：空域图像增强

机器视觉（五）：机器视觉与世界杯

机器视觉（六）：频域图像增强

机器视觉（七）：图像分割

机器视觉（八）：图像特征提取

机器视觉（九）：图像配准

机器视觉（十）：印刷体字符识别

机器视觉（十一）：一维条码识别

机器视觉（十二）：二维条码识别

🌏🧐以下为正文🦄🪐

模式识别是对图像或各种物理对象的分类与描述的技术，在机器视觉中具有广泛的应用，涉及到图形、图像和文字的识别，也涉及到有形物件的测量、分类与描述。

本章节主要介绍印刷体字符识别。

一、印刷体字符识别流程

①扫描输入文本图像；

②图像的预处理，包括倾斜校正和滤除干扰噪声等；

③图像版面的分析和理解；

④图像的行切分和字切分；

⑤单字图像特征选择和提取；

⑥单字图像特征的模式分类；

⑦将被分类的模式赋予识别结果；

⑧识别结果的编辑修改后处理。

一、字符图像分割

1.图像亮度调整

在亮度过大的情况下，正常度量的阈值分割就会将本应保留的区域滤除，而亮度过小的情况下，很多噪声点无法被滤除掉。

2.色彩分割

3.基于离散余弦变换(DCT for Discrete Cosine Transform)的频域分割

离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换，这个离散傅里叶变换是对一个实偶函数进行的（因为一个实偶函数的傅里叶变换仍然是一个实偶函数），在有些变形里面需要将输入或者输出的位置移动半个单位(DCT有8种标准类型，其中4种是常见的)。

在字符识别的应用中，字符区域按一定的行列结构分布，在频域能够呈现出特殊的能量分布，通常来说，其水平和垂直能量较大，高中频分量更加丰富，因此可以通过这些频域分布的特征将其与背景分割开来。

基于DCT的图像频域分割流程图 4.基于小波变换（wavelet transform，WT）的图像小波域分割

基于小波变换的图像小波域分割流程图二、字符区域校正与切分 1.基于哈夫变换的区域矫正

基于Hough变换的区域校正（在图像的多层分辨率下分级进行Hough变换）

Hough变换主要用于图像中直线的检测。图像中的字符多是横向成串出现的，因此可以利用Hough变换的方法拟合字符串边缘，形成字符串边缘直线，从而求得字符倾角。

2.基于仿射变换的图像旋转

通过仿射变换矩阵，把旋转后的图像坐标仿射回原图像点，并通过一定的方法计算出该点在原图像上的灰度值，作为旋转后图像该点的灰度值。

3.字符图像缩放

有些字符识别方法，需要将图像大小指定在某一个标准上这就需要在识别前对该字符图像区域大小进行归一化。归一化一般采用灰度插值的方法。最简单的插值方法是最邻近插值，即令输出像素的灰度值等于离它所映射位置最近的输入像素灰度值。但这种插值方法会使输出图像掺入锯齿噪声。

4.粘连字符切分

一串字符在结构和形态上存在如下特征：单个字符长宽比例一致；多个数字和英文字符轮廓存在凹凸结构；多数情况下字符不会出现重叠交叉。根据这些特点，可以检测字符串凹凸结构，并结合字符长宽比来分割单个字符。

【本文地址】

机器视觉（十）：印刷体字符识别

机器视觉（十）：印刷体字符识别

今日新闻

推荐新闻