基础 |
您所在的位置:网站首页 › mvp标在哪里改 › 基础 |
字符识别算子用于识别字符信息。 需要训练字符,根据训练得到的模板对图像中的字符进行识别。 参数配置及实际应用效果。 加载字库:创建新的项目的时候,默认会生成一个空的ocr文件,可导入已经训练好的模型文件。 训练模型:可用于自行训练模型文件。 点击该按钮即可进如模型训练界面 模型训练界面 左侧为字符训练图像界面 右侧为配置界面,可配置分割参数,可对字库进行操作。 训练界面:可用自由调整ROI区域,框选指定的区域进行训练,字符周围的框框,为字符检测框,没有模型时不能识别字符,识别信息显示为红色的“?”。 修改分割参数:可据此对字符进行分割。训练界面的分割参数与配置界面的分割参数相一致。 常用分割参数
模型训练方法: 字符训练模式: 字符宽度范围:分割框的宽度为字符宽度 字符高度范围:分割框的高度为字符高度 字符面积范围:整个字符的面积为字符尺寸的面积 上面三个参数并非严格过滤参数,将保留偏差不大的字符。 字符笔画粗细为笔画宽度。 字符之间的间距为字符外间距 可使分割结果接近预期。 高级分割参数 对于复杂场景,需要用到高级参数, 字符是否有重叠:是/否,用于分割粘连字符, 当字符的像素粘连在一起,分割时会默认将其认为是一个字符,需要选择“是”, 若仍旧未能分割,可能是字符宽度范围设置的过大,需要考虑修改字符宽度范围,缩小到合适的宽度范围。即可将字符分开。 字符分割模式:固定、自适应 选择自适应时,将按自适应的宽度分割粘连字符,使用于粘连字符宽度不同的场景。 选择固定时,将按等宽对字符进行粘连分割 字符融合:是/否,可合并字符片段 当选择是时,如识别“你”字符时,单人旁和尔字部分会融合成一个字符, 文本滤波:正常、一般、严重,当文本噪声较多时,可根据情况选择合适的选项 文本倾斜角度: 字符文本存在倾斜情况时,使用此参数。 忽略边缘字符:是/否,用来忽略ROI框上下边界不完整的字符, 当框框边界有不完整的字符时,选择“是”即可忽略这些不完整的字符。 当字符被如期分割后,点击“字符提取”按钮,可进入字符匹配训练界面,
若不想匹配部分字符,可选择跳过,或者取消勾选。 可以多次进行字符提取。根据需求反复添加字符到字库中。 扰动: 可选择部分样本添加扰动训练,即扩展训练。 加载字库: 用来加载标准字库,可选择字体、字号、加粗、倾斜等。 在系统字库中选择合适的字符,放入右侧,即可加入自己的字库。 可保存字库文件(TRF文件),或者另存为字库文件(TRF文件)。 每个字库文件最多知支持256种字符,每种字符最多支持256个字符 字符提取完毕后,注意必须点击“训练”按钮,才能完成字库模型的训练,(否则将不会训练字符,导致前面的字符提取的工作还得要重做一遍), 之后点击确定,即可退出字符训练界面。 字符模型训练完成后,运行项目即可根据字库模型对图像进行识别。 识别参数 接受阈值:每个识别的字符都有一个是识别的分数,只有分数大于等于该值的字符才能被识别出,当该值过大,部分低于这个分数的字符将不能被识别出。 混淆阈值:除了识别出的字符外,还有相似字符,相似字符与识别字符的得分差,在混淆阈值内,为混淆字符。混淆字符的得分也得满足接受阈值的得分才能识别出。 是否插入空格:是/否,字符间有空格的文本行可以选择插入空格。 子文本段合并成行:是/否, 选择是,将显示“最大外间距”参数,外间距小于等于该值的文本将自动合并成一行。 字体大小设置: 字符位置: 可根据这两个值,设置叠加字符的大小与位置。(叠加字符就是识别出来的那些绿色或红色的字符) 字符个数范围:表示文本行的字符个数范围,若文本行的字符个数在该范围外,则字符检测框变为红色。红色检测框就是拒绝的信息。 是否显示拒绝的信息:是/否,可自由选择是否显示拒绝的信息。当选择否时,不会显示对拒绝信息的任何检测信息。选择是时,拒绝的信息也会显示出来。 识别结果可在配置结果界面查看。 识别结果,识别得分、混淆字符、混淆字符得分。 可右键算子,查看其隐藏参数,将其拖到结果显示界面,可查看其内容。 整体使用流程及运行效果: 使用流程较简单,多用即可熟练掌握。大致流程如下: 训练字库模型:传入图片->训练模型->根据字符训练显示反复调整配置参数->提取字符->点击训练->确认字符训练完成后->完成训练 识别:传入图片,选择模型,框选识别区域,配置识别参数,运行程序识别图像。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |