EasyOCR 常用方法参数说明

您所在的位置:网站首页 参数设置的英文怎么写 EasyOCR 常用方法参数说明

EasyOCR 常用方法参数说明

2024-07-12 08:47| 来源: 网络整理| 查看: 265

easyocr.Reader( )

        生成对象 reader。

参数:

lang_list (list) - 识别的语言代码列表,例如 ['ch_sim','en']

gpu (bool, string, default = True) - 启用 GPU

model_storage_directory (string, default = None) - 模型数据目录的路径。如果未指定,将从环境变量 EASYOCR_MODULE_PATH(首选)、MODULE_PATH(如果已定义)或 ~/.EasyOCR/ 定义的目录中读取模型。

download_enabled (bool, default = True) - 如果 EasyOCR 无法找到模型文件,则启用下载;

user_network_directory (bool, default = None) - 用户模型存储的路径。如果未指定,将从 MODULE_PATH + '/user_network' (~/.EasyOCR/user_network) 读取模型;

recog_network (string, default = 'standard') - 用户模型、模块和配置文件的名称;

detector (bool, default = True) - 将检测模型加载到内存中 

recognizer (bool, default = True) - 将识别模型加载到内存中

属性:

lang_char - 显示当前模型中的所有可用字符

reader.readtext(  ) 

        Reader对象的主要方法。有 4 组参数:General、Contrast、Text Detection 和 Bounding Box Merging。

参数1:General

image (string, numpy array, byte) - 输入图像;

decoder (string, default = 'greedy')- 选项有 'greedy'、'beamsearch' 和 'wordbeamsearch';

beamWidth (int, default = 5) - 当解码器 = 'beamsearch' 或 'wordbeamsearch' 时要保留多少光束;

batch_size (int, default = 1) - batch_size>1 将使 EasyOCR 更快但使用更多内存;

worker (int, default = 0) - 数据加载器中使用的编号线程;

allowlist (string) - 强制 EasyOCR 只识别字符的子集。对特定问题有用(例如车牌等);

blocklist (string) - 字符的块子集。如果给定了允许列表,则此参数将被忽略。

detail (int, default = 1) - 将此设置为 0 以进行简单输出;

paragraph (bool, default = False) - 将结果合并到段落中;

min_size (int, default = 10) - 过滤文本框小于最小值(以像素为单位);

rotation_info (list, default = None) - 允许 EasyOCR 旋转每个文本框并返回具有最佳置信度分数的文本框。符合条件的值为 90、180 和 270。例如,对所有可能的文本方向尝试 [90, 180 ,270]。

参数2:Contrast 对比度

contrast_ths (float, default = 0.1) - 对比度低于此值的文本框将被传入模型 2 次。首先是原始图像,其次是对比度调整为“adjust_contrast”值。结果将返回具有更高置信度的那个;

adjust_contrast (float, default = 0.5) - 低对比度文本框的目标对比度级别。

参数3:Text Detection 文本检测(来自CRAFT)

text_threshold (float, default = 0.7) - 文本置信度阈值

low_text (float, default = 0.4) - 文本下限分数

link_threshold (float, default = 0.4) - 链接置信度阈值

canvas_size (int, default = 2560) - 最大图像尺寸。大于此值的图像将被缩小。

mag_ratio (float, default = 1) - 图像放大率

参数4:Bounding Box Merging 边界框合并

        这组参数控制相邻边界框何时相互合并。除了 'slope_ths' 之外的所有参数都以盒子高度为单位。

slope_ths (float, default = 0.1) - 考虑合并的最大斜率 (delta y/delta x)。低值意味着不会合并平铺框。

ycenter_ths (float, default = 0.5) - y 方向的最大偏移。不应该合并不同级别的框。

height_ths (float, default = 0.5) - 盒子高度的最大差异。不应合并文本大小非常不同的框。

width_ths (float, default = 0.5) - 合并框的最大水平距离。

add_margin (float, default = 0.1) - 将边界框向所有方向扩展某个值。这对于具有复杂脚本的语言(例如泰语)很重要。

x_ths (float, default = 1.0) - 当段落=True 时合并文本框的最大水平距离。

y_ths (float, default = 0.5) - 当段落 = True 时合并文本框的最大垂直距离。

返回:结果列表

detect( ) 参数

image (string, numpy array, byte) -输入图像

min_size (int,默认= 10)-筛选小于最小像素值的文本框

text_threshold (float, default = 0.7)—文本可信度阈值

low_text (float,默认= 0.4)-文本下限得分

link_threshold (float, default = 0.4)—链路可信度阈值

canvas_size (int,默认= 2560)-最大图像大小。大于此值的图像将向下调整大小。

mag_ratio(浮动,默认= 1)-图像放大比

slope_ths (float,默认= 0.1)-考虑合并的最大斜率(y/ x)。低值意味着平铺的盒子不会合并。

ycenter_ths (float,默认= 0.5)- y方向的最大位移。不同级别的盒子不能合并。

height_ths(浮动,默认= 0.5)-框高度的最大差异。文本大小非常不同的框不应该合并。

width_ths(浮动,默认= 0.5)-合并框的最大水平距离。

add_margin(浮动,默认= 0.1)-向所有方向扩展边界框。这对于具有复杂文字的语言(如泰国语)是很重要的。

optimal_num_chars (int,默认= None) -如果指定,则首先返回接近该值的估计字符数的边界框。

        返回horizontal_list, free_list - horizontal_list是一个矩形文本框的列表。格式为[x_min, x_max, y_min, y_max]。Free_list是一个自由格式文本框的列表。格式为[[x1,y1],[x2,y2],[x3,y3],[x4,y4]]。

recognize( ) 参数

image (string, numpy array, byte) -输入图像

horizontal_list (list, default=None) -查看检测方法输出的格式

free_list (list, default=None) -查看检测方法输出的格式

decoder (string, default = 'greedy') -选项为'greedy', 'beamsearch'和'wordbeamsearch'。docoder = 'beamsearch'或'wordbeamsearch'时,保留多少光束

beamWidth (int, default = 5) - 当解码器= 'beamsearch'或'wordbeamsearch'时,保留多少光束?

batch_size (int,默认= 1)- batch_size > 1 将使EasyOCR更快,但会占用更多内存

workers (int,默认= 0)-在数据加载器中使用的线程数

allowlist (string) -强制EasyOCR只识别字符的子集。适用于特定问题(如车牌等)

blocklist (string)—字符的块子集。如果给出allowlist,则该参数将被忽略。

detail (int, default = 1) -为简单输出设置为0

paragraph (bool, default = False) -将结果合并到段落中

contrast_ths (float, default = 0.1) - 对比度低于此值的文本框将被传递到模型2次。第一个是原始图像,第二个是对比度调整为'adjust_contrast'值。结果为置信度高的那个会被返回。

adjust_contrast(浮动,默认= 0.5)-低对比度文本框的目标对比度级别

返回结果列表

原文链接:

        Jaided AI: EasyOCR documentation



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3