PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

您所在的位置:网站首页 英文文字识别app PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

2023-10-05 13:10| 来源: 网络整理| 查看: 265

English | 简体中文 | हिन्दी | 日本語 | 한국인 | Pу́сский язы́к

简介

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。

📣 近期更新

🔥2023.3.10 PaddleOCR集成了高性能、全场景模型部署方案FastDeploy,欢迎参考指南试用(注意使用dygraph分支)。

📚2022.12 发布《OCR产业范例20讲》电子书,新增蒙古文、身份证、液晶屏缺陷等7个场景应用范例

🔨2022.11 新增实现4种前沿算法:文本检测 DRRG, 文本识别 RFL, 文本超分Text Telescope,公式识别CAN

2022.10 优化JS版PP-OCRv3模型:模型大小仅4.3M,预测速度提升8倍,配套web demo开箱即用

💥 直播回放:PaddleOCR研发团队详解PP-StructureV2优化策略。微信扫描下方二维码,关注公众号并填写问卷后进入官方交流群,获取直播回放链接与20G重磅OCR学习大礼包(内含PDF转Word应用程序、10种垂类模型、《动手学OCR》电子书等)

🔥2022.8.24 发布 PaddleOCR release/2.6

发布PP-StructureV2,系统功能性能全面升级,适配中文场景,新增支持版面复原,支持一行命令完成PDF转Word; 版面分析模型优化:模型存储减少95%,速度提升11倍,平均CPU耗时仅需41ms; 表格识别模型优化:设计3大优化策略,预测耗时不变情况下,模型精度提升6%; 关键信息抽取模型优化:设计视觉无关模型结构,语义实体识别精度提升2.8%,关系抽取精度提升9.1%。

2022.8 发布 OCR场景应用集合:包含数码管、液晶屏、车牌、高精度SVTR模型、手写体识别等9个垂类模型,覆盖通用,制造、金融、交通行业的主要OCR垂类应用。

2022.8 新增实现8种前沿算法

文本检测:FCENet, DB++ 文本识别:ViTSTR, ABINet, VisionLAN, SPIN, RobustScanner 表格识别:TableMaster

2022.5.9 发布 PaddleOCR release/2.5

发布PP-OCRv3,速度可比情况下,中文场景效果相比于PP-OCRv2再提升5%,英文场景提升11%,80语种多语言模型平均识别准确率提升5%以上; 发布半自动标注工具PPOCRLabelv2:新增表格文字图像、图像关键信息抽取任务和不规则文字图像的标注功能; 发布OCR产业落地工具集:打通22种训练部署软硬件环境与方式,覆盖企业90%的训练部署环境需求; 发布交互式OCR开源电子书《动手学OCR》,覆盖OCR全栈技术的前沿理论与代码实践,并配套教学视频。

更多

🌟 特性

支持多种OCR相关前沿算法,在此基础上打造产业级特色模型PP-OCR和PP-Structure,并打通数据生产、模型训练、压缩、预测部署全流程。

上述内容的使用方法建议从文档教程中的快速开始体验

⚡ 快速开始 在线网站体验:超轻量PP-OCR mobile模型体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr 移动端demo体验:安装包DEMO下载地址(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统) 一行命令快速使用:快速开始(中英文/多语言/文档分析)

📚《动手学OCR》电子书 《动手学OCR》电子书

👫 开源社区 📑项目合作: 如果您是企业开发者且有明确的OCR垂类应用需求,填写问卷后可免费与官方团队展开不同层次的合作。 👫加入社区: 微信扫描二维码并填写问卷之后,加入交流群领取20G重磅OCR学习大礼包 包括《动手学OCR》电子书 ,配套讲解视频和notebook项目;PaddleOCR历次发版直播课回放链接; OCR场景应用模型集合: 包含数码管、液晶屏、车牌、高精度SVTR模型、手写体识别等垂类模型,覆盖通用,制造、金融、交通行业的主要OCR垂类应用。 PDF2Word应用程序;OCR社区优秀开发者项目分享视频。 🏅️社区项目:社区项目文档中包含了社区用户使用PaddleOCR开发的各种工具、应用以及为PaddleOCR贡献的功能、优化的文档与代码等,是官方为社区开发者打造的荣誉墙,也是帮助优质项目宣传的广播站。 🎁社区常规赛:社区常规赛是面向OCR开发者的积分赛事,覆盖文档、代码、模型和应用四大类型,以季度为单位评选并发放奖励,赛题详情与报名方法可参考链接。

PaddleOCR官方交流群二维码

🛠️ PP-OCR系列模型列表(更新中) 模型简介 模型名称 推荐场景 检测模型 方向分类器 识别模型 中英文超轻量PP-OCRv3模型(16.2M) ch_PP-OCRv3_xx 移动端&服务器端 推理模型 / 训练模型 推理模型 / 训练模型 推理模型 / 训练模型 英文超轻量PP-OCRv3模型(13.4M) en_PP-OCRv3_xx 移动端&服务器端 推理模型 / 训练模型 推理模型 / 训练模型 推理模型 / 训练模型 超轻量OCR系列更多模型下载(包括多语言),可以参考PP-OCR系列模型下载,文档分析相关模型参考PP-Structure系列模型下载 PaddleOCR场景应用模型 行业 类别 亮点 文档说明 模型下载 制造 数码管识别 数码管数据合成、漏识别调优 光功率计数码管字符识别 下载链接 金融 通用表单识别 多模态通用表单结构化提取 多模态表单识别 下载链接 交通 车牌识别 多角度图像处理、轻量模型、端侧部署 轻量级车牌识别 下载链接 更多制造、金融、交通行业的主要OCR垂类应用模型(如电表、液晶屏、高精度SVTR模型等),可参考场景应用模型下载

📖 文档教程 运行环境准备 PP-OCR文本检测识别🔥 快速开始 模型库 模型训练 文本检测 文本识别 文本方向分类器 模型压缩 模型量化 模型裁剪 知识蒸馏 推理部署 基于Python预测引擎推理 基于C++预测引擎推理 服务化部署 端侧部署 Paddle2ONNX模型转化与预测 云上飞桨部署工具 Benchmark PP-Structure文档分析🔥 快速开始 模型库 模型训练 版面分析 表格识别 关键信息提取 推理部署 基于Python预测引擎推理 基于C++预测引擎推理 服务化部署 前沿算法与模型🚀 文本检测算法 文本识别算法 端到端OCR算法 表格识别算法 关键信息抽取算法 使用PaddleOCR架构添加新算法 场景应用 数据标注与合成 半自动标注工具PPOCRLabel 数据合成工具Style-Text 其它数据标注工具 其它数据合成工具 数据集 通用中英文OCR数据集 手写中文OCR数据集 垂类多语言OCR数据集 版面分析数据集 表格识别数据集 关键信息提取数据集 代码组织结构 效果展示 《动手学OCR》电子书📚 开源社区 FAQ 通用问题 PaddleOCR实战问题 参考文献 许可证书

👀 效果展示 more PP-OCRv3 中文模型 PP-OCRv3 英文模型 PP-OCRv3 多语言模型 PP-Structure 文档分析 版面分析+表格识别 SER(语义实体识别) RE(关系提取)

许可证书

本项目的发布受Apache 2.0 license许可认证。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3