PaddleOCR: 基于飞桨的OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

您所在的位置：网站首页 › 英文文字识别app › PaddleOCR: 基于飞桨的OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

PaddleOCR: 基于飞桨的OCR工具库，包含总模型仅8.6M的超轻量级中文OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

2023-10-05 13:10| 来源: 网络整理| 查看: 265

简介

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力开发者训练出更好的模型，并应用落地。

📣 近期更新

🔥2023.3.10 PaddleOCR集成了高性能、全场景模型部署方案FastDeploy，欢迎参考指南试用（注意使用dygraph分支）。

📚2022.12 发布《OCR产业范例20讲》电子书，新增蒙古文、身份证、液晶屏缺陷等7个场景应用范例

🔨2022.11 新增实现4种前沿算法：文本检测 DRRG, 文本识别 RFL, 文本超分Text Telescope，公式识别CAN

2022.10 优化JS版PP-OCRv3模型：模型大小仅4.3M，预测速度提升8倍，配套web demo开箱即用

💥 直播回放：PaddleOCR研发团队详解PP-StructureV2优化策略。微信扫描下方二维码，关注公众号并填写问卷后进入官方交流群，获取直播回放链接与20G重磅OCR学习大礼包（内含PDF转Word应用程序、10种垂类模型、《动手学OCR》电子书等）

🔥2022.8.24 发布 PaddleOCR release/2.6

发布PP-StructureV2，系统功能性能全面升级，适配中文场景，新增支持版面复原，支持一行命令完成PDF转Word；版面分析模型优化：模型存储减少95%，速度提升11倍，平均CPU耗时仅需41ms；表格识别模型优化：设计3大优化策略，预测耗时不变情况下，模型精度提升6%；关键信息抽取模型优化：设计视觉无关模型结构，语义实体识别精度提升2.8%，关系抽取精度提升9.1%。

2022.8 发布 OCR场景应用集合：包含数码管、液晶屏、车牌、高精度SVTR模型、手写体识别等9个垂类模型，覆盖通用，制造、金融、交通行业的主要OCR垂类应用。

2022.8 新增实现8种前沿算法

文本检测：FCENet, DB++ 文本识别：ViTSTR, ABINet, VisionLAN, SPIN, RobustScanner 表格识别：TableMaster

2022.5.9 发布 PaddleOCR release/2.5

发布PP-OCRv3，速度可比情况下，中文场景效果相比于PP-OCRv2再提升5%，英文场景提升11%，80语种多语言模型平均识别准确率提升5%以上；发布半自动标注工具PPOCRLabelv2：新增表格文字图像、图像关键信息抽取任务和不规则文字图像的标注功能；发布OCR产业落地工具集：打通22种训练部署软硬件环境与方式，覆盖企业90%的训练部署环境需求；发布交互式OCR开源电子书《动手学OCR》，覆盖OCR全栈技术的前沿理论与代码实践，并配套教学视频。

🌟 特性

支持多种OCR相关前沿算法，在此基础上打造产业级特色模型PP-OCR和PP-Structure，并打通数据生产、模型训练、压缩、预测部署全流程。

上述内容的使用方法建议从文档教程中的快速开始体验

⚡ 快速开始在线网站体验：超轻量PP-OCR mobile模型体验地址：https://www.paddlepaddle.org.cn/hub/scene/ocr 移动端demo体验：安装包DEMO下载地址(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统) 一行命令快速使用：快速开始（中英文/多语言/文档分析）

📚《动手学OCR》电子书《动手学OCR》电子书

👫 开源社区 📑项目合作：如果您是企业开发者且有明确的OCR垂类应用需求，填写问卷后可免费与官方团队展开不同层次的合作。 👫加入社区：微信扫描二维码并填写问卷之后，加入交流群领取20G重磅OCR学习大礼包包括《动手学OCR》电子书，配套讲解视频和notebook项目；PaddleOCR历次发版直播课回放链接； OCR场景应用模型集合：包含数码管、液晶屏、车牌、高精度SVTR模型、手写体识别等垂类模型，覆盖通用，制造、金融、交通行业的主要OCR垂类应用。 PDF2Word应用程序；OCR社区优秀开发者项目分享视频。 🏅️社区项目：社区项目文档中包含了社区用户使用PaddleOCR开发的各种工具、应用以及为PaddleOCR贡献的功能、优化的文档与代码等，是官方为社区开发者打造的荣誉墙，也是帮助优质项目宣传的广播站。 🎁社区常规赛：社区常规赛是面向OCR开发者的积分赛事，覆盖文档、代码、模型和应用四大类型，以季度为单位评选并发放奖励，赛题详情与报名方法可参考链接。

PaddleOCR官方交流群二维码

🛠️ PP-OCR系列模型列表（更新中）模型简介模型名称推荐场景检测模型方向分类器识别模型中英文超轻量PP-OCRv3模型（16.2M） ch_PP-OCRv3_xx 移动端&服务器端推理模型 / 训练模型推理模型 / 训练模型推理模型 / 训练模型英文超轻量PP-OCRv3模型（13.4M） en_PP-OCRv3_xx 移动端&服务器端推理模型 / 训练模型推理模型 / 训练模型推理模型 / 训练模型超轻量OCR系列更多模型下载（包括多语言），可以参考PP-OCR系列模型下载，文档分析相关模型参考PP-Structure系列模型下载 PaddleOCR场景应用模型行业类别亮点文档说明模型下载制造数码管识别数码管数据合成、漏识别调优光功率计数码管字符识别下载链接金融通用表单识别多模态通用表单结构化提取多模态表单识别下载链接交通车牌识别多角度图像处理、轻量模型、端侧部署轻量级车牌识别下载链接更多制造、金融、交通行业的主要OCR垂类应用模型（如电表、液晶屏、高精度SVTR模型等），可参考场景应用模型下载

📖 文档教程运行环境准备 PP-OCR文本检测识别🔥 快速开始模型库模型训练文本检测文本识别文本方向分类器模型压缩模型量化模型裁剪知识蒸馏推理部署基于Python预测引擎推理基于C++预测引擎推理服务化部署端侧部署 Paddle2ONNX模型转化与预测云上飞桨部署工具 Benchmark PP-Structure文档分析🔥 快速开始模型库模型训练版面分析表格识别关键信息提取推理部署基于Python预测引擎推理基于C++预测引擎推理服务化部署前沿算法与模型🚀 文本检测算法文本识别算法端到端OCR算法表格识别算法关键信息抽取算法使用PaddleOCR架构添加新算法场景应用数据标注与合成半自动标注工具PPOCRLabel 数据合成工具Style-Text 其它数据标注工具其它数据合成工具数据集通用中英文OCR数据集手写中文OCR数据集垂类多语言OCR数据集版面分析数据集表格识别数据集关键信息提取数据集代码组织结构效果展示《动手学OCR》电子书📚 开源社区 FAQ 通用问题 PaddleOCR实战问题参考文献许可证书

👀 效果展示 more PP-OCRv3 中文模型