介绍 - 《PaddleOCR 使用教程》

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

近期更新

特性

超轻量级中文OCR模型，总模型仅8.6M
- 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
- 检测模型DB（4.1M）+识别模型CRNN（4.5M）
实用通用中文OCR模型
多种预测推理部署方案，包括服务部署和端侧部署
多种文本识别训练算法，Rosetta、CRNN、STAR-Net、RARE、SRN
可运行于Linux、Windows、MacOS等多种系统

上图是超轻量级中文OCR模型效果展示，更多效果图请见效果展示页面。

超轻量级中文OCR在线体验地址：
移动端DEMO体验(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统)：安装包二维码获取地址

Android手机也可以扫描下面二维码安装体验。

介绍 - 图1

在ICDAR2015文本检测公开数据集上，算法效果如下：

模型	骨干网络	precision	recall	Hmean	下载链接
EAST	ResNet50_vd	88.18%	85.51%	86.82%
EAST	MobileNetV3	81.67%	79.83%	80.74%	下载链接
DB	ResNet50_vd	83.79%	80.65%	82.19%
DB	MobileNetV3	75.92%	73.18%	74.53%	下载链接
SAST	ResNet50_vd	92.18%	82.96%	87.33%

在Total-text文本检测公开数据集上，算法效果如下：

说明： SAST模型训练额外加入了icdar2013、icdar2017、COCO-Text、ArT等公开数据集进行调优。PaddleOCR用到的经过整理格式的英文公开数据集下载：百度云地址 (提取码: 2bpi)

使用街景数据集共3w张数据，训练中文检测模型的相关配置和预训练文件如下：

模型	骨干网络	配置文件	预训练模型
超轻量中文模型	MobileNetV3	det_mv3_db.yml	下载链接
通用中文OCR模型	ResNet50_vd	det_r50_vd_db.yml

注：上述DB模型的训练和评估，需设置后处理参数box_thresh=0.6，unclip_ratio=1.5，使用不同数据集、不同模型训练，可调整这两个参数进行优化

PaddleOCR文本检测算法的训练和使用请参考文档教程中模型训练/评估中的文本检测部分。

PaddleOCR开源的文本识别算法列表：

参考DTRB文字识别训练和评估流程，使用MJSynth和SynthText两个文字识别数据集训练，在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上进行评估，算法效果如下：

说明： SRN模型使用了数据扰动方法对上述提到对两个训练集进行增广，增广后的数据可以在上下载，提取码: y3ry。原始论文使用两阶段训练平均精度为89.74%，PaddleOCR中使用one-stage训练，平均精度为88.33%。两种预训练权重均在下载链接中。

模型	骨干网络	配置文件	预训练模型
超轻量中文模型	MobileNetV3	rec_chinese_lite_train.yml
通用中文OCR模型	Resnet34_vd	rec_chinese_common_train.yml	下载链接

PaddleOCR文本识别算法的训练和使用请参考文档教程中。

介绍 - 图2

请扫描下面二维码，完成问卷填写，获取加群二维码和OCR方向的炼丹秘籍

介绍 - 图3

本项目的发布受Apache 2.0 license许可认证。

我们非常欢迎你为PaddleOCR贡献代码，也十分感谢你的反馈。