GitHub

2024-07-05 00:44| 来源: 网络整理| 查看: 265

混合报销票据识别

识别文件类型：图片，pdf，ofd, 0,90,180,270四种度数。识别类型：增值税专用发票, 增值税普通发票, 增值税电子专用发票, 增值税电子普通发票, 增值税普通发票（卷式）, 过路费发票, 火车票, 飞机票, 客运票, 出租车票, 定额, 通用机打发票

环境 python3.5/3.6 依赖项安装：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple 有GPU环境的可修改安装requirements.txt对应版本的tensorflow-gpu，config.py文件中控制GPU的开关模型架构 YOLOv5 + CRNN + CTC 模型模型下载地址：链接：链接：https://pan.baidu.com/s/1E_OE9HOjjFh6GZdPWQVbMg 提取码：voqi 将下载完毕的模型文件夹models放置于项目根目录下服务启动控制台 python manage.py runserver 127.0.0.1:8080 端口可自行修改服务调用地址：http://...: [端口号]/detection_images,http://127.0.0.1:8080/detection，例：http://127.0.0.1:8080/detection_images 测试demo 测试工具：postman，可自行下载安装 4张增值税发票混拍

Image text

代码执行过程说明使用django命令启动首先对图片做处理,可以接收的参数为图片文件，图片base64编码，图片下载地址图片中发票定位,并把识别结果放到list 判断对应的发票类型进一步识别发票具体部位。识别到关键部位通过crnn识别具体信息电子发票特别优化，可以识别pdf和ofd 后期开发计划增值税发票只识别了五要素，后续打算结合发票查验直接获取全票面其他发票都只识别了几个部位，后期有空完善 crnn使用了chineseocr项目自带的，正在做，工作量太大有空更新参考

chineseocr https://github.com/chineseocr/chineseocr

##总结新手做着玩，代码写的很乱。

【本文地址】

GitHub

GitHub

今日新闻

推荐新闻