AI初探

您所在的位置:网站首页 阿里ai人工智能平台 AI初探

AI初探

2023-08-26 05:46| 来源: 网络整理| 查看: 265

最近有个小程序的项目,要求使用OCR对名片及车辆的照片进行智能识别。该文会将BAT AI平台OCR功能试用的情况进行详细说明。OCR测试源码已共享,具体参见文末。

AI初探——百度、阿里、腾讯开放平台OCR功能解析

网站初览 百度

百度AI平台也叫做百度大脑,分为开放能力、开发平台、行业应用、生态合作、AI市场、开发与教学等栏目。

百度在开发平台上较有特色:比如命名为飞桨的开源深度学习平台等

AI初探——百度、阿里、腾讯开放平台OCR功能解析

百度开源深度学习平台

2、阿里

阿里的AI服务与阿里云深度集成:主要有文字、大数据、图影像、视觉、三维场景、机器学习、及各种行业场景的AI解决方案。比如阿里云AI助力新冠新药的研发。

AI初探——百度、阿里、腾讯开放平台OCR功能解析

云计算

3、腾讯

腾讯AI开放平台主要分为技术引擎、解决方案、AI加速器、AI资讯、AI在腾讯、文档中心等 。

腾讯AI平台的特点是三大实验室:Ai Lab致力于人工智能;优图致力于识别技术;微信AI致力于微信生态链的人工智能技术。

AI初探——百度、阿里、腾讯开放平台OCR功能解析

三大实验室

OCR功能初探

初步了解了BAT AI平台的情况后,接下来回到文章的主题,通过名片识别与车牌识别对三大平台OCR情况作逐一说明:

1、注册及开通

在BAT平台上使用AI开放能力都需要先进行注册,注册后可进入控制台开通对应的API接入。

调用OCR

考虑在windows桌面平台上进行测试调用,OCR调用客户端源码为C#,通过平台提供的Web Api接入方式进行Web调用及测试:具体可参见源码。首先看一下三大平台调用的效果情况:为保证测试的公平性,特地在平台页面下载了例图(百度和腾讯AI的名片图片与车牌图片,阿里云网站未找到例图)

AI初探——百度、阿里、腾讯开放平台OCR功能解析

名片例图1识别情况(百度AI网站下载 --名片测试.jpg,例图较模糊):

AI初探——百度、阿里、腾讯开放平台OCR功能解析

百度识别结果:”姓名“,”地址“能识别,电话号码识别错误,”公司“、”手机“、”邮箱“、”网址“,”部门“等未识别出

AI初探——百度、阿里、腾讯开放平台OCR功能解析

阿里识别结果: ”公司“,”地址“,”邮箱“,”部门“,”网址“,”姓名“,”移动电话“能识别,”工作电话"未识别

AI初探——百度、阿里、腾讯开放平台OCR功能解析

腾讯识别结果:几乎都识别出来了(“手机”将186误识为166),识别的“电话”也能带格式。

AI初探——百度、阿里、腾讯开放平台OCR功能解析

名片例图2识别情况(腾讯AI网站下载 --名片测试.jpg,例图较清晰):

AI初探——百度、阿里、腾讯开放平台OCR功能解析

百度识别结果:能识别。

AI初探——百度、阿里、腾讯开放平台OCR功能解析

阿里识别结果:能识别。

AI初探——百度、阿里、腾讯开放平台OCR功能解析

腾讯识别结果:能识别“QQ”、“微信”。

AI初探——百度、阿里、腾讯开放平台OCR功能解析

车牌例图1识别情况(百度AI网站下载 --车牌测试.jpg,车牌较近):

AI初探——百度、阿里、腾讯开放平台OCR功能解析

百度识别结果:能识别蓝牌与车牌号

AI初探——百度、阿里、腾讯开放平台OCR功能解析

阿里识别结果:能识别车辆类型与车牌号

AI初探——百度、阿里、腾讯开放平台OCR功能解析

腾讯识别结果:能识别车牌号

AI初探——百度、阿里、腾讯开放平台OCR功能解析

车牌例图2识别情况( 腾讯AI网站下载 --车牌测试.jpg,车牌较小):

AI初探——百度、阿里、腾讯开放平台OCR功能解析

百度识别结果:

AI初探——百度、阿里、腾讯开放平台OCR功能解析

阿里识别结果:

AI初探——百度、阿里、腾讯开放平台OCR功能解析

腾讯识别结果:

AI初探——百度、阿里、腾讯开放平台OCR功能解析

以上测试受限于电脑环境、网络情况等,仅做参考,无排名之分。

接入代码解析 百度: HTTP 方法: POST 请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/license_plate URL参数:ccess_token (通过API Key和Secret Key获取的access_token) Header如下: Content-Type application/x-www-form-urlencoded Body请求参数 image : 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式

AI初探——百度、阿里、腾讯开放平台OCR功能解析

百度OCR调用源码截图

阿里: 车牌调用地址:http(s)://ocrcp.market.alicloudapi.com/rest/160601/ocr/ocr_vehicle_plate.json 请求方式:POST 返回类型:JSON 请求参数(Body): { "image": "图片二进制数据的base64编码或者图片url" #图片以base64编码的string }

AI初探——百度、阿里、腾讯开放平台OCR功能解析

阿里OCR调用源码截图

腾讯 传输方式 HTTPS 请求方法 POST 字符编码 统一采用UTF-8编码 响应格式 统一采用JSON格式 请求参数: app_id 应用标识(AppId) time_stamp 请求时间戳(秒级) nonce_str 随机字符串 sign 签名信息,详见接口鉴权 image 原始图片的base64编码数据(原图大小上限1MB,支持JPG、PNG、BMP格式)

AI初探——百度、阿里、腾讯开放平台OCR功能解析

该文对应的源码下载可参见 :https://github.com/zhuhuix/AITest

特别声明:该文为原创。(如有任何疑问可留言)



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3