图像识别项目算法测试 |
您所在的位置:网站首页 › 以图搜图技术原理 › 图像识别项目算法测试 |
一、前言
之前有一段时间在负责以图搜图项目的测试工作,接到这个项目的时候 有点懵,不知道从何开始,咨询了公司同一条业务线的大佬们,都没有接过这种算法项目,没办法,只能赶鸭子上架,自行百度查找各种AI算法相关的测试知识,所以想记录一下整个项目过程,以及通过这个项目学习到的一些算法相关的皮毛知识 ,整篇属于比较理论。
二、需求分析过程
1、了解需求
整个需求分析过程,总的来说,一头雾水,没有需求文档,以口相授,即是以图搜图,类似百度识图,可以搜索出相似的图片,所以我百度了下以图搜图的概念。
“以图搜图”正式的名称应该叫“相似图像搜索引擎”,也称为“反向图片搜索引擎”。最初的图像搜索引擎是基于文本关键字检索的,比如图像的文件名和路径名、图像周围的文本,以及Alt标签中的注释索引,然而有时图像周边的这些文本信息和图像并没有关系,会造成搜索出来的部分图像结果和查询关键词并不一致,所以为了提高准确率,同时也随着人工智能(特别是深度学习理论和技术)的发展,诸多主流图像搜索引擎纷纷引入了深度学习算法来提高图像搜索的准确率,像日常使用的百度、搜狗等通用搜索引擎均提供了相似图像检索功能,淘宝、京东等电商平台也利用自己庞大的商品图像库开发了垂直领域内的图像检索功能来满足消费者们不易用文字描述的商品搜索需求。
而我所要负责的项目,即是类似淘宝的图像检索,主要用于搜索衣服的布料图片,算是有自己的布料商品图像库吧。
2、算法是如何实现的
整个模型预测流程是怎么样的?数据是如何处理的?用的是什么算法?下面贴2张网上的算法内容图
![]() 图1:机器学习
图2:深度学习 以图搜图的关键技术叫做“感知哈希算法”,这是一个很简单且快速的算法,其原理在于针对每一张图片都生成一个特定的“指纹”,然后采取一种相似度的度量方式得出两张图片的近似程度。图3是图像搜索引擎架构图,用于生成特征索引库的图像数据集,尽量扩充用于构建特征索引库的数据集的规模和覆盖面,使其有一定的广度和深度,收集一定量的垂直领域数据集来微调模型,使提取的特征更加符合该领域的特点。![]()
图3:图像搜索引擎架构 3、测试人员需要给出的评价指标 领导灵魂拷问"如何判断搜出来的数据是准确的?",“有没有什么指标可以衡量?”,个人比较肤浅地认为,能搜出相似图片即可(比较主观) 三、测试流程 前面粗略了解完需求后,算法工程师需要测试去配合他们优化新开发的“图像搜索引擎”,如图4是大致的测试流程。然而针对流程中的几个环节,又开始着手准备进入扫盲阶段了。 ![]()
图4:图像搜索引擎优化流程 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |