自训练数据集打标签注意事项及使用工具推荐 |
您所在的位置:网站首页 › 打标是做什么的 › 自训练数据集打标签注意事项及使用工具推荐 |
盘点自训练数据集如何打标签! 一、打标签规则 二、推荐工具 使用心得 前言分享我在训练自己的数据集前期所碰到的一些问题,希望大家能及时避雷! 一、打标签规则由于我使用YOLOv5模型,查询官方建议以及网上各路大神总结的经验打标签规则我总结了如下几点: 1、标签一一对应,每个数据集的标签标号要一致不然会混淆(例如person:0;clothes:5;要保证训练集中的标签标号都是一致的)。 2、贴边规则 :标注框需紧贴目标物体的边缘进行画框标注,不可框小或框大。 3、目标被遮挡也要标注,小目标也要标注,人眼可分辨的都需要标注。 4、人眼难以分辨的不要标。 5、重叠规则:当两个目标物体有重叠的时候,只要不是遮挡超过一半的就可以框的(遮挡范围需要根据算法识别情况制定),允许两个框有重叠的部分。如果其中一个物体挡住另一个物体一部分,框的时候就需要对另一个物体的形状进行脑补完整然后框起来即可。 6、独立规则:每一个目标物体均需要单独标框,比如:图中有三瓶水不能只标一个框,而是要将三个目标分别标框。 7、不框规则:图像模糊不清的不框,太暗和曝光过度的不框,不符合项目特殊规则的不框。 8、边界检查:确保框坐标不在图像边界上,防止载入数据或者数据扩展过程出现越界报错。 9、小目标规则:不同的算法对小目标的检测效果不同,对于小目标只要人眼能分清,都应该标出来。根据算法的需求,去决定是否启用这些样本参与训练。 10、小于10X10或者20X20像素的目标不方便标记可以忽略。 11、对与边界模糊、连片处理,标为一个样本框。 12、对于模糊、遮挡、有拖影的样本 最好单独建立样本库,有选择的启用。 13、宽高比 极端不是好样本。 二、推荐工具 1.labelimg主页面 由于我的工作量很大,对此我比较喜欢makesense.ai在线标注网站,主要是方便。 2.makesense.ai网址:https://www.makesense.ai/ S1 :主页面点击右下角的Get Started进入 S4:打标签
S6:在原有标注基础上继续打标签(导入已有的标签文件以及 labels.txt 文本文档) labelimg没啥风险,即使不小心退出了,但是它有实时保存的功能,不担心因为没有及时保存而白干!! 虽然makesense有点风险,可能会白干,但是我个人还是喜欢makesense的,只要做好分批次打标注,及时导出数据,一般很少出现卡顿情况,我出现的那次可能是电脑太老了??? 强烈建议大家都尝试后再做选择!! 第一次写文分享,不当之处请大家及时指出,若有什么使用建议可以给我留言! ❤笔芯 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |