VOC数据集 XML 和 txt标注文本的理解 |
您所在的位置:网站首页 › txt解析检测 › VOC数据集 XML 和 txt标注文本的理解 |
VOC数据集 XML 和 txt标注文本的理解 以VOC数据集中VOC2007中的000001.jpg图片为例,分析下其对应的Annotations文件夹下的000001.xml文件和labels文件夹下的000001.txt文件 整幅图片的尺寸为 宽353,高500. XML文件中:353*500 是这张000001.jpg图片的宽和高object狗在图片中左上角坐标为(48,240),右下角坐标为(195,371)object人在图片中左上角坐标为(8,12),右下角坐标为(352,498) 在voc.name文件中:object狗所在的ID为11; object人所在的ID为14; txt文件中: 类别一 11 0.341359773371 0.609 0.416430594901 0.262其中, 11是【 ID】:object狗, 0.341359773371 :【中心点X的比例标注】,353*0.341359773371 = 120.5 pixel, 约等于图像中的直接计算值:(195-48)/2 + 48 = 121.5 0.609 :【中心点Y的比例标注】 500*0.609=304.5, 约等于图像中的直接计算值: (371-240)/2 + 240 = 305.5 0.416430594901: 【BOX宽比例标注】(195-48)/353 = 0.4164 0.262: 【BOX高比例标注】(371-240)/500 = 0.262 类别二 14 0.507082152975 0.508 0.974504249292 0.97214是 【ID】:object人 后面四个数值代表的意义与计算方式同上,依次是 【中心点X的比例标注】 【中心点Y的比例标注】 【BOX宽比例标注】 【BOX高比例标注】 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |