[001]2021年版全球麦穗检测数据集发布

您所在的位置:网站首页 大麦麦穗图片 [001]2021年版全球麦穗检测数据集发布

[001]2021年版全球麦穗检测数据集发布

2024-02-01 05:10| 来源: 网络整理| 查看: 265

小麦(wheat)是全球的重要粮食作物,单位面积麦穗数量是产量潜力的重要组成部分。随着相机平台广泛普及(智能手机和无人机),田间图像获取的门槛逐渐降低,人工数麦穗数量的工作逐渐能被人工智能图像识别所替代。而训练一个适应各种复杂情况的深度学习模型需要大量的数据集,其必须包含多样的品种、种植密度、作物状态和生长期。研究也发现,提高数据集的质量往往比增加神经网络复杂度和深度要更有效,因此我们联合了中法美日澳等12个国家的研究人员,建立了高质量的全球麦穗检测数据集(Global Wheat Head Detection, GWHD),以用来作为衡量各类麦穗相关算法效果的基准。

图1:数据集中部分数据的展示

2020年版的数据集已经被13篇论文使用作为训练/测试集,并且基于此举办了Kaggle算法竞赛(https://www.kaggle.com/c/global-wheat-detection),但是在这个过程中发现了诸如标注噪声(labeling noise)和不均衡测试集(unbalanced test dataset)的问题,因此在2021年版中,我们又新增了5个国家16个机构共计逾27万个麦穗数据。在此次版本更新中,我们更新了子数据集的定义:在同一个试验区于相同的小麦生长阶段、使用相同获取方式(平台与传感器)得到的一组一致的图像。并依据此重新对之前的数据进行了子集的划分。新数据集的生长期分布如图2所示,整体上比较均衡。

图2:数据集小麦生长阶段的分布,x轴表示每个生长阶段的子数据集的数量

此外,我们也评估了新数据集的多样性,这边使用的是把使用ImageNet数据集预训练过的VGG网络的最后一层(14x14x512)去除重复后归一化成512维矢量,然后使用UMAP降维算法变成2维,然后使用X和Y把分布可视化出来(图3)。可以看出2021年新增加的数据(绿色部分)有效填补了2020年的空缺部分,有助于提高训练模型的耐操性鲁棒性(robustness)。

图3:使用UMAP降维算法得到的图像特征分布

但目前的数据集仍然缺少大部分发展中国家的数据(如南美、非洲和南亚),也开始尝试添加智能手机获取的俯视图(天底图,nadir),并且计划添加蒙版标注(mask)而非目前的框标注(bounding box)。

号外:今年的作物产量预测竞赛(Crop Yield Prediction Challenge)正在进行,欢迎大家踊跃报名(https://eval.ai/web/challenges/challenge-page/1251/overview),三等奖奖金都有1000美元哦( ⓛ ω ⓛ *)

2021年作物产量预测竞赛时间段参考资料

David, E., Serouart, M., Smith, D., Madec, S., Velumani, K., Liu, S., Wang, X., Espinosa, F.P., Shafiee, S., Tahir, I.S.A., Tsujimoto, H., Nasuda, S., Zheng, B., Kichgessner, N., Aasen, H., Hund, A., Sadhegi-Tehran, P., Nagasawa, K., Ishikawa, G., Dandrifosse, S., Carlier, A., Mercatoris, B., Kuroki, K., Wang, H., Ishii, M., Badhon, M.A., Pozniak, C., LeBauer, D.S., Lilimo, M., Poland, J., Chapman, S., de Solan, B., Baret, F., Stavness, I., Guo, W., 2021. Global Wheat Head Dataset 2021: more diversity to improve the benchmarking of wheat head localization methods. arXiv:2105.07660 [cs].

拓展阅读

1. 小麦的生长周期图示

Hyles, J., Bloomfield, M.T., Hunt, J.R. *et al.* Phenology and related traits for wheat adaptation. *Heredity* **125,** 417–430 (2020). https://doi.org/10.1038/s41437-020-0320-1

2. UMAP算法的原理解读

https://zhuanlan.zhihu.com/p/150788883

3. UMAP算法的Python工具包

https://zhuanlan.zhihu.com/p/109584077



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3