CIFAR

您所在的位置:网站首页 cifar-10数据集的导入 CIFAR

CIFAR

#CIFAR| 来源: 网络整理| 查看: 265

CIFAR-10数据集应用:快速入门数据增强方法Mixup,显著提升图像识别准确度 栏目:肉宠小说发布时间:2022-02-17人气:941 格物钛公开数据集提供海量优质公开数据集搜索、数据托管、一站式搜索,与全球 AI 开发者共创公开数据集社区。本文介绍的是以格物钛公开数据集平台中的 CIFAR-10 数据集为基础,通过数据增强方法 Mixup,显著提升图像识别准确度。

关于作者:Ta-Ying Cheng,牛津大学博士研究生,Medium 技术博主,多篇文章均被平台官方刊物 Towards Data Science 收录(翻译:颂贤)。

深度学习蓬勃发展的这几年来,图像分类一直是最为火热的领域之一。传统上的图像识别严重依赖像是扩张/侵蚀或者是频域变换这样的处理方法,但特征提取的困难性限制了这些方法的进步空间。现如今的神经网络则显著提高了图像识别的准确率,因为神经网络能够寻找输入图像和输出标签之间的关系,并以此不断地调整它的识别策略。然而,神经网络往往需要大量的数据进行训练,而优质的训练数据并不是唾手可得的。因此现在许多人都在研究如何能够实现所谓的数据增强(Data augmentation),即在一个已有的小数据集中凭空增加数据量,来达到以一敌百的效果。本文就将带大家认识一种简单而有效的数据增强策略 Mixup,并介绍直接在 PyTorch 中实现 Mixup 的方法。

1. 为什么需要数据增强?

神经网络架构内的参数是根据给定的数据进行训练和更新的。但由于训练数据只覆盖了某一部分可能数据的分布情况,网络很可能就会在分布的“能见”部分过度拟合。因此,我们拥有的训练数据越多,理论上就越能覆盖整个分布的情况(这也正是为什么以数据为中心的 AI(data-centric AI)非常重要)。当然,在数据量有限的情况下,我们也并不是没有办法。通过数据增强,我们就可以尝试通过微调原有数据的方式产生新数据,并将其作为“新”样本送入网络进行训练。

2. 什么是Mixup?

假设我们现在要做的事情是给猫和狗的图片做分类,并且我们已经有了一组标注好了是猫是狗的数据(例如[1, 0] -> 狗, [0, 1] -> 猫),那么 Mixup 简单来说就是将两张图像及其标签平均化为一个新数据。

具体而言,我们可以用数学公式写出 Mixup 的概念:

其中,和分别是混合(标签为)和(标签为)后的图像和标签,而 λ 则是从给定的贝塔分布中取得的随机数。由此,Mixup 能够为我们提供不同数据类别之间的连续数据样本,并因此直接扩大了给定训练集的分布,从而使网络在测试阶段更加强大。

Mixup的万用性

Mixup 其实只是一种数据增强方法,它和任何用于分类的网络架构都是正交的。也就是说,我们可以在任何要进行分类任务的网络中对相应的数据集使用 Mixup 方法。Mixup 的提出者张宏毅等人基于其最初发表的论文《mixup: Beyond Empirical Risk Minimization》对多个数据集和架构进行了实验,发现了 Mixup 在神经网络之外的应用中也能体现其强大能力。

3. 计算环境

我们将通过 PyTorch(包括 torchvision)来构建整个程序。Mixup 需要的从 beta 分布中生成的样本,我们可以从 NumPy 库中获得。我们还将使用 random 来为 Mixup 寻找随机图像。下面的代码能够导入我们需要的所有库:

""" Import necessary libraries to train a network using mixup The code is mainly developed using the PyTorch library """ import numpy as np import pickle import random import torch import torch.nn as nn import torch.nn.functional as F import torchvision import torchvision.transforms as transforms from torch.utils.data import Dataset, DataLoader TAG: 优质rb攻略系统70 上一篇:打开手机稳定器全平台跟拍新视界,浩瀚卓越专注用户式创新 下一篇:千讯基因引入最先进的多功能测序仪 “CIFAR-10数据集应用:快速入门数据增强方法Mixup,显著提升图像识别准确度” 相关信息: 单/多商城分销系统具备哪些优势?

经济在发展,时代在变化,生活节奏也越来越快人们的购物方式逐渐发生了变化,网上购物已经和我们日常生活密不可分,作为商家想加...[详情]

2021年08月06日点击:1087 听说英语70+很难?高分攻略了解一下!

本文预计阅读 6 分钟星标/置顶 小白的考生都考上了今天周三,按照规划要给大家讲解英语复习干货啦。昨天也收到了不少小小...[详情]

2021年08月06日点击:1018 这是优质鱼类蛋白的主要生产模式,做好循环水养殖,应该懂得这些!

在这一篇中,我们将讨论的是建设一个循环水养殖车间之后的注意事项。Andrew Leingang在本篇涵盖的关键要素包括物...[详情]

2021年08月06日点击:1105 腺样体肥大 | 辗转四家医院,宝宝腺样体堵塞鼻腔70%,最后治愈的方法原来这么简单

本文旨在通过讲述我家宝贝腺样体堵塞鼻腔70%,导致晚上睡觉呼吸不畅,一个多月间辗转四家医院进行治疗,最后治愈的故事,帮助...[详情]

2021年08月06日点击:1228 HPV二价,四价,九价疫苗攻略!

我自己选择的是九价疫苗 做了N的攻略才决定选择九价疫苗,刚开始是想打二价疫苗的二价疫苗含有HPV16与18二中抗原《...[详情]

2022年02月17日点击:967 【转】克苏鲁跑团\COC TRPG 不完全入门手册

引言COC跑团在近几年已经渐渐地从一个小众圈子逐渐走向了更多人的视野。故事往往开始于幽幽密林中的古宅,封闭怪异的小镇,作...[详情]

2022年02月17日点击:929 【坎公骑冠剑】70级水属性魔镜裂痕副本超详细打法攻略

文丨一个毛球球@bigfun社区原文地址:70级水属性魔镜裂痕副本超详细打法攻略 - bigfun各位骑士大家好相信现在...[详情]

2022年02月17日点击:932 币圈撸羊毛:优质区块链空投糖果分享(2018-08-23)

今天看了一圈实在没有什么好糖果值得推荐,再抽点时间着重介绍一下近期的热点火牛视频、HAHA视频以及争议不断的KAA直播吧...[详情]

2022年02月17日点击:939 6款优秀开源量化策略框架!那款适合你??

一个策略从想法,到测试,在到实盘,然后改进,进入另一个循环,需要很多的时间和精力。这时候选择一款高效、灵活的测试系统就是...[详情]

2022年02月17日点击:928 小米专属的优秀应用 你同样可以拥有~

应该是在小米8发布会时雷总还介绍了一款叫做小米白噪音的系统应用当时小火了一把之后也注意到MIUI的其他一些优秀系统应用而...[详情]

2022年02月17日点击:933


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3