图像数据集分布的理解 |
您所在的位置:网站首页 › 数据分布特征描述 › 图像数据集分布的理解 |
图像数据分布在深度学习,计算机视觉中经常会看到,并且会有这么一句话:“要求测试集和训练集的的数据分布是相同的”。那么数据集分布到底是什么?是如何进行分布的呢?如果说两个图像服从同一分布,到底是什么意思呢? 首先我们需要先了解到一张图片可以通过其像素值表示出来,例如一张256*256的灰度图可以通过65536维的向量,每个维度值的范围是0-255,来表示出来。 想象一下,如果这个向量服从均匀分布的话,他会是什么样子呢。如果我们将这样一种随机采样得到的向量解释为图像的话,我们看到一张人脸的可能性极其渺茫,实际上能看到的是一张充满噪声的图像。 为什么你知道看到的不是一张人脸呢?因为你知道一张脸不是由均匀分布的像素组成,而是有另外的一种分布。 因此,两个图像服从同一分布,其实就是将它们转化为向量后,该向量服从某一种分布。直觉上你自然知道mnist和mnist-m分布不同,但是其内部图像服从同一分布。 对于样本空间的分布我们以二维空间为例,我们认为该样本空间的分布就是随机变量X和Y的联合概率分布。而X和Y呢,分别代表二维空间的维度,X和Y代表所有数据的第一维度和第二维度。 因此,对于高维空间来说,我们认为是所有维度的联合概率分布,就是该样本空间或者说是数据集的分布情况了。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |