风格迁移中直方图匹配(Histogram Match)的作用

您所在的位置：网站首页 › 什么是直方图匹配 › 风格迁移中直方图匹配(Histogram Match)的作用

风格迁移中直方图匹配(Histogram Match)的作用

2024-07-10 07:25| 来源: 网络整理| 查看: 265

前言

风格迁移是神经网络深度学习中比较重要且有趣的一个项目。如果不知道什么是风格迁移的请参考这篇文章：https://cloud.tencent.com/developer/article/1149991。

本文参考论文:Stable and Controllable Neural Texture Synthesis and Style Transfer Using Histogram Losses

正文gram matrix

风格迁移(Style Transfer)中我们使用了很多损失函数，最主要的损失函数是在内容层的L2损失以及在风格层的Gram(格拉姆矩阵)损失，Gram损失即利用原图和目标的gram矩阵进行比较得到的损失。Gram矩阵即是简单的一个数据（比如一张图片）中内部元素相乘的矩阵乘法，获取该数据的内在特征，原因很简单，一个数据的内在特征两两相乘后，特殊的特征（元素值比较大）会更大，而元素值比较小的特征在两两相乘后也会变小，所以这个矩阵得到的效果即是，放大数据的特征，得到该数据的纹理细节，从而方便比较：

上面是Gram Matrix(格拉姆矩阵),但是gram是不稳定的，在实际过程中需要人工进行调参才可以得到不错的结果：

如上图，a图为输入图像，b图为通过输入图像a经过gram矩阵仿制出来的，很明显这个gram矩阵很不稳定，导致图片纹理模糊不清楚，而c图则是在经过调参后得到的不错的效果图，但是仍然可以从其中看到一些模糊和细节丢失的痕迹。

为什么会gram矩阵会出现这些问题，原因在于gram矩阵在读取对象本身的特征同时对这个对象本身的分布并不“感冒”。

举个例子，上面的两幅图中，左边的图的分布比较均匀，可以得到该分布的均值是0.707、而方差是0。而右图的均值是1/2，方差也是1/2，这两张图我们可以当做风格迁移中某一个特征图中的一个层，代表了不同对象的特征信息。为什么要说这两张图，因为在对对这两个不同的图进行计算后，发现，这两张图的gram矩阵的值是一样的！

这两张图的gram matrix信息竟然一样，在本文参考的论文中有一些公式论证，这里直接说结论：我们可以在保持gram matrix矩阵值不变的情况下，改变这两张图的分布的方差，这也就是为什么gram matrix矩阵不稳定的原因。

Histogram Loss

这时就需要Histogram Loss来实现更好的texture transfer-风格迁移。

为什么用Histogram，之前我们说过gram loss不稳定是因为其对所提取对象的分部信息“不感冒”，所以我们利用Histogram来进行修改，因为直方图代表的信息就是分布。

这篇文章主要说直方图匹配，另外还有一篇文章是说直方图损失，可以与这篇文章进行相互补充：传送门。

利用直方图提取对象分布信息再结合gram来实现风格的迁移。听起来挺酷，但是实现起来就需要稍微换一个方向。

我们利用这个公式：

其中

是一个风格的激活层，而

则是经过直方图匹配后的激活层，

则是权重参数，我们定义这个

为histogram损失，在风格迁移中就可以结合gram损失一块使用。

即 ==>

直方图匹配和直方图均衡这两个概念应该都比较熟悉，在数字图像处理中是比较常见的算法，opencv就有直方图均衡的算法。

python代码的直方图匹配代码

这里给出通过python实现的直方图匹配算法与pytorch一块使用，输入为tensor型变量，patch为直方图bin分割数，stride为移动步数。

输出为input相对target的匹配。corresponding为相关参数。

该代码参考其cuda代码实现：https://github.com/luanfujun/deep-painterly-harmonization/blob/master/cuda_utils.cu

代码语言：javascript复制def histogram_match(input, target, patch, stride): n1, c1, h1, w1 = input.size() n2, c2, h2, w2 = target.size() input.resize_(h1 * w1 * h2 * w2) target.resize_(h2 * w2 * h2 * w2) conv = torch.tensor((), dtype=torch.float32) conv = conv.new_zeros((h1 * w1, h2 * w2)) conv.resize_(h1 * w1*h2 * w2) assert c1 == c2, 'input:c{} is not equal to target:c{}'.format(c1, c2) size1 = h1 * w1 size2 = h2 * w2 N = h1 * w1 * h2 * w2 print('N is', N) for i in range(0, N): i1 = i / size2 i2 = i % size2 x1 = i1 % w1 y1 = i1 / w1 x2 = i2 % w2 y2 = i2 / w2 kernal_radius = int((patch - 1) / 2) conv_result = 0 norm1 = 0 norm2 = 0 dy = -kernal_radius dx = -kernal_radius while dy

【本文地址】

风格迁移中直方图匹配(Histogram Match)的作用

风格迁移中直方图匹配(Histogram Match)的作用

今日新闻

推荐新闻