动漫界的ImageNet来了!人脸数据集AnimeCeleb,240万张图片生成「萌萌哒」动漫脸...

您所在的位置:网站首页 卡通人脸画像图片女生 动漫界的ImageNet来了!人脸数据集AnimeCeleb,240万张图片生成「萌萌哒」动漫脸...

动漫界的ImageNet来了!人脸数据集AnimeCeleb,240万张图片生成「萌萌哒」动漫脸...

2024-06-30 08:51| 来源: 网络整理| 查看: 265

转自:新智元

想看看全球首富马斯克变成二次元的样子吗?

当当当当!

0a0ec095a53b9f4e7eb1becdaf4e44a0.png

图片来源:https://huggingface.co/spaces/akhaliq/AnimeGANv2

怎么还有一丝妩媚呢?

近日,在huggingface社区上,最强动漫风格迁移模型AnimeGAN的迭代版AnimeGANv2上线了一个体验demo出来。

多年来,动漫角色与人类同行,扮演着挚爱的朋友,在日常生活中给很多人以情感安慰。

随着他们的流行,动漫角色已经不局限于娱乐行业或营销领域,计算机视觉和图形学的最新进展进一步加速了角色的广泛传播,为个人创作者轻松设计自己的角色并在公共在线平台上展示他们的作品铺平了道路。

其中,动漫角色设计和深度学习相结合的作品也越来越多。

不过,虽然基于深度学习的人脸生成GAN取得了显著的成功,但这些模型仍然局限于真实人脸的领域。

而由于缺乏动漫风的人脸数据集,动漫人脸生成领域的工作目前还不够深入。

大规模的动漫人脸数据集

韩国科学技术院最近的一项研究提出了一个大规模的动漫人脸数据集AnimeCeleb,以促进动漫人脸领域的研究。

900a778954dc0cafcd8488cb1de7f5a6.png

https://arxiv.org/pdf/2111.07640.pdf

为了简化动漫人脸数据集的生成过程,他们通过可控的合成动漫模型,基于一个开放的三维软件和一个注释系统构建了一个半自动管道,可以构建大规模动漫人脸数据集,包括具有丰富注释的多姿态和多风格动漫人脸。

7b0f64e9661fc5f45f75a47b99af0048.png

AnimeCeleb的随机抽样例子

并且实验表明,该数据集适用于各种与动漫相关的任务,例如头部重现和着色。

与公开的现有动漫人脸数据集相比,AnimeCeleb内含240万张图片,全部依赖于3D模型渲染来构建动漫人脸数据集。

这确保了大规模数据集包含详细的注释以及具有相同身份的多姿态图像。此外,考虑到不同的绘画方式,动漫还包含多种风格。

c3a29f6754e62c29ab64577ad8e9766e.png

这简直就是动漫人脸数据集的ImageNet呀!

如何制作?

那这样庞大的动漫人脸数据集是如何制作出来的呢?

第一步,数据收集(A.1)。在过滤掉不合适的外观动漫模型后,总共获得了3613个可用的三维动漫模型。

f753666dcc477d41b7de67530d66ab78.png

数据集生成管道概述

第二步,3D动漫模型描述(A.2)。收集的3D动漫模型不仅包含动漫角色的完整身体信息,如3D网格、骨骼和纹理组件,还包含可以改变3D模型外观的变形量。

为每个变形量指定一个标量值,我们可以改变3D模型的相关属性(例如,张开/闭上嘴,张开/闭上眼睛)。

b08664b2bd67e148da72b52bd73a98c8.png

目标变形的可视化示例(前四列)和三维头部旋转(最后一列)

第三步,图像渲染(B)。为了从3D动漫模型中自动采样动漫人脸图像的过程,他们新开发了一个2D人脸图像生成系统,该系统建立在支持3D模型可视化、操作和渲染的开源3D计算机图形软件Blender上。

第四步,语义标注(C)。语义标注步骤的目标是识别面部表情相关的形态,并根据语义准确和统一的命名约定对形态进行标注。重要的是,这使我们能够在对面部表情相关的变形进行采样时,对所有3D动漫模型应用一致的姿势采样策略。

最后一步,数据采样(D)。对于采样,随机采样人脸的每个部分(即眼睛、眉毛和嘴)的目标变形被应用于三维动漫模型。通过从均匀分布[0,1]中独立采样来确定形变的幅度。

6d48542130e560f73a5b961228c0f57b.png

采样数据示例

实验结果

在任务选择过程中,研究人员重点展示了对动漫相关任务的适用性和动漫跨身份头像重现结果。

头像重现任务旨在将动漫风格从风格驱动图像转移到源图像,同时保留源身份。由于AnimeCeleb属性包含多个相同身份的图像,他们实现了两个代表性的基线:FOMM和PIRenderer。

611870aad66bc4273778a372bcdf533b.png

头像重现的定量结果。显然,在AnimeCeleb上训练优于在VoxCeleb上训练。

结果显而易见,在AnimeCeleb测试集上测试时,在AnimeCeleb上训练的模型优于在VoxCeleb上训练的基线模型。

域外(Out-of-Domain)动漫头像重现结果也非常棒。

2b976bd601808fe28b7eec8d0fcf971a.png

给定来自Waifu数据集的源图像(第1列)和来自AnimeCeleb的驱动图像(第2列),仅使用AnimeCeleb训练的FOMM和PIRenderer都成功地将驱动图像的风格转移到源图像。

研究人员还用AnimeCeleb训练模型去发现样本中语义一致的部分,比如:整体面部、头部和颌骨等等。

28784a852a33e48a9fb4d93cdfa46b85.png

动漫人脸语义分割结果,训练好的模型能够识别不同图像中的一致语义。

在动漫领域,自动着色是动漫创作者在劳动密集型绘画过程中减少工作量的重要任务。使用经过训练的彩色化模型,创作者能够获得给定草图图像的彩色化图像。

使用用AnimeCeleb训练的基线,可以绘制出良好的动漫角色草图图像,自动生成彩色化输出。

9f9efe2072f9c7e9ba129975257c21dd.png

通过参考域内和域外图像,用AnimeCeleb训练的Pix2Pix成功输出彩色图像。

在未来的工作中,AnimeCeleb还会进一步被扩展,以在多视图环境中提供更多样的面部表情。

参考资料:

https://arxiv.org/pdf/2111.07640.pdf https://twitter.com/ak92501/status/1460436967905280002

推荐阅读

【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!

一文总结微软研究院Transformer霸榜模型三部曲!

Swin Transformer为主干,清华等提出MoBY自监督学习方法,代码已开源

加性注意力机制!清华和MSRA提出Fastformer:又快又好的Transformer新变体!

MLP进军下游视觉任务!目标检测与分割领域最新MLP架构研究进展!

周志华教授:如何做研究与写论文?(附完整的PPT全文)

都2021 年了,AI大牛纷纷离职!各家大厂的 AI Lab 现状如何?

常用 Normalization 方法的总结与思考:BN、LN、IN、GN

注意力可以使MLP完全替代CNN吗? 未来有哪些研究方向?

欢迎大家加入DLer-计算机视觉&Transformer群!

大家好,这是计算机视觉&Transformer论文分享群里,群里会第一时间发布最新的Transformer前沿论文解读及交流分享会,主要设计方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、视频超分、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。

进群请备注:研究方向+学校/公司+昵称(如Transformer+上交+小明)

8a0d4e0b71578f8a2c67bcdf8d41fd0b.png

👆 长按识别,邀请您进群!



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3