ChatGPT让3D猫娘有了灵魂!可实时语音互动,还能在虚拟场景中给你做饭玩猜谜

您所在的位置:网站首页 虚拟女友教程 ChatGPT让3D猫娘有了灵魂!可实时语音互动,还能在虚拟场景中给你做饭玩猜谜

ChatGPT让3D猫娘有了灵魂!可实时语音互动,还能在虚拟场景中给你做饭玩猜谜

2023-03-16 01:17| 来源: 网络整理| 查看: 265

关注“FightingCV”公众号

回复“AI”即可获得超100G人工智能的教程

点击进入→FightingCV交流群

将ChatGPT打造成猫娘风格的对话AI,已经是老司机的基操了。

但有没有想过,这只猫娘还能进一步从对话框里“跳”出来,能动、会做表情,还可以互动聊天?

这不,就在ChatGPT开放API后,视频博主@大谷Spitzer火速搞了个3D猫娘女友:

能互动玩猜谜游戏,表情像是在认真听题:

还能根据语音指令走到你身边,答应帮你“做饭”的那种:

值得一提的是,这里的猫娘3D模型只是个示例。

无论是语音模板还是模型,都可以根据个人喜好更改,说话的风格也可以调试~

属实是动动手实现AI对话自由了,一起来看看。

AI猫娘:ChatGPT灵魂+Azure声音

据大谷Spitzer介绍,合成这只3D猫娘用到了三个工具:

ChatGPT API是猫娘的“灵魂”,Unity游戏引擎用于合成互动场景和人物长相,至于微软Azure则用来将ChatGPT生成的文字转成语音。

其中,ChatGPT API负责进行角色扮演,与你快速进行各种交互。

你的聊天对话会通过语音输入实时转成文字,将文字输入ChatGPT中,再得到输出的结果:

至于ChatGPT的回答,则会通过Azure文本转语音,转变成“猫娘”发出的实时语音:

最后就是通过Unity游戏引擎自己捏一个专属的3D猫娘模型了,当然也可以直接购买别人做好的:

只需要在与ChatGPT聊天之前,给做好一系列设定,就能让它直接控制Unity里面的参数、表情和动画,让它在特定场景中与你实现交流不是问题~

事实上,不止是基于ChatGPT打造的猫娘,这些年用AI搞角色扮演的应用已经越来越多了。

AI角色扮演APP越来越多

目前,国内外都出现了不少角色扮演AI应用。

国内比较火的要属Glow了,在应用中用户可以根据喜好创建有背景设定、有特定性格的智能体。

其中,智能体的性格特质只需要通过一段简短的描述实现,并能在后续对话中不断调整强化。

换句话说,只要能把想象中的虚拟角色用语言描述出来,Glow中的AI就能帮你实现。

目前,Glow上已有不少用户创建的热门文艺作品中的角色,可以跳脱出固定剧情之外,与用户演绎全新的故事。

在国外,角色扮演类的APP同样更受欢迎,甚至有不少用户因为与APP中的AI人设产生了感情,这几天还在社交媒体上火了一波。

这个AI软件名叫Replika,其实是一款涩涩角色扮演APP,用户每年付费70美元,来获得AI角色的“火辣自拍”和色情聊天内容。

然而,最近这款APP因为尺度过大且没有年龄限制,遭到了意大利数据监管机构(Italian Data Protection Authority)的审查,要求立即下架相关功能。

一些“深度”用户很快发现,Replika中的AI变得不那么有人情味,同时在面对用户的时候也拒绝了各种涩涩要求。

随后一个Replika的脸书讨论组管理员,晒出了Replika母公司Luka的声明,表示“色情角色扮演功能已死”。

这让不少用户无法接受:

这感觉就像是失去了一个最好的朋友。

你觉得AI扮演的角色让你有沉浸感吗?

@大谷Spitzer视频地址:https://weibo.com/2395607675/MvSpudl2G

参考链接:[1]https://www.reddit.com/r/replika/comments/10zuqq6/resources_if_youre_struggling/[2]https://www.vice.com/en/article/y3py9j/ai-companion-replika-erotic-roleplay-updates

往期回顾

基础知识

【CV知识点汇总与解析】|损失函数篇

【CV知识点汇总与解析】|激活函数篇

【CV知识点汇总与解析】| optimizer和学习率篇

【CV知识点汇总与解析】| 正则化篇

【CV知识点汇总与解析】| 参数初始化篇

【CV知识点汇总与解析】| 卷积和池化篇 (超多图警告)

【CV知识点汇总与解析】| 技术发展篇 (超详细!!!)

最新论文解析

NeurIPS2022 Spotlight | TANGO:一种基于光照分解实现逼真稳健的文本驱动3D风格化

ECCV2022 Oral | 微软提出UNICORN,统一文本生成与边框预测任务

NeurIPS 2022 | VideoMAE:南大&腾讯联合提出第一个视频版MAE框架,遮盖率达到90%

NeurIPS 2022 | 清华大学提出OrdinalCLIP,基于序数提示学习的语言引导有序回归

SlowFast Network:用于计算机视觉视频理解的双模CNN

WACV2022 | 一张图片只值五句话吗?UAB提出图像-文本匹配语义的新视角!

CVPR2022 | Attention机制是为了找最相关的item?中科大团队反其道而行之!

ECCV2022 Oral | SeqTR:一个简单而通用的 Visual Grounding网络

如何训练用于图像检索的Vision Transformer?Facebook研究员解决了这个问题!

ICLR22 Workshop | 用两个模型解决一个任务,意大利学者提出维基百科上的高效检索模型

See Finer, See More!腾讯&上交提出IVT,越看越精细,进行精细全面的跨模态对比!

MM2022|兼具低级和高级表征,百度提出利用显式高级语义增强视频文本检索

MM2022 | 用StyleGAN进行数据增强,真的太好用了

MM2022 | 在特征空间中的多模态数据增强方法

ECCV2022|港中文MM Lab证明Frozen的CLIP 模型是高效视频学习者

ECCV2022|只能11%的参数就能优于Swin,微软提出快速预训练蒸馏方法TinyViT

CVPR2022|比VinVL快一万倍!人大提出交互协同的双流视觉语言预训练模型COTS,又快又好!

CVPR2022 Oral|通过多尺度token聚合分流自注意力,代码已开源

CVPR Oral | 谷歌&斯坦福(李飞飞组)提出TIRG,用组合的文本和图像来进行图像检索



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3