Neuro

您所在的位置:网站首页 虚拟主播粉丝数排行 Neuro

Neuro

2024-07-13 23:33| 来源: 网络整理| 查看: 265

摘要:虚拟主播指使用虚拟形象在视频网站上进行投稿活动或视频直播的主播。传统虚拟主播仅在形象上虚拟,其发言和肢体动作仍然来源于真人(称为“中之人”);而基于生成式人工智能的AI虚拟主播则因为用计算机程序取代了中之人,引发了虚拟主播业态的新一轮变革。本文以AI虚拟主播为例,在数字技术实践层面对数字资本主义进行了分析与批判。文章分析了AI虚拟主播行业中生产和消费环节发生的变化,发现在AI虚拟主播行业中,计算机技术加持的生产力发展伴随着人的主体性的弱化,生产关系的核心由人与资本的关系转变为资本与技术的关系;消费符号化日益严重,粉丝深陷数字劳工泥沼,受数字资本的剥削加剧。综上本文得出,AI虚拟主播的本质是资本主义发展到数字资本主义阶段的产物。

一、引言

1.1 概念定义

网络主播是指通过互联网平台进行视频或音频直播的人,也称为网红、主播、网红主播等。网络主播一般以娱乐、教育、生活等内容吸引观众,有时也会进行商品推荐或直播带货。

虚拟主播是指使用计算机生成的虚拟形象,通过动作捕捉等技术进行直播的网络主播。在我国,虚拟主播普遍被称为虚拟UP主(Virtual Uploader,VUP);在国外,虚拟主播由于普遍活跃于视频平台YouTube被称为Virtual YouTuber(VTuber)。

中之人是指在虚拟主播背后负责配音和虚拟形象操控的真人。中之人是虚拟主播虚拟性的核心,为了保持虚拟性,将网络形象(主播的“人设”)和真实生活中的形象分隔开来,虚拟主播一般不会公开自己的真实形象和中之人真实身份。

生成式人工智能是指利用深度学习等算法,从大量数据中学习规律和特征,然后生成新的数据或内容的人工智能技术。生成式人工智能可以用于图像、视频、音频、文本等多种领域,创造出逼真或有创意的内容。当前发展最热、应用最广的生成式人工智能为大语言模型(Large Language Model, LLM)。

AI虚拟主播是指不需中之人,全部工作(虚拟形象生成及控制、语音对话)完全使用生成式人工智能等计算机技术完成的虚拟主播。

1.2 AI虚拟主播的由来与发展现状

大语言模型为AI虚拟主播的诞生和发展铺平了道路。2022年12月19日,由英国程序员Jack Vedal耗费四年时间创造的AI虚拟主播“Neuro-sama”于直播平台Twitch上出道直播,其直播内容通常为电子游戏、唱歌和杂谈。Neuro-sama与观众的对话使用了类似于GPT-3的大语言模型,其声音是通过文字转语音(TTS)程序生成,而其虚拟形象动作和情感的控制则是基于对聊天内容的分析。截至2023年6月,出道仅半年,Neuro-sama就已经积攒了超过30万名粉丝,在平台的虚拟主播排行榜上排名第15名(第1名的粉丝数约为150万),可见AI虚拟主播大有在虚拟主播甚至网络主播界攻城略地之势。在我国,AI虚拟主播的发展并不晚于国外。音乐制作人兼软件开发者Xwdit基于自己开发的聊天机器人,推出了主打中文直播的AI虚拟主播“木几萌”,于2023年2月在视频网站哔哩哔哩(B站)出道,目前已积攒10万余名粉丝,跻身至B站虚拟主播区腰部水平。

虚拟主播产业规模巨大。根据艾瑞咨询发布的《2023年中国虚拟主播行业生态研究报告》,2022年中国虚拟人带动产业市场规模和核心市场规模分别为1866.1亿元和120.8亿元,预计2025年分别达到6402.7亿元和480.6亿元[1]。AI虚拟主播作为虚拟主播产业的新起之秀,为探究其经济社会影响,推动其健康发展,对AI虚拟主播新业态进行深度分析是必要的。

二 AI虚拟主播新业态分析2.1 生产力的变化

计算机取代中之人。传统虚拟主播是由中之人作为语音来源,并通过动作捕捉技术操控虚拟形象进行直播并与观众进行互动的。因此,中之人作为劳动者,是传统虚拟主播的核心,更是虚拟直播生产力的源头。AI虚拟主播最显著的特征就是由计算机程序取代了中之人,即其生产力的基础转变为以GPU(图形处理器)和CPU(中央处理器)为代表的计算机硬件与大语言模型为代表的计算机软件。计算机软/硬件可以24小时不间断运行,因此不再有劳动时间的限制。这意味着AI主播可以在单位时间(包含传统虚拟主播的休息时间)内产出更多的数字产品(流量),进而获得更多利润。在AI虚拟主播中,人对于虚拟主播的控制从直接转为间接。将虚拟主播形象与计算机软硬件连接起来的人,也即程序开发者,担任了AI虚拟主播新的意义上的中之人角色。

AI虚拟主播可调用的生产资料远多于传统虚拟主播。传统虚拟主播的直播内容,如游戏、杂谈,来源于自身技能和经历;而AI虚拟主播的对话能力源于大语言模型,而大语言模型的数据来源为庞大的语料库,是人类知识的总和,并且AI主播具有实时联网能力,可以比真人更快、更直接地获取互联网上各种信息,因此可以说AI主播所拥有的生产资料远超传统主播。

2.2 生产关系的变化

AI虚拟主播所使用的生产资料呈现出分散化和集中化两种截然相反但同时进行的趋势。生产资料的所有制形式是生产关系的三要素之一,分析生产资料的所有制形式有助于了解AI虚拟主播行业生产关系的变化。

一方面,个人可以用相对较低的成本获得诸如GPU的计算机硬件,从开源社区获得高质量的动作捕捉、语音合成、视频推流软件,更有大量开源大语言模型可免费获取并部署。这意味着独立开发者完全有可能打造出自己的虚拟主播(事实上,Neuro-sama和木几萌的聊天机器人功能均是由个人开发者所开发)。而传统虚拟主播的“生产资料”基本局限于自身,相比之下AI虚拟主播所使用的生产资料呈现出分散化趋势。

另一方面,随着生成式人工智能的不断发展,人们意识到人工智能语言模型的性能与其参数量成显著的正相关关系。只有参数量达到一定水平,语言模型才能具备一些高级能力(如逻辑、推理),这被称为大语言模型的“涌现特性”。诸如GPT-3.5和GPT-4的超大语言模型,由于模型复杂度极高、参数量巨大(GPT-3.5参数量为1750亿,GPT-4或达1万亿),训练、维护和部署模型所需的大量、昂贵且快速增长的算力将导致不可避免的市场集中和垄断。目前,大量的优质算力和顶尖技术人才集中于云服务厂商(如微软Azure)和人工智能公司(如OpenAI、谷歌),个人开发者在算力和技术上都不能与之匹敌。大语言模型是AI虚拟主播的生产资料,大语言模型的性能是AI虚拟主播的核心竞争力。可以预见,随着AI虚拟主播产业的进一步发展,为了提升主播的业务能力,将会有越来越多的AI主播接入大公司的大语言模型,在一定程度上这代表了生产资料的集中。笔者认为,在未来,这种集中化趋势产生的经济效益和社会影响将超过分散化趋势。

人在AI虚拟主播行业中的主体性被弱化。第一,由于生成式人工智能的发展,大语言模型能够完成原本由中之人完成的、最核心的内容生产工作,使得自动化程度大幅度提高,但同时这也意味着数字内容生产过程中人的参与度的降低。第二,人对AI虚拟主播的控制力减弱。虽然大语言模型具有较强的语言理解和生成能力,但其输出具有不确定性,AI虚拟主播的“中之人”(开发者)只能通过模型的训练或微调大致确定主播的性格、语言风格等“人设”,并采用内容过滤器过滤模型的输入与输出。

资本与技术的关系取代资本与人的关系,在AI虚拟主播行业的生产关系中占据核心地位。传统虚拟主播除少部分是由个人运营(活动策划、直播、视频制作均由主播本人完成)之外,一般从属于企业、团体或事务所(下统称事务所)。相比于个人运营,虚拟主播能从事务所获取更多资源,如技术支持、运营策划、流量推广、商业合作,同时事务所也能获得相当的利润,因此虚拟主播和事务所间成立劳动雇佣关系,能使双方同时获得更多利益。资本对这些事务所进行投资,事务所负责虚拟主播的运营和新虚拟主播的培养,通过各种形式的流量变现获取利润。目前我国虚拟主播事务所主要有A-SOUL、VirtualReal等,而国际上则有彩虹社、hololive等。可以说传统虚拟主播行业的生产关系归根到底是资本与人的关系。然而,对于AI虚拟主播行业而言,如前所述,人的主体性被弱化,技术在虚拟主播的生产过程中的主导地位日益加强。资本可以直接投资AI技术,降低对人力资源的依赖,获取更多利润,人在生产过程中发生了异化,从技术的创造者变为技术的附庸,资本与技术的联系越发紧密。

2.3 生产过程中的监管问题

AI虚拟主播的监管问题复杂化。第一,从运营者角度来看,AI虚拟主播所依靠的大语言模型具有安全性问题,其可能生成一些错误或不适宜的内容,这是AI虚拟主播目前的最大运营风险。2023年1月,Neuro-sama因发表否认纳粹大屠杀的言论被平台以“仇恨言论”为由封禁两周;3月,木几萌因发表不适宜涉政内容被平台封禁一个月。此后,开发者只能通过严格的内容过滤器对观众的发言和主播的回复进行过滤,甚至手动打断主播的输出。两位“头部”AI虚拟主播在内容安全上接连翻车,凸显了AI虚拟主播难以有效控制的特点,也进一步说明对AI虚拟主播的监管存在技术上的难点。第二,从平台和受众的角度来看,由于AI主播生成的内容难以区分,甚至其虚拟形象也真假莫辨,平台和受众都难以区分哪位主播是真人主播,哪位是AI驱动的主播,这里的AI主播主要指的是在淘宝、抖音等电商平台上,以3D类真人形象出镜的带货主播。因此,首要的是将人工智能生成内容(AIGC)进行识别与区分。针对此问题,抖音在2023年5月9日发布《关于人工智能生成内容的平台规范暨行业倡议》,主要对AIGC的两方面做了规定。第一是应对AIGC内容进行显著标识,帮助用户区分虚拟与现实;二是虚拟形象需要注册认证,且其背后必须有人控制,禁止完全无人的AI直播。

2.4 消费的变化:消费符号化日益严重

第一,AI虚拟主播本身就具有很强的符号化特性。大语言模型的训练数据来源于互联网上的文本信息,因此AI虚拟主播在一定程度上是“人类智慧的结晶”,是人工智能发展的一种符号。这种符号是传统虚拟主播所不具有的,因此具有很强吸引力,观众和粉丝都对AI主播抱有新鲜感和好奇心,渴望见证AI主播的成长历程。

第二,在消费社会中,商品的符号价值日益凸显[2]。粉丝参与虚拟主播的活动,实质上是在对虚拟主播本身以及所生产数字产品的一种消费。林旻轩指出,虚拟主播的人设和其形象是一种“媒介形象”,媒介形象以符号化、标签化的方式突出虚拟主播的性格特征并以此博得大众认同,通过大众认同产生符号价值[3]。符号价值的变现,可以通过售卖周边产品等实现。比如,在专门售卖虚拟主播周边产品的购物平台UwU Market上,一件印有Neuro-sama形象的T恤衫的价格高达250美金。随着生成式人工智能技术的发展,“培养”一个AI虚拟主播的成本将逐渐降低,具有不同人设的AI虚拟主播可以批量生产,它们以各异的媒介形象吸引着各自的受众群体,创造着大量符号价值,资本从中获得超额利润。

2.5 数字劳工的泥沼:对粉丝的剥削

随着信息与通信技术的发展,由资本主义扩张与技术变迁共同推动的社会媒介化进程不断加快,人的异化程度逐渐加深,越来越多的人被纳入数字劳工的范畴[4]。

粉丝在参与虚拟主播活动时,不仅是作为消费者,实际上也在进行各种形式的数字劳动,成为“产销者”与数字劳工。这种劳动体现在如下两个方面。一是数据产品的创造。随着对虚拟主播形成依赖,粉丝会不由自主地耗费大量时间精力参与主播活动,给主播创造流量。AI虚拟主播还能直接将粉丝和主播的对话作为语料数据用于模型改进,使主播的人设更加符合粉丝需求,增强用户粘性。二是符号价值的创造。基于对虚拟主播符号认同聚集而成的粉丝社群,不断地通过文本、视频、音乐等形式的二次创作构建着围绕虚拟主播的话语体系,扩充着主播的符号价值[5];同时,这些来源于庞大粉丝群体的二次创作跳出了直播间,极大延伸了主播的影响力,通过“破圈”吸引更多“圈外人士”的参与。即使粉丝们的占用自己闲暇时间进行的辛苦工作不会得到任何报酬,他们也乐在其中,自愿进行着劳动, “将信息知识消费转化为额外的生产性活动而遭受剥削”[6]。AI主播是连接数字资本与数字劳工的桥梁,具有比传统虚拟主播更强的媒介性质。粉丝们距离以互联网公司为代表的数字资本的距离更近,受到的剥削也更直接。

三 结语

数字资本主义是继商业资本主义、工业资本主义后,资本主义发展新的历史形态,数字资本主义的发展离不开数字技术的飞速发展[7]。经过对AI虚拟主播新业态的分析,不难发现,AI虚拟主播的生产带有技术优势,是数字资本主义生产方式新形态的例证。这种生产方式一方面对虚拟主播产业升级起到一定推动作用,但另一方面,AI虚拟主播背后的数字资本以更强的隐蔽性和渗透性加重了对劳动者的剥削。虽然目前AI虚拟主播还处于发展萌芽阶段,但如何在充分挖掘和释放数字科技生产力的同时,抑制数字资本扩张所带来的各种经济社会问题,是值得我们思考和研究的关键课题。

参考文献:

[1] 上海艾瑞市场咨询有限公司. 2023年中国虚拟主播行业生态研究报告[R].上海:艾媒产业升级研究中心,2023.

[2] 仰海峰.消费社会中的欲望规划与身体规划[J].社会科学辑刊,2022,No.262(05):23-30.

[3] 林旻轩.消费与认同——虚拟主播受众消费分析[J].商场现代化,2022,No.975(18):7-9.DOI:10.14013/j.cnki.scxdh.2022.18.060.

[4] 张仕林.媒介化社会的数字劳工及其过度劳动[J].新闻知识,2022,No.456(06):80-86.

[5] 吴思远.双向构建与情感连接:参与式文化视角下的虚拟主播与粉丝关系[J].新媒体研究,2023,9(04):80-84.DOI:10.16604/j.cnki.issn2096-0360.2023.04.004.

[6] 夏冰青.数字劳工的概念、学派与主体性问题——西方数字劳工理论发展述评[J].新闻记者,2020,No.450(08):87-96.DOI:10.16057/j.cnki.31-1171/g2.2020.08.010.

[7] 周绍东,初传凯.数字资本主义研究综述[J].世界社会主义研究,2021,6(12):96-105+116.



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3