对话硅基智能CTO林会杰:平台要对用户数据确权,AI劳动力增加不会导致裁员

您所在的位置:网站首页 裁员对话 对话硅基智能CTO林会杰:平台要对用户数据确权,AI劳动力增加不会导致裁员

对话硅基智能CTO林会杰:平台要对用户数据确权,AI劳动力增加不会导致裁员

2024-05-11 04:26| 来源: 网络整理| 查看: 265

林会杰:因为需要的数据量很大,我们从前年开始在做一些数据收集、采集工作,从去年下半年开始做大模型的技术储备。到现在这个节点,我们的大模型技术进入到了相对比较成熟的阶段。

九派财经:数据采集工作具体指哪方面?

林会杰:炎帝大模型本身的定位就是,一个快速生成多模态数字人的模型底座,需要的是数字人相关的视频数据。

九派财经:这些数据来源于哪里?

林会杰:参数来源有两个方面。一方面是我们自己录制的一系列视频,同时我们提供服务的过程中,在保护客户和用户数据隐私的前提下,我们做了很多数据处理、脱敏、标注等工作,构建了炎帝大模型数据的来源。

目前我们应该拥有了全球最为庞大的、数量最为可观的数字人行业数据库。

九派财经:拥有这样一个庞大的行业私域数据库,在和云服务厂商进行合作的时候,怎么样去保障数据安全?

林会杰:我们所有的模型训练和数据库建设都在私有云上进行,只有对外提供生成服务的时候是在公有云上。两者的数据严格区分,不存在对外泄露的情况。

九派财经:关于大模型训练数据集的安全性问题,您有哪些建议?

林会杰:安全性问题我觉得有几个方面。第一,对于用户的隐私数据,需要确权的确权,这是一个很重要的工作;第二,对数据脱敏,使得无法通过这些经过处理的数据,去还原用户的原始内容;第三,将用户隐私数据和对外提供的数据做物理隔离。

九派财经:确权方面有没有一些比较好的解决方案?

林会杰:我们看到很多平台或网站,比如马斯克(Elon Musk)的社交平台X,最近推出了一系列新的隐私条款,其中明确了用户数据可以用于什么方面、不可以用于什么方面,或者是用户数据限定只能用于自有平台模型训练需求,不会将数据直接对外提供,并且这些数据经过了相应的脱敏等工作。

九派财经:能不能理解说,作为平台方在获取大量用户数据的同时,也应该为大模型时代、为AIGC去做一些相应的用户条款上的调整?

林会杰:是的,所有的隐私协议、数据版权确权等类目上的一些协议,其实都需要做一些更新。

【2】AI劳动力的出现并不会导致裁员

九派财经:年初至今,多款大模型应用都经历过数次迭代,但从C端用户反馈来看,幻觉问题始终没有得到解决。您是如何看待这个问题的?

林会杰:从原理角度来说,语言本身就带有歧义,断句、标点符号、重音等都会影响一句话表达的意思,如何消除歧义还需要找到一种突破性的办法。

在和ChatGPT交流的时候会发现,当你告诉它,某些答案是不对的,它会马上反馈说,我刚才说的确实有问题,我再重新回答,你看看是不是对的。这中间有一个feedback(反馈)、一个交互。

所以其实可以把这个问题延伸到两个方面。一是对知识性、常识性等有明确答案的问题,确保它回答的真实性,这是相对比较容易解决的;二是在涉及到观点表达时,给模型符合正确价值观的引导,并加强它的推理能力。

我觉得随着时间的推移、随着数据的改进,以及模型算法、算力的提升,幻觉问题能够得到有效解决;同时在应用场景和产品设计的时候,也需要考虑到幻觉问题,多做一些交互设计上的引导。

九派财经:交互设计上的引导具体指什么?

林会杰:其一是类似于语音助手的命令式交互,在用法上引导用户说一些固定的词汇,比如“嘿,Siri”,这样既给了用户一定的约束,又给了模型一个关键词引导。

其二是基于大模型泛化能力的大幅度提升,很可能第一次生成的结果不是最优解,应当给予用户交互的空间,让大模型可以根据用户的及时反馈去生成更好的结果。

这类似于现在很多大模型应用中各种各样的助手。它在每个行业、每个领域的助手中设定了一系列Prompts(提示词),做了针对性的优化,比如文案助手在文案层面做了优化,使得整体的效果得到大幅度提升。

九派财经:对于整个AIGC数字人产业来说,有哪些方面需要改进?可以怎样促进它的发展?

林会杰:呼吁创新,避免同质化。外面还有那么广阔的星空、那么广阔的地带、那么未知而有潜力的空间等着我们去挖掘,何必盯着小小的一块领域做重复性工作?

数字人除了和直播行业结合,还可以和新闻领域、销售领域、传播领域结合。比如,怎么将中国商品更好地推广到海外、怎么去解决跨语言沟通的问题?我们期待可以通过大模型技术,将一个中文产品介绍视频,翻译成另外一种语言,并且在保留原来音色的同时,让口型和面部表情匹配上声音,就像是在说另一种原生语言一样,这可以很大程度地解决本土化问题。

在影视剧制作领域,是不是可以拥有一个互动式结局?就像商品千人千面一样,剧情也能够千人千面。我们可以让AI去驱动角色,让用户和角色之前产生更多的互动和纽带,整个影视剧制作可想象的空间会大范围地拓展和衍生。

九派财经:到2025年,硅基智能称要创造1亿个硅基劳动力,但大家担心AI劳动力的出现,会导致裁员。

林会杰:其实结果恰恰相反。在工作场景中,人的形象是非常重要的,这个形象不是同质化的形象,而是因为工作场景需要不同类型的、丰富的形象。这也是为什么招聘需要面试。

最开始我们聊到数据隐私和数据版权的问题。当人有了数字分身,并且它在工作的时候,本质上是人在出售、出租自己数字分身的版权,所有的收益都会让版权所有方得到相应的回报。

【3】开源闭源是互相促进互相竞争的关系

九派财经:大模型行业进入下半场竞争,最近很多公司都在强调建构应用生态,呼吁停止“烧钱”卷大模型,拥抱开源以加速大模型商业化落地。您对于这个观点是怎样理解的?

林会杰:我觉得任何一项技术,它的商业闭环是必须要去跑通的。因为只有跑通了商业闭环,从应用到技术开发、用户参与,它才能形成一个正向的循环。

所谓的商业闭环,很大程度上来源于应用生态的繁荣。越来越多的人去用、越来越多的人能够去接受这项技术,同时,这项技术又能在应用端给越来越多的用户创造价值,是一件非常重要的事情。

其实在任何一个行业,它的驱动力量可能来自于两方面,一方面是原始技术层面的创新,这些技术变革带来了生产效率的大幅度提升;另一方面是技术在不同产业、不同领域里面落地生根、开花结果。

我们看到移动互联网时代,大家最开始做了很多操作系统层面和终端层面的升级迭代和优化,但真正让移动互联网繁荣起来的,是各类应用——打车应用、外卖应用、即时通讯应用等等。

这些应用的繁荣,使得用户使用频次、时长提高,他们从具体应用中获得的价值也越来越高,这其中产生了更多的数据和正向的商业回报,又会反过来推动整个移动互联网底层技术的迭代和升级,形成一个正向循环。

所以从我个人的角度来讲,大模型做技术的迭代和升级是必然,但应用生态的繁荣推动大模型在各个行业和领域去落地,为用户创造价值、带来回报,形成更完善的、正向的商业闭环,是一件非常必要的事情,而且在当下也是一件很重要的事情。

九派财经:这和是不是要自研大模型、是不是要采用开源大模型有必然关系吗?

林会杰:开源和闭源其实是一个互相促进又互相竞争的关系。任何一个领域,特别是发展初期,竞争能够为其带去更快速的迭代和发展。开源和闭源这两种生态,如果能够去有序、良性竞争,都是可能推动模型底座的发展,以及应用生态的繁荣。

具体是否要自研大模型,我觉得取决于具体的公司——它根据自身的情况,包括资金、技术储备、所擅长的市场等去决定。但从整个产业链来看,最终会形成一个从模型底座技术、再到应用生态矩阵的一个完整的商业闭环。

九派财经:能不能说,开源对于一些中小型或者初创团队而言,意味着可以花更小的成本进入到行业,然后发挥想象力去做一个高价值的产品?

林会杰:我觉得是有这样一个机会的。不同的初创公司、中小企业都能去结合开源生态中的一些模型底座,来定制跟自己行业相关的垂类应用,使得大模型在垂类的应用场景下,能够去做到更好的效果,去创造更加正向的价值。

九派财经:未来,一个大模型企业或者数字人企业,它真正的壁垒会是什么?

林会杰:我觉得任何一个行业、任何一个领域,其实最终留下来的壁垒,一个是广泛的用户群体,第二个是积累起来的“行业know how”, 以及在这个行业里面所不断深化、优化形成的知识库和数据。

现在我们正在建构这个壁垒。我们的工作基本上都是围绕着,怎么能够去更好地做技术创新,以及怎么将我们创新的这些产品和技术跟行业做更好的结合去展开、进行的。

九派财经记者黄依婷

【来源:九派财经】

版权归原作者所有,向原创致敬返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3