对话硅基智能CTO林会杰：平台要对用户数据确权，AI劳动力增加不会导致裁员

您所在的位置：网站首页 › 裁员对话 › 对话硅基智能CTO林会杰：平台要对用户数据确权，AI劳动力增加不会导致裁员

对话硅基智能CTO林会杰：平台要对用户数据确权，AI劳动力增加不会导致裁员

2024-05-11 04:26| 来源: 网络整理| 查看: 265

林会杰：因为需要的数据量很大，我们从前年开始在做一些数据收集、采集工作，从去年下半年开始做大模型的技术储备。到现在这个节点，我们的大模型技术进入到了相对比较成熟的阶段。

九派财经：数据采集工作具体指哪方面？

林会杰：炎帝大模型本身的定位就是，一个快速生成多模态数字人的模型底座，需要的是数字人相关的视频数据。

九派财经：这些数据来源于哪里？

林会杰：参数来源有两个方面。一方面是我们自己录制的一系列视频，同时我们提供服务的过程中，在保护客户和用户数据隐私的前提下，我们做了很多数据处理、脱敏、标注等工作，构建了炎帝大模型数据的来源。

目前我们应该拥有了全球最为庞大的、数量最为可观的数字人行业数据库。

九派财经：拥有这样一个庞大的行业私域数据库，在和云服务厂商进行合作的时候，怎么样去保障数据安全？

林会杰：我们所有的模型训练和数据库建设都在私有云上进行，只有对外提供生成服务的时候是在公有云上。两者的数据严格区分，不存在对外泄露的情况。

九派财经：关于大模型训练数据集的安全性问题，您有哪些建议？

林会杰：安全性问题我觉得有几个方面。第一，对于用户的隐私数据，需要确权的确权，这是一个很重要的工作；第二，对数据脱敏，使得无法通过这些经过处理的数据，去还原用户的原始内容；第三，将用户隐私数据和对外提供的数据做物理隔离。

九派财经：确权方面有没有一些比较好的解决方案？

林会杰：我们看到很多平台或网站，比如马斯克（Elon Musk）的社交平台X，最近推出了一系列新的隐私条款，其中明确了用户数据可以用于什么方面、不可以用于什么方面，或者是用户数据限定只能用于自有平台模型训练需求，不会将数据直接对外提供，并且这些数据经过了相应的脱敏等工作。

九派财经：能不能理解说，作为平台方在获取大量用户数据的同时，也应该为大模型时代、为AIGC去做一些相应的用户条款上的调整？

林会杰：是的，所有的隐私协议、数据版权确权等类目上的一些协议，其实都需要做一些更新。

【2】AI劳动力的出现并不会导致裁员

九派财经：年初至今，多款大模型应用都经历过数次迭代，但从C端用户反馈来看，幻觉问题始终没有得到解决。您是如何看待这个问题的？

林会杰：从原理角度来说，语言本身就带有歧义，断句、标点符号、重音等都会影响一句话表达的意思，如何消除歧义还需要找到一种突破性的办法。

在和ChatGPT交流的时候会发现，当你告诉它，某些答案是不对的，它会马上反馈说，我刚才说的确实有问题，我再重新回答，你看看是不是对的。这中间有一个feedback（反馈）、一个交互。

所以其实可以把这个问题延伸到两个方面。一是对知识性、常识性等有明确答案的问题，确保它回答的真实性，这是相对比较容易解决的；二是在涉及到观点表达时，给模型符合正确价值观的引导，并加强它的推理能力。

我觉得随着时间的推移、随着数据的改进，以及模型算法、算力的提升，幻觉问题能够得到有效解决；同时在应用场景和产品设计的时候，也需要考虑到幻觉问题，多做一些交互设计上的引导。

九派财经：交互设计上的引导具体指什么？

林会杰：其一是类似于语音助手的命令式交互，在用法上引导用户说一些固定的词汇，比如“嘿，Siri”，这样既给了用户一定的约束，又给了模型一个关键词引导。

其二是基于大模型泛化能力的大幅度提升，很可能第一次生成的结果不是最优解，应当给予用户交互的空间，让大模型可以根据用户的及时反馈去生成更好的结果。

这类似于现在很多大模型应用中各种各样的助手。它在每个行业、每个领域的助手中设定了一系列Prompts（提示词），做了针对性的优化，比如文案助手在文案层面做了优化，使得整体的效果得到大幅度提升。

九派财经：对于整个AIGC数字人产业来说，有哪些方面需要改进？可以怎样促进它的发展？

林会杰：呼吁创新，避免同质化。外面还有那么广阔的星空、那么广阔的地带、那么未知而有潜力的空间等着我们去挖掘，何必盯着小小的一块领域做重复性工作？

数字人除了和直播行业结合，还可以和新闻领域、销售领域、传播领域结合。比如，怎么将中国商品更好地推广到海外、怎么去解决跨语言沟通的问题？我们期待可以通过大模型技术，将一个中文产品介绍视频，翻译成另外一种语言，并且在保留原来音色的同时，让口型和面部表情匹配上声音，就像是在说另一种原生语言一样，这可以很大程度地解决本土化问题。

在影视剧制作领域，是不是可以拥有一个互动式结局？就像商品千人千面一样，剧情也能够千人千面。我们可以让AI去驱动角色，让用户和角色之前产生更多的互动和纽带，整个影视剧制作可想象的空间会大范围地拓展和衍生。

九派财经：到2025年，硅基智能称要创造1亿个硅基劳动力，但大家担心AI劳动力的出现，会导致裁员。

林会杰：其实结果恰恰相反。在工作场景中，人的形象是非常重要的，这个形象不是同质化的形象，而是因为工作场景需要不同类型的、丰富的形象。这也是为什么招聘需要面试。

【3】开源闭源是互相促进互相竞争的关系

九派财经：大模型行业进入下半场竞争，最近很多公司都在强调建构应用生态，呼吁停止“烧钱”卷大模型，拥抱开源以加速大模型商业化落地。您对于这个观点是怎样理解的？

林会杰：我觉得任何一项技术，它的商业闭环是必须要去跑通的。因为只有跑通了商业闭环，从应用到技术开发、用户参与，它才能形成一个正向的循环。

所谓的商业闭环，很大程度上来源于应用生态的繁荣。越来越多的人去用、越来越多的人能够去接受这项技术，同时，这项技术又能在应用端给越来越多的用户创造价值，是一件非常重要的事情。

其实在任何一个行业，它的驱动力量可能来自于两方面，一方面是原始技术层面的创新，这些技术变革带来了生产效率的大幅度提升；另一方面是技术在不同产业、不同领域里面落地生根、开花结果。

我们看到移动互联网时代，大家最开始做了很多操作系统层面和终端层面的升级迭代和优化，但真正让移动互联网繁荣起来的，是各类应用——打车应用、外卖应用、即时通讯应用等等。

这些应用的繁荣，使得用户使用频次、时长提高，他们从具体应用中获得的价值也越来越高，这其中产生了更多的数据和正向的商业回报，又会反过来推动整个移动互联网底层技术的迭代和升级，形成一个正向循环。

所以从我个人的角度来讲，大模型做技术的迭代和升级是必然，但应用生态的繁荣推动大模型在各个行业和领域去落地，为用户创造价值、带来回报，形成更完善的、正向的商业闭环，是一件非常必要的事情，而且在当下也是一件很重要的事情。

九派财经：这和是不是要自研大模型、是不是要采用开源大模型有必然关系吗？

林会杰：开源和闭源其实是一个互相促进又互相竞争的关系。任何一个领域，特别是发展初期，竞争能够为其带去更快速的迭代和发展。开源和闭源这两种生态，如果能够去有序、良性竞争，都是可能推动模型底座的发展，以及应用生态的繁荣。

具体是否要自研大模型，我觉得取决于具体的公司——它根据自身的情况，包括资金、技术储备、所擅长的市场等去决定。但从整个产业链来看，最终会形成一个从模型底座技术、再到应用生态矩阵的一个完整的商业闭环。

九派财经：能不能说，开源对于一些中小型或者初创团队而言，意味着可以花更小的成本进入到行业，然后发挥想象力去做一个高价值的产品？

林会杰：我觉得是有这样一个机会的。不同的初创公司、中小企业都能去结合开源生态中的一些模型底座，来定制跟自己行业相关的垂类应用，使得大模型在垂类的应用场景下，能够去做到更好的效果，去创造更加正向的价值。

九派财经：未来，一个大模型企业或者数字人企业，它真正的壁垒会是什么？

林会杰：我觉得任何一个行业、任何一个领域，其实最终留下来的壁垒，一个是广泛的用户群体，第二个是积累起来的“行业know how”, 以及在这个行业里面所不断深化、优化形成的知识库和数据。

现在我们正在建构这个壁垒。我们的工作基本上都是围绕着，怎么能够去更好地做技术创新，以及怎么将我们创新的这些产品和技术跟行业做更好的结合去展开、进行的。

九派财经记者黄依婷

【来源：九派财经】

版权归原作者所有，向原创致敬返回搜狐，查看更多

【本文地址】

对话硅基智能CTO林会杰：平台要对用户数据确权，AI劳动力增加不会导致裁员

对话硅基智能CTO林会杰：平台要对用户数据确权，AI劳动力增加不会导致裁员

今日新闻

推荐新闻