第四范式陈雨强：GPT等大模型落地需内容可信、数据安全、成本可控

您所在的位置：网站首页 › 大数据公司50强 › 第四范式陈雨强：GPT等大模型落地需内容可信、数据安全、成本可控

第四范式陈雨强：GPT等大模型落地需内容可信、数据安全、成本可控

2023-04-13 21:23| 来源: 网络整理| 查看: 265

近日，由《麻省理工科技评论》、清华工研院联合主办的全球青年科技领袖峰会召开，包括6位院士在内的国内外顶级学者、科技领袖展示了最具前沿科技成果及产业化进程。第四范式联合创始人、首席科学家陈雨强受邀出席活动并围绕AIGC、大模型等话题分享了创新技术在产业应用中的趋势与实践。

在起起伏伏的发展过程中，人工智能一直在朝着解决更为复杂问题的方向演进和迭代。这背后，除了外在的数据、算法、算力等三要素协同发展以外，内在的根本原因在于模型维度持续不断的提升。

业界评判模型维度的标准是VC维理论，是由早期统计学的两位创始人提出，类似于脑容量，VC维越大则模型或函数越复杂，机器智力水平就越高，学习能力越强。

从持续不断提升VC维这一视角看，人工智能发展是不断提升模型维度和大小的历史。不管是决策类AI、视觉类AI还是NLP（自然语言处理）领域，都经历了四大阶段：

第一阶段是由人制定规则来构建专用小模型，优点是可解释、易干预，最早应用在专业领域，但随着写的规则增多会失真、失效，应用效果未能达到当时的预期。

第二阶段是让机器写少量规则，受限于机器的数据、算力、算法能力，人工智能写的规则并不多，所以模型规模仍然维持在专用小模型的阶段；

第三阶段是机器写大量规则构建了专用大模型，其背后源于深度学习、海量数据、算力水平的飞速发展，这让人工智能在视觉、语音、搜索、推荐等领域构建了千亿级专用大模型，能力逐渐达到了超越人的水平。但这些专用大模型只能解决单一问题。

第四阶段是通用大模型阶段，通过多任务学习的方式，让一个模型拥有非常多的能力，将应用于各个领域的专用大模型变成一个通用大模型。

GPT就是NLP领域的通用大模型典型代表，核心解决从海量的数据中学习人的语感。语感是学习语文的一项重要基础能力，不管是认字、组词、造句、写文章都要建立在好的语感基础上。

GPT在学习了五千亿个单词后，训练出了更加接近人的语感和生成式语言的能力。相较于传统的NLP技术，GPT可以通过更长的上下文来进行推断。

此外，光靠语感做到表达自然、逻辑通顺还不够，好的文章还需要基于事实表达正确的观点、言之有物。因此，GPT以学语文的方式学习了数学、化学、地理、写代码等众多其他学科知识。其学习方式并不是直接讲解数理化公式、历史事件背景或是代码的语法逻辑，而是通过看大量的文章、形成自有的知识库，且随着参数越大，其覆盖领域和能力范畴越来越广。

然而，拥有任何领域的知识往往意味着在任何专业领域都不够专业。GPT会因为没有看到过专业领域的数据，出现“胡编乱造”的情况。

所以，以GPT为代表的大模型技术真正应用于企业中，亟需解决内容可信、数据安全、落地成本高等三大挑战。

首先是内容可信。很多情况下，企业必须要甄别内容是不是编的，并确保生成内容真实、可靠。要解决这个问题，大模型必须要引入企业内部高质量的数据，生成的每句话都能溯源。

其次是数据安全。最近有很多企业限制员工使用ChatGPT，每一个问题都有可能泄露核心机密，所以私有部署对企业来说至关重要，确保关键信息不被泄露。

第三是成本可控。落地成本是一个重要的考虑因素，企业并不需要所有GPT的知识，可以根据企业自身的需要适当减小模型规模，以降低应用落地成本。

为此，第四范式推出了企业级生成式AI产品——式说，它在满足企业部署大模型所需的内容可信、数据安全、成本可控三大要求的同时，具备了生成式对话能力、多模态输入输出能力、企业级Copilot能力。在与企业内部应用库、私有数据打通后，自动对信息和数据进行分析，回答员工的问询或执行相关任务。

我们深知，大模型产业应用不止于此。未来，第四范式将持续与客户携手探索更加广阔的应用场景，帮助企业享受到新技术带来的生产力提升，共同迈向AIGC时代。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

【本文地址】

第四范式陈雨强：GPT等大模型落地需内容可信、数据安全、成本可控

第四范式陈雨强：GPT等大模型落地需内容可信、数据安全、成本可控

今日新闻

推荐新闻