打造中国版ChatGPT的国内力量

您所在的位置:网站首页 悟道ai 打造中国版ChatGPT的国内力量

打造中国版ChatGPT的国内力量

#打造中国版ChatGPT的国内力量| 来源: 网络整理| 查看: 265

学术初创派

ChatGPT 带来的这一波 AI 商业化热潮有着极高的技术壁垒,同时也给了科学家们下场创业的巨大机遇。

如澜舟科技创始人周明、IDEA 研究院讲席科学家张家兴、西湖心辰蓝振忠、衔远科技创始人周伯文等人,都是学术初创派的代表。

对他们而言,要在未来的 ChatGPT 商业战中取胜,还需要补强工程化和市场运营的能力。就像张家兴和蓝振忠,已经在为他们的研发团队寻找一个 CEO。

此外,我们还能观察到两种入局模式:一种是以强大的技术能力为基础,去弥补商业化方面的短板;另一种是商业化经验丰富的大佬下场,吸引技术人才来组队。

最终哪种模式能走得更成功,我们拭目以待。

澜舟科技周明

在上一轮大模型堆参数的潮流正当火热之时,周明独辟蹊径,为其初创公司澜舟科技选择了一条轻量化大模型的路线。

2021 年 6 月,周明成立澜舟科技,在紧接着的 7 月,他的团队就发布了十亿参数的「孟子」模型,效果可比肩千亿大模型。

这是周明在学术界和产业界两开花的结果。

图片

周明是NLP 领域极具影响力的华人科学家之一。他于 1991 年从哈工大博士毕业,是百度 CTO 王海峰的同门师兄弟,哈尔滨工业大学教授、NLP 泰斗李生的高徒。博士期间,周明曾研制出中国第一个中英翻译系统。

毕业后,周明先是进入清华大学任职任教,并在 1999 年被微软亚洲研究院(MSRA)创始院长李开复挖走,2001 年起担任 NLP 组主任,后升任微软亚研副院长。

在 MSRA 期间,周明在 NLP 技术的产业化上成果颇多,他参与带队的 ACL 顶会论文超过百篇,相关技术还应用到了 Windows、Office、Azure、微软小冰等世界级产品中。

2020 年,周明决心以一种新的方式寻求学术界与工业界的合作,就结束了在微软工作的 21 年生涯,加入了李开复创办的创新工场人工智能工程院,担任首席科学家,并开始孵化一个创业团队,最终成立澜舟科技。

据官方消息,澜舟科技将凭借其类 ChatGPT 底层技术的语言大模型,与拥有海量数据的中文在线合作,打造国产 ChatGPT。周明团队是会继续走轻量化模型路线,还是转向做千亿级以上大模型来作为技术支撑,尚不得知。

衔远科技周伯文 2022 年,周伯文回到学术界,加盟清华大学,担任电子工程系长聘教授、清华大学惠妍讲席教授,以及电子系协同交互智能研究中心主任。

同时,周伯文还是一个新创业者。2021 年底,他卸任京东集团高级副总裁,离职创立了衔远科技。

图片

周伯文是中国科学大学少年班毕业,博士在科罗拉多大学波尔德分校就读。毕业后他进入 IBM 工作,曾任 IBM Research 人工智能基础研究院(AI Foundations)院长、IBM Watson Group 首席科学家、IBM 杰出工程师等。2017 年,周伯文加入京东,出任京东集团副总裁,负责京东的 AI 研究。

NLP、多模态、人机对话等都是周伯文深耕多年的领域。他提出的自注意力融合多头机制的自然语言表征机理后来成为Transformer架构的核心思想之一,还提出了 AIGC 领域的两个自然语言生成模型架构与算法。2020 年,他当选 IEEE Fellow。

在周伯文看来,ChatGPT 的核心进展是人的协同和交互学习的提升而非模型变大,而且,ChatGPT 未来必将演变成多模态,这也正是他领导的协同交互智能研究中心的重点研究方向。

而在衔远科技,周伯文也已经实现了一些 AIGC 的应用,如使用生成式人工智能加速以消费者和市场为中心的实时创新、提升 sku 创新成功率。

IDEA 研究院张家兴 粤港澳大湾区,除了鹏城实验室、腾讯,大模型的玩家还有一个,即 IDEA 研究院(全称「粤港澳大湾区数字经济研究院」,由沈向洋等知名 AI 科学家在 2020 年创立。

IDEA 研究院的大模型负责人是张家兴,他也是一位从 MSRA 走出的 AI 科学家。

图片

张家兴于 2006 年从北京大学电子系博士毕业,师从侯士敏(现北大电子系教授)。毕业后,他先在百度待了一段时间,后加入微软的 Bing 搜索团队,与周靖人有过合作。之后在 MSRA ,张家兴从事系统方向的研究,并从 2012 年转向深度学习。

2014 年,张家兴加入阿里 iDST(达摩院前身)团队,一年后又去往蚂蚁金服,带领 NLP 技术团队,将对话机器人应用到金融场景。2020 年,张家兴受 360 数科 CEO 吴海生的邀请,加入 360 数科任首席科学家,只待了一年半便离开。

在 MSRA 院长周礼栋的推荐下,张家兴加入了 IDEA研究院,担任讲席科学家,负责认知计算与自然语言研究中心。

张家兴团队在 AIGC 这一波中一直较为领先,他主导研发了「封神榜」开源模型系列,并在去年推出了国内第一个中文版 Stable Diffusion 模型「太乙」。

ChatGPT 问世之后,张家兴在去年底就迅速将团队的大模型研发转向了 ChatGPT 的对话任务路线。据其透露,其团队研发的类 ChatGPT 模型效果与 ChatGPT 相当,且仅有 50 亿参数,文本生成速度也很快,目前已在内测中,近期将公测。

尽管当前 50 亿参数的模型已经效果很好,但接下来,张家兴计划研发千亿模型支撑的类 ChatGPT 产品,并推动其商业化。这也是他最近准备融资、寻找一位 CEO 的原因。

西湖心辰蓝振忠 同样在为团队寻找 CEO 的,还有西湖心辰的创始人蓝振忠。

图片

去年,在众多国产 AI 作画产品中脱颖而出的「盗梦师」(现改名为「造梦日记」),正是出自蓝振忠团队。

蓝振忠本科从中山大学毕业,博士在卡内基梅隆大学就读,期间研究计算机视觉,后来去谷歌工作时转到自然语言处理方向,依托谷歌的 TPU 资源研发了著名的轻量化大模型「ALBERT」。

2020 年 6 月,蓝振忠回国加入西湖大学,创立了深度学习实验室,开启语言与视觉结合的多模态研究。

依托西湖大学的科研资源与先前加入的智源「青源会」,蓝振忠开启产学研模式,创立了西湖心辰,先是依托大模型研发了心理咨询聊天机器人「小天」,然后在 2022 年 8 月的 Stable Diffusion 浪潮中首发国产作画产品「盗梦师」。

而在 ChatGPT 出来没多久,西湖心辰就推出了类似的文本生成产品「心辰 Chat」。不同的是,它可以访问互联网,而且是多模态交互,不仅可以生成文本,还可输出图像。

与许多学者出身、下场创业的人一样,蓝振忠也深感团队需要一位具有管理经验、资源整合能力强大的 CEO,来一起打造中国版 OpenAI。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3