全球首个千亿参数生物医药对话大模型发布,药物研发将进入第四范式?

您所在的位置:网站首页 林锦明简历 全球首个千亿参数生物医药对话大模型发布,药物研发将进入第四范式?

全球首个千亿参数生物医药对话大模型发布,药物研发将进入第四范式?

2024-04-14 11:36| 来源: 网络整理| 查看: 265

0 分享至

用微信扫码二维码

分享至好友和朋友圈

畅想一下,未来在生物医药行业大模型中最有可能出现的超级应用是什么?

这场活动或许能给你一个答案。9月21日,“水木分子发布会暨生物医药大模型论坛” 在清华智能产业研究院举行。水木分子所研发的新一代对话式药物研发助手ChatDD 及全球首个千亿参数多模态生物医药对话大模型ChatDD-FM 100B成为本场活动的焦点。

清华大学智能产业研究院(AIR)院长张亚勤院士、AIR首席研究员兼水木分子首席科学家聂再清教授,以及复星医药、阿里云、医药魔方、华润双鹤等公司代表出席了活动并围绕ChatDD 和生物医药对话大模型的机遇与挑战进行了深入探讨。

ChatDD将引领第四代药物研发新范式?

“ChatDD 通过人机协作对话方式有效地将专家知识与大模型知识相联结,开拓了继传统药物研发TMDD、CADD、AIDD之后的第四代药物研发新模式。”张亚勤院士说道。

图 | 清华大学智能产业研究院院长 张亚勤院士

药物研发是一件漫长且艰难的事情,“10年、10亿美金、10%的成功率”常被认为是医药研发行业难以打破的“魔咒”。

传统的药物研发(Traditional Manual Drug Discovery & Design, TMDD)过程依赖于研究人员的手工合成、提取和筛选,药物的发现主要靠大量试错和经验主义。这种药物研发方式必然存在耗时长、成本高等问题。

到了20世纪中叶,计算机的介入为药物研发的提速带来了支撑。计算机辅助的药物研发(Computer-Aided Drug Discovery & Design, CADD)在药物发现和设计方面有了明显加速。计算机作为药物研发的工具,逐渐可以解决单个问题。

随着人工智能的快速发展,药物研发也被带入到了AI制药(AI Drug Discovery & Design, AIDD)时代。依靠大规模高质量标注数据,曾经混乱的信息局部被理清,研究人员也开始尝试“有的放矢”。在AI技术加持下,更多药物研发的可能性被看到。

但由于信息与知识分离、工具服务分散等问题,AI还未能与研究人员在药物研发上形成完美的配合。ChatDD (Chat Drug Discovery & Design) 基于大模型能力,则能够对多模态数据进行融合理解,与专家自然交互人机协作,将人类专家知识与大模型知识联结,具备问题理解、任务拆解、工具调用等能力,或有可能重新定义药物研发模式。

ChatDD能力的“赋予者”是本次发布会的另一个亮点——全球首个千亿参数生物医药多模态对话大模型ChatDD-FM 100B。在通用语言模型基础上经过“生物医药专业知识增强”、“生物医药多模态对齐”、“专业对话和工具调用指令微调”的三层淬炼,ChatDD-FM 100B获得了喜人的成绩。据悉,在C- Eval评测中ChatDD-FM 100B达到全部医学4项专业第一,也是这四项任务唯一平均分超过90分的模型。

如果说新药研发是在一间小黑屋里寻找珍珠,AI像缝隙里透出的一束光照亮了屋子的一个角落,那么ChatDD就像一盏灯时刻陪伴着科研人员,让其脚下的路更清晰,并告诉科研人员可能还有新的屋子。

图 | 清华AIR首席研究员、水木分子首席科学家 聂再清教授

解决药物研发多环节痛点

如此贴心的模式落到药物研发的各个环节中又是怎样发挥作用呢?水木分子团队进行了详细地展示。

立项调研、早期临床前研究、临床试验等每个环节在药物研发过程中都十分重要,任何一个环节的失败都可能随时让项目终止。面对这些环节的核心痛点,ChatDD化身“多场景助手”,通过ChatDD-BI、ChatDD-Discovery和ChatDD-Trial 分别出现在立项场景、研发探索场景和临床试验场景中。

立项调研作为药物研发的第一步,其正确性决定了后面所有环节的意义。但这项工作需要从众多繁杂的信息中筛选出对企业来说最有价值的信息,费时费力、依赖专家判断,且难以外包给第三方。针对这一痛点,ChatDD-BI通过与专家的数轮对话,快速提供准确、全面的信息,辅助立项调研,提升立项效率和质量。在发布会现场的产品Demo演示中,可以看到ChatDD接入了医药魔方数据库,通过问答的方式,为用户高效输出了最新数据。

图 | 发布会现场研究人员进行Demo展示

随着技术的更新迭代,早期临床前研究中“低垂的果实”越来越少,想要有更多的突破就要想办法摘“高处的果实”。面对这样的需求,ChatDD-Discovery 可以处理生物医药多模态数据,为科研人员提供更多“灵感”。通过对如分子、蛋白质、基因序列以及已知靶点、治疗方法等信息的掌握,让潜在靶点更有可能出现在科研人员的视野中。

面对药物研发中耗资最多、风险最大的关键环节——临床试验,ChatDD-Trial可通过辅助寻找最适合入组的患者、患者精准分类、患者与试验药物的匹配度来帮助临床试验研究人员更顺利地完成试验并提高成功率。

高质量数据助力药物研发大模型

在“生物医药行业大模型面临的机遇与挑战”论坛中,几位嘉宾对行业大模型的未来进行了畅想,同样也对其挑战进行了分析。

图 | “生物医药行业大模型面临的机遇与挑战”论坛讨论

华润双鹤首席科学家周宜遂分享了自己的一些期待。“行业大模型能否实现医药研发的全面加速、降低企业成本、减少客户风险,甚至是真正实现人脑所不能及的事,设计出人类没有想到的药物,这些都是我们很想看到的。”

此外,几位嘉宾都表示高质量数据对生物医药研发大模型来说十分重要,也坦言这是行业大模型遇到的挑战之一。

“数据一直是一件让我睡不着觉的事。企业级的数据质量够不够、可不可信、能不能反映企业的原本情况?医药行业的数据与数据之间是否是割裂的,未来是否有可能共享,并通过大模型实现更多的价值?这些都是我们需要去解答的。”复星医药首席数据官林锦斌对高质量数据提出了需求。

“高质量行业数据是非常重要的,也是行业大模型面临的挑战。如果仅仅只是凑一大堆数据给大模型输入是没有用的,我们需要的是对大模型有价值的、输入之后能解决客户问题的数据。”阿里云行业大模型首席科学家王浩说道。

医药魔方创始人周立运分析道:“作为医药行业一站式大数据服务平台,经过近十年的努力,医药魔方已经积淀了庞大的、用于企业决策的高质量医药数据资产,可以为ChatDD提供独一无二的数据语料。医药魔方+ChatDD,必将给行业带来独特的产品和价值。”

聂再清教授透露,针对高质量数据来源方面,ChatDD大模型使用的是开源数据,同时结合了医药魔方的实时数据,为研究人员提供更精准的信息。据了解,水木分子和医药魔方基于数据正在推进深度合作。

随着 ChatGPT 的大火,AI 大模型成为关注焦点,ChatGPT 也被认为是AI的“iPhone时刻”。在被问及“大模型在医药研发领域的‘iPhone时刻’会在什么时候到来”时,聂再清教授笑着答道:“等ChatDD被全面应用的时候。”

回到文章开头的问题,未来在生物医药行业大模型中最有可能出现的超级应用是什么?聂再清教授给出的答案是:ChatDD!

Copyright © 2023 PHARMCUBE. All Rights Reserved.

欢迎转发分享及合理引用,引用时请在显要位置标明文章来源;如需转载,请给微信公众号后台留言或发送消息,并注明公众号名称及ID。

免责申明:本微信文章中的信息仅供一般参考之用,不可直接作为决策内容,医药魔方不对任何主体因使用本文内容而导致的任何损失承担责任。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/ 返回网易首页 下载网易新闻客户端


【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3