谷歌的又一波反击!开放大语言模型PaLM API

您所在的位置:网站首页 谷歌调整语言 谷歌的又一波反击!开放大语言模型PaLM API

谷歌的又一波反击!开放大语言模型PaLM API

#谷歌的又一波反击!开放大语言模型PaLM API| 来源: 网络整理| 查看: 265

关注“FightingCV”公众号

回复“AI”即可获得超100G人工智能的教程

点击进入→FightingCV交流群

事到如今,OpenAI 的 ChatGPT 在 AI 社区的统治地位已经无需多言。特别是 OpenAI 开放 ChatGPT 的 API 之后,在开发者社区掌握了极大的话语权。

反观谷歌那边,在第一波发布 Bard 失利之后,一直处于沉默状态。

但在今日,谷歌组织了第二波反击:开放自家的大语言模型 API 「PaLM API」,此外今天谷歌还发布了一款帮助开发者快速构建 AI 程序的工具 MakerSuite。谷歌表示,此举是为了帮助开发者们快速构建生成式 AI 应用。

但略为遗憾的是,谷歌目前是向选定的开发人员提供这些工具,而非全面开放。

基于 PaLM 模型的 API

毫无疑问,PaLM API 是今天谷歌发布的公告的核心。

谷歌介绍称,PaLM API 是 Google 大型语言模型的入口,可用于各种应用程序。它将为开发者提供面向对轮交互而优化的模型,如内容生成与对话。它也能为开发者提供摘要、分类等多种任务的通用模型。

从名字可以开出,此次开放的大语言模型 API 是基于谷歌去年发布的 PaLM。这是谷歌基于 Pathways 系统训练的一个 5400 亿参数的大型语言模型。

为了训练这个模型,谷歌动用了 6144 块 TPU,让 Pathways 在两个 Cloud TPU v4 Pods 上训练 PaLM。

强大的系统和算力投入带来了惊艳的结果。谷歌在数百个语言理解和生成任务上评估了 PaLM,发现它在大多数任务上实现了 SOTA 少样本学习性能,可以出色地完成笑话解读、bug 修复、从表情符号中猜电影等语言、代码任务。

随着规模的增加,模型在处理多个任务时的性能逐渐提高,而且还在不断解锁新的能力

关于 PaLM,读者们可以查看论文《PaLM: Scaling Language Modeling with Pathways》。

此外,谷歌公告称,后续会开放更多规模与功能不同的模型。PaLM 是谷歌选择的第一个版本,所以后续我们也可以期待下 LaMDA API 等。

MakerSuite 工具

在过去的几年里,谷歌一直在构建和部署大型语言模型 —— 从将 MUM 引入搜索到在 AI Test Kitchen 中使用 LaMDA 构建 APP。谷歌表示,开发人员必须使用不同的工具来完成任务,例如制作和迭代 prompt、生成合成数据以及精调自定义模型。

MakerSuite 是一种简化此工作流程的工具,让用户将能够根据 prompt 进行迭代,使用合成数据扩充数据集,并轻松调整自定义模型。当你准备好编程时,MakerSuite 允许将 prompt 导出为你最喜欢的语言和框架(如 Python 和 Node.js)的代码。

谷歌表示,借助 MakerSuite,你能够直接在浏览器中快速测试和迭代调整后的模型。

最后补充一句我们观察到的结果:谷歌今日的两篇博客发布后,似乎已经引起了一些人的不满:并非全面开放、也没有定价。也许,可以说相比之前 ChatGPT API 的开放,谷歌这一波反击,也略显失败。

原文链接:https://blog.google/technology/ai/ai-developers-google-cloud-workspace/

往期回顾

基础知识

【CV知识点汇总与解析】|损失函数篇

【CV知识点汇总与解析】|激活函数篇

【CV知识点汇总与解析】| optimizer和学习率篇

【CV知识点汇总与解析】| 正则化篇

【CV知识点汇总与解析】| 参数初始化篇

【CV知识点汇总与解析】| 卷积和池化篇 (超多图警告)

【CV知识点汇总与解析】| 技术发展篇 (超详细!!!)

最新论文解析

NeurIPS2022 Spotlight | TANGO:一种基于光照分解实现逼真稳健的文本驱动3D风格化

ECCV2022 Oral | 微软提出UNICORN,统一文本生成与边框预测任务

NeurIPS 2022 | VideoMAE:南大&腾讯联合提出第一个视频版MAE框架,遮盖率达到90%

NeurIPS 2022 | 清华大学提出OrdinalCLIP,基于序数提示学习的语言引导有序回归

SlowFast Network:用于计算机视觉视频理解的双模CNN

WACV2022 | 一张图片只值五句话吗?UAB提出图像-文本匹配语义的新视角!

CVPR2022 | Attention机制是为了找最相关的item?中科大团队反其道而行之!

ECCV2022 Oral | SeqTR:一个简单而通用的 Visual Grounding网络

如何训练用于图像检索的Vision Transformer?Facebook研究员解决了这个问题!

ICLR22 Workshop | 用两个模型解决一个任务,意大利学者提出维基百科上的高效检索模型

See Finer, See More!腾讯&上交提出IVT,越看越精细,进行精细全面的跨模态对比!

MM2022|兼具低级和高级表征,百度提出利用显式高级语义增强视频文本检索

MM2022 | 用StyleGAN进行数据增强,真的太好用了

MM2022 | 在特征空间中的多模态数据增强方法

ECCV2022|港中文MM Lab证明Frozen的CLIP 模型是高效视频学习者

ECCV2022|只能11%的参数就能优于Swin,微软提出快速预训练蒸馏方法TinyViT

CVPR2022|比VinVL快一万倍!人大提出交互协同的双流视觉语言预训练模型COTS,又快又好!

CVPR2022 Oral|通过多尺度token聚合分流自注意力,代码已开源

CVPR Oral | 谷歌&斯坦福(李飞飞组)提出TIRG,用组合的文本和图像来进行图像检索



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3