ChatGPT推出新“朗读”功能支持多语言与声音；使用大型语言模型增强分类数据集

您所在的位置：网站首页 › 发布图文的时候文本朗读在哪里 › ChatGPT推出新“朗读”功能支持多语言与声音；使用大型语言模型增强分类数据集

ChatGPT推出新“朗读”功能支持多语言与声音；使用大型语言模型增强分类数据集

2024-07-12 05:41| 来源: 网络整理| 查看: 265

在这里插入图片描述

🦉 AI新闻 🚀 ChatGPT推出新“朗读”功能支持多语言与声音

摘要：OpenAI最新为其流行的聊天机器人ChatGPT引入了一项名为“朗读”的功能，这使得ChatGPT能用五种不同的声音朗读回复，并支持37种语言的自动检测与朗读。这一功能旨在简化用户交互过程，现已在ChatGPT的网页端和移动应用程序中上线。此更新不仅展示了OpenAI在推进人工智能模型多模态交互方面的持续努力，同时也跟随了行业内其他竞争者的步伐。ChatGPT此前已经推出了语音聊天功能，而“朗读”功能则进一步增强了用户体验，允许用户选择性地将文本回复声音化，甚至设定为默认回复方式。

🚀 Claude 3超越GPT-4，成为全球最强AI模型

摘要：OpenAI的不败神话被打破，Claude 3一夜之间超越GPT-4，成为市场上最强大的模型，并获得了广泛的关注与好评。它不仅在性能上全面超越GPT-4，还推出了不同版本以满足用户需求，涵盖了视频解读、编程、多模态能力等多个领域的先进能力，甚至在自我描述上也展现出了高度的创造性和深度。此外，背后的公司Anthropic由多名不满OpenAI方向的前员工创立，致力于解决AI的安全问题。Claude 3的出现不仅标志着技术的进步，也引发了关于AI发展方向和伦理的深刻思考。

🚀 马斯克对AI技术的发展和影响表达担忧

摘要：特斯拉CEO埃隆·马斯克在博世互联世界大会上讨论了AI、AGI、自动驾驶和机器人技术等话题。马斯克表达了他对AI技术可能失控的担忧，强调了监管和防护的重要性。他提到特斯拉即将实现完全自动驾驶，并指出生成式AI发展迅速，能快速生成内容和图像。马斯克认为我们正在经历可能是历史上最大的科技革命，同时担忧技术发展可能对人类造成的影响。他还提到了GPU短缺和预测的电力以及变压器短缺将是技术突破面临的挑战。

🚀 台积电股价创新高，AI订单推动增长

摘要：台积电公司的股价自1994年以来达到新高，目前为730元新台币，市值高达18.93万亿元。从2024年年初至今，股价已经上涨了23.10%。这次股价上涨主要是由于AI浪潮带来的订单增长，特别是苹果和英伟达的大量订单。2023年，英伟达的订单占台积电营收的11%，而苹果支付给台积电的金额占总营收的25%。这显示了台积电在全球半导体市场中的重要地位及其产品对于技术巨头的重要性。

🚀 苹果股价2024年新低，被AI浪潮冲击

摘要：2024年受到AI浪潮的推动，英伟达、AMD等公司市值急剧上升，而苹果公司却因多项负面消息导致股价创2024年新低，报每股170.12美元，年内下跌8.3%。负面影响来源包括取消汽车项目、MicroLED版Apple Watch Ultra难产、面对欧洲新规被罚款18.4亿欧元、在中国市场销量下滑以及在AI领域的布局相对滞后。即便如此，苹果CEO蒂姆·库克表示2024年将在生成式人工智能领域取得突破。

🚀 Windows 11引入AI功能升级文件管理器

摘要：微软计划在未来的Windows 11系统更新中，为文件管理器带来丰富的AI功能，将其作为未来AI PC的主要卖点之一。更新后，用户将能通过自然语言的方式与文件管理器交互，例如通过语音命令查找文档和图片，而且文件管理器能理解更复杂的指令。此外，文件管理器还将支持包括背景移除在内的多种AI功能，提供更加智能化的体验。

🚀 武汉将发布“紫东太初”3.0，助力智能驾驶

摘要：武汉人工智能研究院计划于今年上半年发布“紫东太初”3.0版本。该模型由武汉人工智能研究院联合中国科学院自动化研究所自主研发，自2021年首版发布以来已迭代至2.0版。紫东太初3.0旨在进一步提升大模型在各行各业的应用能力，并特别强化在智能驾驶领域的功能，包括自动标注数据、优化训练过程、预测环境信息等。此举预期将极大提升智能汽车的感知和决策能力。

🗼 AI知识 🔥 Stable Diffusion 3研究报告

Stable Diffusion 3采用新的Multimodal Diffusion Transformer (MMDiT)架构，在排版和提示遵循方面优于DALL·E 3、Midjourney v6和Ideogram v1等最先进的文本到图像生成系统。 MMDiT架构使用独立的权重集合来处理图像和语言表示，从而提高了文本理解和拼写能力，相较于SD3的先前版本有了显著的改进。 Stable Diffusion 3的Rectified Flow (RF)公式和MMDiT骨干结构对文本到图像合成进行了扩展和提升，通过缩短推理路径和改进采样调度等方法，展现了出色的性能。

🔥 使用大型语言模型增强分类数据集

介绍了如何利用大型语言模型（LLMs）如Mistral Large来增强情感分析数据集，以及如何使用Axolotl进行模型微调。通过Mistral Large生成情感标签的推理，并使用Axolotl进行微调，最终创建了一个能够解释情感分类任务推理的模型。

更多AI工具，参考国内AiBard123，Github-AiBard123

【本文地址】

ChatGPT推出新“朗读”功能支持多语言与声音；使用大型语言模型增强分类数据集

ChatGPT推出新“朗读”功能支持多语言与声音；使用大型语言模型增强分类数据集

今日新闻

推荐新闻

ChatGPT推出新“朗读”功能 支持多语言与声音；使用大型语言模型增强分类数据集

ChatGPT推出新“朗读”功能 支持多语言与声音；使用大型语言模型增强分类数据集

今日新闻

推荐新闻

ChatGPT推出新“朗读”功能支持多语言与声音；使用大型语言模型增强分类数据集

ChatGPT推出新“朗读”功能支持多语言与声音；使用大型语言模型增强分类数据集