钛媒体 20小时前
大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

(图片来源:钛媒体 App 编辑林志佳拍摄)

钛媒体 App 10 月 25 日消息,钛媒体 App 独家获悉,AI 大模型领域的独角兽 MiniMax 将于今年 11 月发布对标 GPT-4o 的 Realtime API 服务,将提升端到端实时多模态处理能力,并带来更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交、直播、游戏等多种场景提供服务。

这是 MiniMax 推出的首款端到端实时语音对话产品。消息人士告诉钛媒体 App,内部正在打磨这款产品,并非常希望 11 月发布时产品效果直接对标 OpenAI GPT-4o。

据悉,今年 5 月,OpenAI 公司推出可免费使用的全新旗舰 AI 模型 GPT-4o,可实时进行音频、视觉和文本推理,它可以在短至 232 毫秒、平均 320 毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。在 API 使用方面,相比去年 11 月发布的 GPT-4-turbo,GPT-4o 价格降低一半(50%),速度提升两倍(200%)。

OpenAI CEO 奥尔特曼(Sam Altman)在推文中表示,新的 GPT-4o 是 OpenAI 有史以来最好的模型,它很智能,速度很快,是原生多模态,并且它可供所有 ChatGPT 用户使用,无论是免费版本还是付费 GPT-4 版

今年 10 月,实时语音技术公司、声网的兄弟公司 Agora 作为语音 API 合作者出现在了 OpenAI 发布的 Realtime API 公开测试版中。而 MiniMax 也看到了机会,开始与声网进行合作,声网创始人兼 CEO 赵斌在 RTE 2024 第十届实时互联网大会上表示,声网与 MiniMax 正在打磨中国第一个 Realtime API,基于该 API 的智能体产品,能够与人类进行轻松且流畅的实时语音交流。

除了 MiniMax,目前包括科大讯飞、智谱 AI、商汤科技等中国企业都在研发生成式 AI 对话产品,均与 GPT-4o 效果不相上下,OpenAI 近期也开放了 ChatGPT-4o 对话功能。

根据艾瑞咨询的统计,2021 年,对话式 AI 的市场规模为 45 亿元,带动规模 126 亿元。预计 2026 年,对话式 AI 市场规模将达 108 亿元,带动规模超 385 亿元,五年复合年均增长率(CAGR)达 32.5%。

(本文首发于钛媒体 App,作者|林志佳,编辑|胡润峰)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

钛媒体 独角兽 效果 林志 中国企业
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论