智东西 前天
豆包大模型家族更新!豆包每日Token调用量达30万亿,大涨253倍
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 程茜

编辑 | 李水青

智东西 10 月 16 日报道,今天,在 FORCE LINK AI 创新巡展 · 武汉站上,火山引擎升级了豆包大模型 1.6,原生支持 4 种思考长度,并发布豆包大模型 1.6 lite、豆包语音合成模型 2.0、豆包声音复刻模型 2.0 三款模型。

为了平衡企业在不同场景下对模型效果、时延、成本的不同需求,豆包大模型 1.6 支持 Minimal、Low、Medium、High 四种思考长度,火山引擎总裁谭待称,这是国内首个原生支持 " 分档调节思考长度 " 的模型。

此外,为了帮助企业平衡模型效果与成本,火山引擎还发布 " 智能模型路由 " 方案,支持豆包大模型、DeepSeek、Qwen、Kimi 等多种主流模型的智能选择调用。

豆包团队透露,以 DeepSeek 为例,经过实测,在效果优先模式下,智能路由后,模型效果相比直接使用 DeepSeek-V3.1 提升 14%;在成本优先模式下,在实现 DeepSeek-V3.1 相似效果的条件下,模型的综合成本最高下降超过 70%。

火山引擎总裁谭待透露,去年 5 月发布至今,豆包大模型的每日 Token 调用量达到 1200 亿,今年 5 月,达到 1.6 万亿,9 月达到 30 万亿每天,实现了 253 倍的增长。在企业市场,根据 IDC 的报告,今年上半年火山引擎在中国公有云的这个大模型的服务调用量上居第一,市场份额达到 49.2%。

一、国内首个分档调节思考长度模型,低强度模式总 Token 输出下降超 70%

火山引擎总裁谭待提到,今年 AI 有三个比较明显的趋势,第一是具备多模态理解能力的深度思考模型不断,第二是视频图像等模型的能力已经逐步达到生产级水平,第三是企业级 Agent 正逐步走向成熟。

今年 6 月,豆包推出具有多模态理解能力的深度思考模型 Doubao-Seed-1.6。

综合来看,Doubao-Seed-1.6 实现了开启思考模型后,模型效果提升 31%,但这也增加了推理成本,实时场景下 CoT Tokens 占总数出比例超 77%,所以有 82% 的企业选择不打开深度思考模式。

基于此,昨天,豆包推出 Doubao-Seed-1.6-1015 新版本,支持分档深度思考长度,企业可以根据需求在不同场景下选择相应思考长度。

低强度模式下,Doubao-Seed-1.6-1015 新版本可以在相同模型效果下,使得总输出 Tokens 下降 77.5%,深度思考时间下降 84.6%。

此外,豆包还发布了 Doubao-Seed-1.6-lite,该模型尺寸更小,效果超越 Doubao-Seed-1.5-Pro。0-32K 上下文区间内,Doubao-Seed-1.6-lite 总和成本相比 Doubao-Seed-1.5-Pro 下降了 53%。

二、发布语音合成、声音复刻新模型,新推智能模型路由方案

在多模态模型方面,火山引擎此前发布最新图像创作模型 Seed Dream 4.0,提升了文生图、图生图、图生图能力。一张照片生成对应手办、一张照片生成手帐等。

豆包语音模型已经逐步覆盖从语音合成到语音识别、声音复刻、实时语音、同声传译等不同的领域,以智能终端为例,目前豆包语音模型已经覆盖了超过 4.6 亿台的智能终端。

今天发布豆包语音合成模型 2.0 和声音复刻模型 2.0,其采取对话式合成模式,并增强了在情感和演绎指令遵循。语音合成模型针对小学到高中全阶段的学科基本对应的公式,合成准确率达到 90% 以上。

对比传统的软件,Agent 能端到端处理任务,自主解决更复杂问题,在编程方面,火山引擎不断开源开源矩阵,其国内首个 AI 原生 IDE 平台 TRAE 和 AI Agent 开发平台扣子已经服务了数百万开发者。

为了帮助企业进行智能模型选择,火山引擎还推出了智能模型路由方案,该方案支持不同的模式,如平衡模式、效果优先模式、成本优先模式,定好不同模式的目标之后,模型就会根据对应的请求自动选择最合适的模型。该平台支持豆包全系列模型以及 DeepSeek、Qwen、Kimi 等业界主流开源模型。

豆包团队透露,以 DeepSeek 为例,经过实测,在效果优先模式下,智能路由后,模型效果相比直接使用 DeepSeek-V3.1 提升 14%;在成本优先模式下,在实现 DeepSeek-V3.1 相似效果的条件下,模型的综合成本最高下降超过 70%。

三、将推扣子空间企业版,满足企业个性化定制需求

为了帮助企业做好 AI 转型,火山引擎还将 Agent 和传统的各种存量系统进行了打通,通过 HiAgent 平台,构造了一 +N+X 的体系,帮助企业打造统一 Agent 界面,包含 1 个统一交互入口、N 个企业通用智慧助手以及 X 个企业定制智能体应用。

2024 年,低代码 Agent 开发平台扣子发布,其中预置智能客服助手、写作助手等模版,还会提供插件、可视化界面、数据库等各项功能。

今年 4 月,火山引擎发布面向办公场景的 AI Agent 产品扣子空间,目前已经服务了上百万知识工作者,包括股票分析师、老师、电商运营等。

接下来,扣子空间计划推出企业版,满足企业的个性化需求。

其有两大特点,一是定制化的 Agent,企业可以自定义更加符合自身业务需求的个性化智能体,二是 MCP 开发,企业可以通过 API 为自己的 Agent 增加私有化的技能,三是数据连接器、企业知识库,可以帮助企业链接内部数据,最后是企业级系统管理,为企业提供不同权限管理模式。

结语:火山引擎正帮企业进一步扫清落地障碍

火山引擎此次更新凸显出的关键是,其正在帮助企业更便捷、快速且在成本可控的程度下用上大模型,豆包大模型 1.6 版本首创四档思考长度调节功能,实现了模型性能与成本控制的动态平衡。

此前,Agent 的商业化落地受困于高 Token 消耗带来的成本压力,此次火山引擎的更新为这一瓶颈提出了有效路径,或许可以加速 Agent 的规模化应用。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

kimi 效果 武汉 语音合成
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论