
作者 | 毕伟豪
编辑 | 心缘
智东西 6 月 23 日报道,今日,在 FORCE 原动力大会上,火山引擎推出豆包大模型 2.1,同时预告了视频生成模型 Seedance 2.5、图像创作模型 Seedream 5.0 Pro 以及豆包音频生成模型 1.0 的发布。
豆包大模型 2.1 在通用 Agent、编程能力以及多模态水平上有所提升,包括豆包大模型 2.1 Pro 和豆包大模型 2.1 Turbo,其中豆包大模型 2.1 Pro 在编程能力上接近 Opus 4.7。
价格方面,豆包大模型 2.1 Pro 统一定价为输入 6 元、输出 30 元,缓存命中 1.2 元,综合使用成本相比 Claude Opus 4.6 到 4.8 系列模型降低接近 80%。同时,面向高频调用场景的豆包 2.1 Turbo 同步上线,价格仅为 2.1 Pro 的一半。

大会还预告了即将发布的 Seedance 2.5、Seedream 5.0 Pro 以及豆包音频模型 1.0,其中,Seedance 2.5 将单条视频生成拉长至 30 秒,Seedream 5.0 Pro 新增了圈选编辑和多图层分离能力,豆包音频生成模型 1.0 则实现了角色音色自动推理和影视级音效一次性生成。Seedance 2.0 也做了升级,支持原生 4k 视频直出。



一、Coding 能力追平 Opus 4.7,成本低 80%
豆包大模型 2.1 Pro 是本场发布会的第一颗重磅炸弹。
编程评测中,豆包大模型 2.1 Pro 与 Claude Opus 4.7 基本持平,在 SciCode 科学计算评测中拿到 59.8 分,超过 Opus 4.7 和 GPT-5.5,在 NL2Repo 仓库级代码生成评测中,豆包大模型 2.1 Pro 得分 47,明显领先 GPT-5.5 和 Gemini 3.1。




开发者结合豆包 2.1 Pro 的多模态能力,让 500 多个 Agent 协同作业,在跨工具的完整链路中依次调用建模、渲染、贴图等 11 种工具,累计触发工具调用上千次,最终在一张大地图上完成了 100 多栋造型、材质、颜色均不相同的建筑的搭建,并通过多轮自我迭代生成全景成片。

二、视频、音频、图像模型齐发,Seedance 2.5 预计 7 月上线
视频生成是火山引擎声量最大的赛道,今年 2 月发布的 Seedance 2.0 被该团队称为 " 全球第一个跨过生产质变点的视频生成模型 ",这次预告的 Seedance 2.5 在多个维度上做了升级:单条视频最长 30 秒,目前市场同类产品最多 15 到 20 秒,全球第一。多参考输入支持最多 50 个全模态素材联合输入,同样是全球最高。


画质方面,Seedance 2.5 生成的 AI 素材可以直接进入专业影视后期,新增的编辑能力支持局部修改,如微调背景、更换商品和模特等。
图像方面,Seedream 5.0 Pro 主推三个能力:
1、交互式精准编辑。用户可以画箭头、圈选区、用自然语言描述空间关系,模型理解意图定位到指定元素修改。
2、多图层分离。可递归拆分图层,拆分后底板自动智能填充。
3、高信息密度排版。单张图可承载整页 PPT 级别信息,支持英文、西班牙语、阿拉伯语、日语等 10 余种文字,自动适配各语言排版习惯和文化风格。
音频方面,豆包音频模型 1.0 首次亮相。模型可以根据文本自动推理角色声音特征,一次生成包含情绪表达、方言口音、背景音乐、环境氛围音、拟音特效的完整影视级音轨。
发布会演示了一段古风武侠片,从人物对白到环境雨声、兵器撞击声全部由模型生成,时长近一分钟,音色不漂移、角色声音特征一致。

火山引擎在大会上正式预览了 AI 版权商业化平台,周星驰成为首批合作对象。他以《喜剧之王》《食神》《长江七号》三部经典 IP 授权入驻,用户可在抖音、即梦、剪映等平台用官方模板进行二创。

特斯拉基于豆包大模型打造智能语音车控,覆盖全系车型,接入了端到端实时语音模型。奔驰新款纯电 CLA 接入豆包大模型,支持自然对话和情绪感知。东风汽车今年 4 月与火山引擎达成战略合作,围绕智能座舱企业数智化升级等领域展开深度合作。

运输、教育等行业中,顺丰依托 AgentKit 构建覆盖研发到调度的全场景 AI 办公助理。新东方用豆包打造 AI 助教,覆盖口语练习、作文批改、个性化学习。
支柱产业中,中国石油勘探院用上了安全运营 Agent,异常告警实现 AI 自动化值守,运营效率提升 10 倍。中国移动与火山引擎联合推出移动引擎机密模型服务,面向政务、金融、能源行业提供国产算力一体化的机密模型服务。
四、HiAgent 3.0 全新升级,一键招募数字员工
企业级产品线上,HiAgent 3.0 是本次最重要的发布。IDC 报告显示,HiAgent 在中国智能体开发平台产品力进入领导者象限且位列第一,市场份额 17.8%,同样行业第一,超过第二名和第三名总和。
数字员工管理方面引入了一套完整机制:
企业可以在员工市场一键雇佣活动策划等数字员工,把已有的各类智能体快速接入统一管理。数字员工上岗前必须通过考核,系统提供通用考核模板,评估回答准确率、幻觉率、延迟、安全合规等指标,企业也可上传自己的评测集。
通过考核后,调度中枢会基于业务目标自动拆解任务、分发给不同数字员工协同执行。管理者则可以通过数字员工大盘统一查看状态。同时,分布式 Harness(Hive)记录不同 Agent 的运行轨迹、业务反馈和成功做法,总结到全局经验中,越用越聪明。


豆包大模型 2.1 Pro 编程能力对标 Opus 4.7,价格打 2 折,Seedance 2.5 视频生成 30 秒直出全球第一,音频模型、图像模型齐齐亮相,字节跳动在 FORCE 原动力大会上展示了其全模态发展的路径,从质量到价格全方位升级。
此外,在企业管理、产业落地、商业化拓展等方面,都充斥着字节系 AI 产品的身影,其全模态发展,全行业落地的目标已然清晰可见。


登录后才可以发布评论哦
打开小程序可以发布评论哦