DoNews 9小时前
谭待端上字节AI全家桶,这次是真能打
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 / 梁添  

来源 / 节点 AI  

6 月 23 日,火山引擎一年一度的 FORCE 大会。

如果用一句话概括发生了什么,那就是,字节把 AI 全家桶摆上桌了,补上了 coding 能力,还顺手把价格打到了地板上。

豆包大模型 2.1 Pro 正式发布,编程能力追平 Claude Opus 4.7,价格只要对方的 20%。视频模型 Seedance 2.5 直接生成 30 秒视频,还带了一个音频模型和升级图像模型。

火山引擎总裁谭待也交了一组成绩单,截至今年 6 月,豆包大模型日均 Token 调用量 180 万亿,两年增长 1500 倍。公有云市场份额 49.5%,几乎占了半壁江山。年消费超 1 万亿 Token 的企业客户从 100 家翻到了 200 家。

数字很炸。

但今天真正值得聊的,不是哪个评测又出了高分,而是字节在 AI 这件事上,长板更长,也补齐了短板。

发力编程和 Agent

过去一年,字节一直是一个 ai 赛道优秀的偏科生——多模态第一,豆包 app 在 C 端热度高涨,Seedance 视频模型更是吊打全场,可惜,一到编程考试就插不上话。

2025 年恰好是 AI Coding 爆发的一年。Anthropic 凭借编程和 Agent 能力甚至把 OpenAI 都甩在了后面。Cursor 成了开发者标配工具,小龙虾把大众对 Agent 的理解往前推了一大步。

现在这条最热的赛道上,字节终于发力了。

这次豆包 2.1 Pro 就是来补课的。具体跑分就不一一念了,总之在主流编程和 Agent 评测里基本都进了全球前三。

更直观的是现场那个案例,豆包 2.1 Pro 接了一个芯片设计的活,连续跑了 18 小时、9 轮迭代,跑通了仿真测试,这种活正常要 3 到 5 个资深工程师干好几周。一个模型顶一个工程师小组。

另一个例子是 3D 虚拟城市场景。依托豆包 2.1 Pro 搭建的系统,可以实现 500 余个智能 Agent 同步协作,完成上千轮工具调用,生成超百栋建筑。

看完给我的感受就是,在 Coding 领域豆包终于上桌了。

字节做 AI 的风格一直很字节,你做什么我也做,但我要做到更便宜。

豆包 2.1 Pro 定价:输入 6 元 / 百万 Token,输出 30 元 / 百万 Token,缓存命中 1.2 元。综合成本比 Claude Opus 系列便宜接近 80%。高频调用的 Turbo 版价格再砍一半。

考虑到多模态能力的差距,这个价格在当前市场上还是很能打。

谭待在大会上讲了一个我觉得挺有意思的逻辑:不要只看 Token 标价,要看 Token 能创造的业务价值。

他的判断是,虽然主流模型单 Token 价格在涨,但单 Token 创造的业务价值涨幅更大,整体性价比其实在提升。这话翻译一下,我们涨价了,但你赚得更多了,所以你应该觉得很划算。

他举了一个有说服力的例子。Seedance 2.0 上线前,视频生成模型的周末调用量远高于工作日,说明大家当玩具用。上线之后,工作日调用全面反超周末。制造业、自动驾驶、具身智能的企业,开始把视频生成真正嵌入生产流程。

用户行为从周末玩变成周一到周五用,这可能是证明 AI 从玩具变成工具最直接的数据。

视频生成的天花板又被拉高了

多模态是字节最有底气声量最大的赛道。要知道去年多模态还是 Google 的天下,但今年年初 Seedance2.0 横空出世,字节一跃成为多模态领域的天花板玩家。这次也没让大家失望。

从预告看,Seedance 2.5 实用性更强了。单条视频最长达到了 30 秒,支持最多 50 个全模态素材联合输入,还新增 3D 白模预演能力。

据说灵感来自一位知名导演,他在合作中提出,科幻片和大场景调度里 3D 白模是前期预演的核心工具,但传统制作太费时费力,Seedance 据此开发了这个功能。

同时,Seedance 2.0 在画质上也升级到了原生 4K 直出,这个水准已经可以进入专业影视后期。

此外还有两个新模型,Seedream 5.0 Pro,新增了交互式精准编辑和多图层分离;豆包音频模型 1.0 支持根据文本自动推理角色声音,一次生成包含对白、音效、背景音乐的完整音轨。现场还演示了一段古风武侠片,从人声到兵器碰撞声全部 AI 生成,一分钟,音色不漂移。

一场发布会,字节把文字、图片、视频、音频全模态产品线拉齐了。

大会上还有一个有意思的发布,周星驰《喜剧之王》《食神》《长江七号》三部经典 IP 授权入驻火山引擎的 AI 版权商业化平台,用户可以在抖音、即梦、剪映上用官方模板做二创。

这件事的意义重大。对于一直困扰 AI 视频生成的版权问题,这是一个值得关注的解法。谭待也提到,Seedance 2.0 其实春节前就开发完了,但拖到 4 月才开放 API,中间几个月全部用来搭版权保护和人脸管控的安全体系。" 安全不是业务的限制,是商业化的前提。"

产业落地方面,名单上的公司也挺有说服力。

特斯拉全系车型基于豆包做智能语音车控,奔驰新款 CLA 接入豆包支持自然对话,顺丰用 AgentKit 搭建全场景 AI 办公助理,新东方做 AI 助教覆盖口语练习和作文批改,中国石油用安全运营 Agent 做异常告警自动值守。从车企到物流到教育到能源,字节的 AI 确实在往各行各业渗透。

如果把今天的发布会浓缩成一句话,大概是,字节终于从多模态很强但编程较弱变成了都不错。

在 AI 竞争的当前阶段,均衡发展的能力,可能比偏科型更有商业价值。在企业真实采购决策中,一个能看图、能写代码、能做 Agent、还便宜,很可能会赢过一个编程满分但什么都看不了的模型。

豆包 180 万亿日均调用量和 49.5% 市场份额已经说明了问题,这个数字不是靠评测刷出来的,是企业客户真金白银 pick 出来的。

谭待说了一句话我觉得挺实在的,国内 AI 市场大概相当于跑了 1 公里,刚刚跨过生产级门槛,未来还有十倍甚至百倍的增长空间。

字节跳动在 AI 上的打法,和它做所有事情一样,不一定是第一个做的,但一定要做到足够大、足够便宜、足够全面。至于这套打法在 AI 时代还灵不灵,180 万亿 Token,大概就是市场给出的答案。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 编程 工程师 考试 成绩单
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…