如何证明自家的模型是行业一流水平?跟 DeepSeek 比一比。
随着 DeepSeek 爆火,2025 年的大模型市场,DeepSeek 就像手机圈的 iPhone 一样,成了各家模型厂商发布新品时的最新对标对象。
除了模型能力上号称超过 DeepSeek 之外,上述对标更直观的表现在价格上。
在今天百度文心大模型 4.5 Turbo、文心大模型 X1 Turbo 发布时,百度创始人李彦宏就吐槽 DeepSeek 也不是万能的。除了能力上只能处理文本,还不能理解和生成图片、音频、视频等多媒体内容、幻觉率高外,李彦宏认为使用 DeepSeek 更大的问题是慢和贵," 中国市场上绝大多数的大模型 API 调用价格都比 DeepSeek 满血版要低,而且速度也更快。"
当然,其中也包括最新发布的文心 4.5 Turbo 和文心 X1 Turbo。官方数据显示,文心 4.5 Turbo 每百万 token 的输入价格为 0.8 元,输出价格 3.2 元。
作为对比,即便在打五折后的优惠时段(00:30-8:30),DeepSeek V3 每百万 token 的输入价格也达到 1 元,输出价格 4 元。
推理模型上,百度模型的性价比则进一步凸显:文心大模型 X1 Turbo 每百万 token 输入价格 1 元,输出价格 4 元,与 DeepSeek R1 优惠时段价格一致,但比 DeepSeek R1 标准时段(8:30-00:30)要便宜得多(R1 每百万 token 输入 8 元,输出 16 元)。
想用性价比顶住 DeepSeek 竞争压力的不止百度一家。4 月 17 日字节发布的豆包 1.5 · 深度思考模型上,其每百万 token 的输入价格为 4 元,输出价格 16 元,综合成本上依然要比 DeepSeek R1 标准时段便宜。
这样的性价比策略更是不止局限于国内大模型玩家。国外同样如此。
4 月份谷歌发布的首个混合推理模型 Gemini 2.5 Flash,便主打一个低成本。在关闭思考模式下,Gemini 2.5 Flash 每百万 token 输出成本暴降 600%,可以达到 0.6 美元 / 百万 token,输入价格 0.15 美元,也远低于 DeepSeek R1 标准时段价格。
稍微偏离性价比策略的模型玩家是 OpenAI。
2 月底发布 GPT-4.5 后,其 API 价格达到 75 美元 / 百万 token 输入、150 美元 /token 输出,是 GPT-4o 的 30 倍,高昂价格令其饱受争议。
但 OpenAI 很快纠正了自己的 " 错误 "。2 个月后的 4 月份,OpenAI 专为开发者推出了三款全新模型:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。最便宜的 GPT4.1 nano,每百万 token 输入价格暴降至 0.1 美元,输出价格 0.4 美元。
但只靠性价比显然还不足以打开市场。DeepSeek 之所以能够出圈,除了低成本之外,其重要前提之一是模型能力有了创新,首次向外界免费展示了思维链的奇妙存在。
01
模型降本是趋势,但国外比国内更贵
延续至今的大模型降本之争,源头便是 DeepSeek。2024 年 5 月,DeepSeek 借助大模型价格战一跃成名。当时,DeepSeek 发布了 DeepSeek V2 开源模型,并在行业内率先降价,将推理成本降到每百万 token 仅 1 块钱,约等于 GPT-4 Turbo 的七十分之一。
随后,字节、腾讯、百度、阿里等科技大厂纷纷降价跟进。中国大模型价格战由此揭幕。
在接受 " 暗涌 " 采访时,DeepSeek 创始人梁文锋解释道,抢用户并不是 DeepSeek 降价的主要目的。" 我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论 API, 还是 AI, 都应该是普惠的、人人可以用得起的东西。"
此前,有云厂商高管曾向直面 AI(ID:faceaibang)解释:" 降价一直存在,并且只要摩尔定律在,降低计算成本将一直是模型行业的趋势。"
包括李彦宏在内的部分大佬更是认为,降本将是推动 AI 应用爆发的重要前提。
但在降本的全球趋势之下,值得注意的不同现象是,国外同类型、同尺寸的模型,调用成本依然要比国内的更贵。
4 月份刚刚发布的 OpenAI o3 新推理模型上,其每百万 token 的输入价格为 10 美元,输出价格 40 美元。但以输入价格论,o3 是文心 X1 Turbo 的超 70 倍。
造成这种不同的原因之一,或许也跟国外模型厂商的多元化商业变现有关。
相比国内只能靠 B 端 API 调用收费,目前国外还有来自 C 端的销售订阅服务,甚至后者商业变现能力还要强于前者。The Information 爆料,OpenAI 今年订阅销售额有望达到 80 亿美元,远超销售其 API 接口的约 20 亿美元。
OpenAI CEO 奥特曼近期在接受采访时就谈道,自己更感兴趣的是,弄清楚如何为一个真正出色的自动化软件工程师,或者其他类型的代理,向人们收取高额费用,而不是通过基于广告的模式来赚取一些小钱。
此前,外界就曾爆出,OpenAI 有望推出高达 2000 美元,乃至 2 万美元的月度订阅制。目前,OpenAI 设有每月 20 美元和 200 美元两档订阅模式。
02
只有性价比还不够,关键在于模型是否有特色
商业变现受限之下,陷入价格战之中的国内模型厂商,还可能迎来更大的成本压力,甚至跌入互联网时代烧钱补贴的竞争逻辑。
更大的挑战还在于,仅靠性价比也并不能彻底留住用户。
DeepSeek 在去年开启价格战后,虽然在行业内开始崭露头角,但并未在大众层面引发关注。直到 DeepSeek R1 模型的到来,DeepSeek 才真正出圈,成为一款家喻户晓的 AI 产品。
奥特曼在点评 DeepSeek 爆火现象时曾认为,模型的能力并不是真正让 DeepSeek 获得病毒式传播的关键,关键在于 DeepSeek 免费开放了 OpenAI 隐藏起来的思维链。
但环顾当下的一众新模型产品,除了在各项数据上比肩或者赶超 DeepSeek,乃至 OpenAI 之外,它们尚未在产品体验和功能上有创新之举。
这方面从谷歌到豆包,都先后做过了反面示例。晚于 DeepSeek R1 近两天发布的豆包 1.5 Pro 大模型,尽管在预训练和推理成本上还要低于 DeepSeek V3,但却因为模型体验不如前者,而未能在舆论场上激起太多水花。
同样赶在 DeepSeek R1 之后发布的谷歌 Gemini 2.0 系列大模型,尽管其 Gemini 2.0 Flash-Lite 版本的调用价格,比 DeepSeek V3 更低,但仅靠价格优势,也依然难以俘获用户的芳心。
这也从某种程度上解释了,为什么顶着全球最贵大模型称号的 Claude,依然能俘获一批开发者的芳心,如继 DeepSeek 之后另一出圈的通用 AI Agent 产品 Manus,便是基于 Anthropic 的 Claude 3.5 模型开发而来。
一切竞争的原点,都又回到了底层模型的技术创新和突破上。
登录后才可以发布评论哦
打开小程序可以发布评论哦