(文 / 万肇生 编辑 / 吕栋)
6 月 29 日,DeepSeek 发送给用户的升级提醒邮件显示,DeepSeek V4 正式版计划于 7 月中旬正式上线,与之而来的则是更多功能优化和性能提升,以及峰谷时定价机制。
根据邮件,北京时间每日 9:00 至 12:00、14:00 至 18:00 被列为高峰时段,调用价格为平时的 2 倍。同时,DeepSeek 表示,在相关调整发生前,将提前 24 小时通过邮件通知用户。
" 涨价 " 前的 " 永久降价 "
据悉,今年以来,这已经不是 DeepSeek 第一次调整价格。官方 API 文档显示,DeepSeek 按百万 tokens 计费,并根据缓存命中、缓存未命中和输出 tokens 分别收费,同时 DeepSeek V4 系列本身对算力的要求也不低。
4 月 24 日,DeepSeek 发布 V4 Preview 时就表示,V4 Pro 为 1.6 万亿总参数、490 亿激活参数,V4 Flash 为 2840 亿总参数、130 亿激活参数,两者均支持 100 万 tokens 上下文。
官方文档还显示,V4 Flash 并发限制为 2500;而 V4 Pro 这种高性能版模型并发限制为 500,其供给弹性弱于 Flash。
5 月 23 日,DeepSeek 宣布将此前的 V4 Pro 的 75% 优惠降价转为永久价格,API 费用从此前最高 24 元 / 百万 tokens 降至最高 6 元 / 百万 tokens。市场当时猜测,可能来自华为昇腾 950 芯片的供应增加有关,但 DeepSeek 并对此作出回应。
永久降价后,目前 V4 Pro 的平时价格为,缓存命中输入 0.025 元 / 百万 tokens,缓存未命中输入 3 元 / 百万 tokens,输出 6 元 / 百万 tokens;V4 Flash 的对应价格分别为 0.02 元、1 元和 2 元。而到了高峰时段,这些价格将翻倍,但依然比此前发布时的价格低。
对普通用户而言,这次调整未必会直接体现为聊天应用收费变化;主要受影响的是通过 API 接入 DeepSeek 模型的开发者、AI 应用公司和企业客户。
同样以 V4 Pro 为例,在计算输出 tokens 的情况下,若一家 AI 应用在高峰时段每天消耗 1 亿输出 tokens,平时成本约为 600 元,高峰价下约为 1200 元;若每天消耗 10 亿输出 tokens,成本则由约 6000 元升至 1.2 万元。对于客服、代码助手、办公 Agent、搜索增强问答等高频应用,价格翻倍可能会直接影响毛利率和调用策略。
并非放弃低价路线
目前,DeepSeek 引入峰谷时定价并非放弃低价路线。更准确地说,DeepSeek 只是把算力资源按使用时段重新分层,使其低价策略开始从统一便宜变成精细化便宜。
因为仅从 tokens 的定价看,DeepSeek 在引入峰谷时之后仍处于低价的 " 真香 " 区间,放在国际市场依然非常具有竞争力,这也是 DeepSeek 涨价的底气。
根据 DeepSeek 英文 API 价格页显示,V4 Pro 输出价格为 0.87 美元 / 百万 tokens,按高峰翻倍测算约为 1.74 美元。相比之下,OpenAI 官方价格页显示,GPT-5.5 标准 API 价格为输入 5 美元、缓存输入 0.5 美元、输出 30 美元 / 百万 tokens;Anthropic 的 Claude Opus 4.8 常规价格为输入 5 美元、输出 25 美元 / 百万 tokens。
若仅看输出 tokens,OpenAI 和 Anthropic 高端模型价格仍约为 DeepSeek V4 Pro 峰时价的 14 — 17 倍。
另一方面,随着海外市场大模型定价模式从固定订阅转向按 tokens 计费,企业的使用成本开始巨大攀升,许多预算有限的海外企业,正把更多调用转向 DeepSeek 等低成本模型。
据此前报道,以打车软件 Uber 为例,因为大模型定价模式转变后,仅仅 4 个月就迅速消耗了公司全年的 AI 预算,导致不得不限制高管使用,有幸成为 " 第一个叫停 AI 烧钱的大厂 "。
而微软、Coinbase 等公司的高管也开始强调,许多企业任务并不总需要最昂贵、最大的模型。这些变化都推动企业更多采用 " 多模型路由 ",即把简单任务交给便宜模型,复杂任务再交给高端模型。
因此,OpenRouter 的数据显示,开源模型已承担其平台上约 65% 的 token 处理量,其中以 DeepSeek 为代表的中国低成本模型的使用量,已明显上升,直观反映出海外用户已进入 " 精打细算 " 时代。
本文系观察者网独家稿件,未经授权,不得转载。


登录后才可以发布评论哦
打开小程序可以发布评论哦