科创板日报 08-21
R2没等来,DeepSeek V3.1模型发布:价格涨了,智能体能力加强
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

《科创板日报》8 月 21 日讯(记者 黄心怡)在 OpenAI 发布 GPT-5 模型 14 天后,梁文锋终于出招了,新模型版本 DeepSeek-V3.1 正式发布。

本次升级的核心亮点是采用了混合推理架构,允许模型在一个统一框架内支持 " 思考 " 与 " 非思考 " 两种模式,实现了 DeepSeek-R1 和 DeepSeek-V3 的合体

此外,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度,而 UE8M0 FP8 是针对即将发布的下一代国产芯片设计。

DeepSeek 同步升级了 API 接口,将上下文窗口扩展至 128K,并新增了对 Anthropic API 格式的支持以简化迁移。

在技术与产品更新之外,DeepSeek 的 API 接口调用价格有所上涨,并取消夜间优惠。从北京时间 2025 年 9 月 6 日凌晨起,自北京时间 2025 年 9 月 6 日凌晨起,输入价格方面,缓存命中时为 0.5 元 / 百万 tokens,缓存未命中时则涨至 4 元 / 百万 tokens(此前 V3 为 2 元 / 百万 tokens);输出价格调整为 12 元 / 百万 tokens(此前 V3 为 8 元 / 百万 tokens)。

混合推理架构已成为大模型领域的一大趋势。除了 DeepSeek 外,此前发布的阿里通义千问 Qwen3、GPT-5 也都把推理模型与非推理模型进行融合。

不过,这类混合推理架构的实际效果仍有待观察。在 GPT-5 模型发布后,为了平息用户争议,OpenAI 已将 GPT-4o 已重新上线。

而 DeepSeek-V3.1 发布后,《科创板日报》记者也看到不少用户反馈称,在体验了 DeepSeek-V3.1 的推理能力后,更习惯 DeepSeek R1 的回答。

IDC 中国研究总监卢言霞对《科创板日报》表示,思考与非思考模式的融合可以说是必然的趋势,也是大模型发展史上的一个小迭代。"DeepSeek V3.1 并非大版本,更值得期待的是大版本更新,但不知道何时。"

谈及基础模型的迭代速度,卢言霞表示,目前看确实有所放缓。" 未来变革式的突破是不可预测的 就像创新不可被计划,这使得迭代放缓。但何时能大突破,也难以预测。"

开放传神(OpenCSG)联合创始人陈冉也认为,DeepSeek-V3.1 综合看来在预期以下。" 效率确实有提升,但突破较少。"

值得一提的是, 深度求索正式发布 DeepSeek-V3.1 后,称其为 " 迈向 Agent(智能体)时代的第一步 "。 DeepSeek-V3.1 具有更智能的工具调用能力,可以支持多种 Code Agent 框架,开发者可以自己搭建智能体。

"Agent 方向支持,看来是 DeepSeek 重点方向。" 陈冉分析。

目前,大模型厂商已经纷纷将重点放在了智能体的应用上,今年 7 月,月之暗面发布了拥有万亿参数规模的混合专家(MoE)模型。在其官方演示案例中, Kimi K2 迈出了智能体化的一步,可帮助用户直接制定旅行计划并预订机票和酒店。

而智谱 AI 在 7 月 28 日发布的 GLM-4.5 系列,也定位为 "Agent 原生基础模型 ",并在 8 月 20 日发布了全球首个手机 Agent(智能体)AutoGLM2.0,可以帮助用户 Agent 代理操作,具备推理、代码与多模态的全能能力,比如可以一键订票、订咖啡。

此次 DeepSeek 则称其在智能体能力方面实现了突破。编程智能体方面,在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比前代模型有显著进步,所需轮数更少。

在搜索智能体测评方面,在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。

有业内人士对《科创板日报》记者表示,今年属于智能体元年,在探索中发现很多挑战,也在逐步落地。" 到明年的话或许会迎来真正的爆发年,随着标杆案例的成熟,预计将达到规模化发展。"

随着基础大模型迭代的放缓,未来国产大模型的竞争或也将围绕智能体等场景落地而展开。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

科创板 创始人 芯片 通义千问 阿里
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论