星河商业观察 9小时前
预计春节亮相的它,或超越Claude与GPT系列
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

国产 AI 巨头 DeepSeek 预计春节发布 V4,争夺代码王座!

根据新浪科技获得的消息,有知情人士表示,DeepSeek 计划未来几周内正式推出新一代旗舰人工智能模型 DeepSeek-V4,该模型针对代码生成场景进行了深度优化,旨在挑战 Claude 在编程 AI 领域的领先地位,并可能以此重构全球 AI 产业竞争格局。并透露,DeepSeek 计划于 2 月中旬农历新年前后推出 V4 模型,不过具体时间仍可能调整。

其中一位知情人士表示,用户或许会发现,V4 模型输出的答案逻辑更为严谨清晰,这一特征体现出该版本模型具备更强的推理能力,在执行复杂任务时的可靠性也将大幅提升。

内部测试数据显示,V4 在代码生成任务上的表现或超越当前主流模型,包括 Anthropic 的 Claude 和 OpenAI 的 GPT 系列。

技术突破是 V4 备受关注的核心。

2025 年最后一天,DeepSeek 发表了题为《mHC:流形约束超连接》的论文,提出了一种创新训练架构。该技术成功将模型训练中的信号增益从传统架构的数千倍压缩至约 1.6 倍,从根本上解决了大模型扩容时的 " 信号爆炸 " 与 " 训练崩溃 " 难题,为实现稳定、高效的模型训练提供了全新路径。

北京大学人工智能研究院院长朱松纯评价称,这标志着中国 AI 已从参数追赶转向原创突破,其 mHC 技术从数学底层解决了训练稳定性问题,这种‘不堆算力堆算法’的路径,为全球 AI 发展提供了新范式。

在实际应用层面,V4 据称支持高达百万级 token 的上下文窗口,能够一次性解析完整的中型项目代码库,有效缓解复杂软件开发中的信息断裂问题。

2026 年 1 月 4 日,DeepSeek 悄悄更新了 R1 的论文,从 22 页扩展到 86 页,新增完整训练管线解析。这种大规模的技术披露预示着 DeepSeek 在原创技术上的成熟度,为 V4 发布做好技术铺垫。

DeepSeek 似乎形成春节前后发布重大更新的宣传习惯。

回顾其发展历程,2025 年 1 月,该公司曾凭借低成本、高性能的 R1 推理模型引发全球关注;随后在同年 12 月,又接连推出 V3 及 V3.2 版本,后者在部分测试中表现已超越 GPT-5 和 Gemini 3.0 Pro。此后公司未推出重大迭代模型,使得即将发布的 V4 备受业界期待。

业内分析认为,DeepSeek-V4 的发布将进一步推动从国产算力芯片到 AI 应用融合的整条产业链发展。

来源:星河商业观察

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

春节 ai 人工智能 北京大学 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论