DeepSeek的进阶之路：2026年DeepSeek已更新四次

【CNMO 科技信息】2 月 15 日，微博科技发布一张图片，来回顾 DeepSeek 的进阶之路。CNMO 注意到，2026 年才过去两个月，DeepSeek 就已连续更新四次。

2025 年 1 月 20 日，DeepSeek-R1 的发布引起了广泛关注。其训练成本不到 GPT-4o 的十分之一，性能却对齐 OpenAI o1 正式版。随后，发布的 DeepSeek Janus Pro 进一步提升了多模态理解和文生图能力。3 月推出的 DeepSeek-V3-0324，则在推理能力、数学和编程性能上击败了 GPT-4.5。

2025 年 2 月，DeepSeek 开展了基础设施开源周活动，在此期间开源了多个与基础设施相关的技术成果。

在接下来的几个月里，DeepSeek 继续保持着高速的发展态势。在推理能力方面，DeepSeek-R1-0528 推理能力重大升级，前端能力超过了 Gemini 2.5 Pro；DeepSeek-V3.1 更是实现了单一模型同时支持 " 思考模式 " 与 " 非思考模式 " 自由切换。

此外，DeepSeek-OCR 以极高的视觉 token 压缩效率，实现了 " 视觉 token" 取代 " 文本 token"。而 DeepSeek-Math-V2 成为了行业首个达到国际奥数金牌水平且开源的模型，为数学教育和研究提供了新的工具和方法。

2026 年，DeepSeek 提出的 mHC 架构解决了训练中信号不稳定与计算效率的矛盾；另一项创新架构—— Engram 内存模块能将大语言模型中的静态知识存储与动态计算推理分离，大幅提升效率并降低对昂贵算力资源的依赖。

宙世代

一起剪

相关标签