【CNMO 科技信息】2 月 15 日,微博科技发布一张图片,来回顾 DeepSeek 的进阶之路。CNMO 注意到,2026 年才过去两个月,DeepSeek 就已连续更新四次。

2025 年 1 月 20 日,DeepSeek-R1 的发布引起了广泛关注。其训练成本不到 GPT-4o 的十分之一,性能却对齐 OpenAI o1 正式版。随后,发布的 DeepSeek Janus Pro 进一步提升了多模态理解和文生图能力。3 月推出的 DeepSeek-V3-0324,则在推理能力、数学和编程性能上击败了 GPT-4.5。
2025 年 2 月,DeepSeek 开展了基础设施开源周活动,在此期间开源了多个与基础设施相关的技术成果。
在接下来的几个月里,DeepSeek 继续保持着高速的发展态势。在推理能力方面,DeepSeek-R1-0528 推理能力重大升级,前端能力超过了 Gemini 2.5 Pro;DeepSeek-V3.1 更是实现了单一模型同时支持 " 思考模式 " 与 " 非思考模式 " 自由切换。
此外,DeepSeek-OCR 以极高的视觉 token 压缩效率,实现了 " 视觉 token" 取代 " 文本 token"。而 DeepSeek-Math-V2 成为了行业首个达到国际奥数金牌水平且开源的模型,为数学教育和研究提供了新的工具和方法。

2026 年,DeepSeek 提出的 mHC 架构解决了训练中信号不稳定与计算效率的矛盾;另一项创新架构—— Engram 内存模块能将大语言模型中的静态知识存储与动态计算推理分离,大幅提升效率并降低对昂贵算力资源的依赖。


登录后才可以发布评论哦
打开小程序可以发布评论哦