手机中国 02-15
DeepSeek的进阶之路:2026年DeepSeek已更新四次
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

【CNMO 科技信息】2 月 15 日,微博科技发布一张图片,来回顾 DeepSeek 的进阶之路。CNMO 注意到,2026 年才过去两个月,DeepSeek 就已连续更新四次。

2025 年 1 月 20 日,DeepSeek-R1 的发布引起了广泛关注。其训练成本不到 GPT-4o 的十分之一,性能却对齐 OpenAI o1 正式版。随后,发布的 DeepSeek Janus Pro 进一步提升了多模态理解和文生图能力。3 月推出的 DeepSeek-V3-0324,则在推理能力、数学和编程性能上击败了 GPT-4.5。

2025 年 2 月,DeepSeek 开展了基础设施开源周活动,在此期间开源了多个与基础设施相关的技术成果。

在接下来的几个月里,DeepSeek 继续保持着高速的发展态势。在推理能力方面,DeepSeek-R1-0528 推理能力重大升级,前端能力超过了 Gemini 2.5 Pro;DeepSeek-V3.1 更是实现了单一模型同时支持 " 思考模式 " 与 " 非思考模式 " 自由切换。

此外,DeepSeek-OCR 以极高的视觉 token 压缩效率,实现了 " 视觉 token" 取代 " 文本 token"。而 DeepSeek-Math-V2 成为了行业首个达到国际奥数金牌水平且开源的模型,为数学教育和研究提供了新的工具和方法。

2026 年,DeepSeek 提出的 mHC 架构解决了训练中信号不稳定与计算效率的矛盾;另一项创新架构—— Engram 内存模块能将大语言模型中的静态知识存储与动态计算推理分离,大幅提升效率并降低对昂贵算力资源的依赖。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 基础设施 数学 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论