驱动之家 前天
打破蒸馏质疑!梁文锋论文登上《自然》封面
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 9 月 18 日消息,据媒体报道,由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文,近日登上国际顶级学术期刊《自然》(Nature)的封面,引发广泛关注。

与今年 1 月发布的初版论文相比,本次正式发表的版本披露了更多模型训练的技术细节,并对发布初期外界有关 " 蒸馏 " 方法的质疑作出了正面回应。

DeepSeek-R1 也因此成为全球首个经过严格同行评审的主流大语言模型。《自然》在评论中指出,当前绝大多数主流大模型尚未经过独立的同行评审,而这一重要空白 " 终于被 DeepSeek 打破 "。

公开资料显示,DeepSeek 创始人梁文锋毕业于浙江大学电子信息与通信工程专业,获本科及硕士学位。他于 2023 年 7 月创立 DeepSeek,公司在 2024 年 5 月推出 DeepSeek-V2,同年 12 月 27 日发布 DeepSeek-V3。

2025 年 1 月 20 日,DeepSeek 正式发布 DeepSeek-R1 模型。该模型犹如一颗投入平静湖面的巨石,在国际 AI 界激起千层浪,不仅颠覆了 "AI 研发必须高投入、长周期 " 的传统认知,也打破了美国在 AI 领域的话语垄断。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 浙江大学 美国 创始人 本科
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论