【太平洋科技快讯】由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 研究论文,登上国际顶级学术期刊《自然》 ( Nature ) 封面。此次发布的论文版本不仅补充了大量模型细节,还首次正面回应了模型发布之初关于蒸馏 OpenAI 的质疑。
今年 1 月,有报道称 OpenAI 研究人员认为 DeepSeek 可能使用了 OpenAI 模型的输出结果来训练 DeepSeek-R1。这种方法被认为能够以较低资源消耗加速模型能力提升,一度引发业内广泛讨论。
在论文的补充材料中,DeepSeek 团队明确回应了训练数据来源问题,强调 "DeepSeek-V3-Base 的训练数据仅来自普通网页和电子书,不包含任何合成数据 "。DeepSeek 表示,在预训练冷却阶段没有故意使用 OpenAI 生成的合成数据,该阶段所有数据均通过网页抓取。
登录后才可以发布评论哦
打开小程序可以发布评论哦