DeepSeek首次回应“蒸馏OpenAI”质疑相关论文登上《自然》封面

【太平洋科技快讯】由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 研究论文，登上国际顶级学术期刊《自然》 ( Nature ) 封面。此次发布的论文版本不仅补充了大量模型细节，还首次正面回应了模型发布之初关于蒸馏 OpenAI 的质疑。

今年 1 月，有报道称 OpenAI 研究人员认为 DeepSeek 可能使用了 OpenAI 模型的输出结果来训练 DeepSeek-R1。这种方法被认为能够以较低资源消耗加速模型能力提升，一度引发业内广泛讨论。

在论文的补充材料中，DeepSeek 团队明确回应了训练数据来源问题，强调 "DeepSeek-V3-Base 的训练数据仅来自普通网页和电子书，不包含任何合成数据 "。DeepSeek 表示，在预训练冷却阶段没有故意使用 OpenAI 生成的合成数据，该阶段所有数据均通过网页抓取。