【梁文锋署名,DeepSeek 联手北大发布 DSpark 推测解码论文】
( 1 ) 6 月 27 日,即完成 500 亿融资后仅十余天,DeepSeek 团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,该研究并非新模型迭代,而是在现有 DeepSeek-V4-Pro 和 V4-Flash 基础上新增推测解码模块,侧重工程化落地优化。
( 2 ) 论文同步开源了全栈代码库 DeepSpec(MIT 许可),内含数据准备工具、草稿模型实现、训练代码及评估脚本,目前已内置 DSpark、DFlash 和 Eagle3 三种推测解码实现。
( 3 ) 值得关注的是,DeepSeek 创始人梁文锋亲自位列论文作者名单——在完成首轮融资后仍深度参与技术撰写,这在 AI 行业中较为罕见。


登录后才可以发布评论哦
打开小程序可以发布评论哦