DeepSeek联合北大发布DSpark推理加速框架

2026 年 6 月 27 日，DeepSeek 联合北京大学正式发布 DSpark 推理加速框架，旨在提升大模型在高并发生产环境下的推理效率。该框架已集成至 DeepSeek-V4-Flash 与 V4-Pro 预览版引擎，相较单 token 基线 MTP-1，在同等吞吐下单用户生成速度提升 60% – 85%。DSpark 创新采用半自回归候选生成与置信度驱动的动态验证调度机制，兼顾接受率与计算资源利用率。相关代码与模型已在 GitHub 开源。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。