2026 年 6 月 27 日,DeepSeek 联合北京大学正式发布 DSpark 推理加速框架,旨在提升大模型在高并发生产环境下的推理效率。该框架已集成至 DeepSeek-V4-Flash 与 V4-Pro 预览版引擎,相较单 token 基线 MTP-1,在同等吞吐下单用户生成速度提升 60% – 85%。DSpark 创新采用半自回归候选生成与置信度驱动的动态验证调度机制,兼顾接受率与计算资源利用率。相关代码与模型已在 GitHub 开源。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。


登录后才可以发布评论哦
打开小程序可以发布评论哦