DeepSeek V4中文能力测评出炉：重回国内第一！

快科技 4 月 28 日消息，SuperCLUE 团队发布 DeepSeek V4 系列中文大模型测评结果，DeepSeek-V4-Pro 凭借综合表现拿下国内第一，Flash 版本紧随其后位居第二，国产开源模型再迎突破。

本次测评覆盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循、幻觉控制六大维度，Pro 版本得分 70.98 分，Flash 版本 68.82 分，两项成绩均大幅领先国内其他模型。

DeepSeek V4 系列采用全新注意力机制，全版本支持百万级长上下文，同时降低算力与显存占用，搭配国产芯片使用，整体效率更高。

相比上一代 V3.2，两个版本均实现全面提升。Pro 版本智能体能力提升超 20 分，数学推理提升近 10 分，指令遵循提升近 12 分，幻觉控制也有明显优化。

Flash 版本在保持高效推理的同时，智能体与数学推理同样大幅提升，性价比突出。

Pro 版本（15 元 / 百万 Tokens）侧重高性能，幻觉控制更稳，适合复杂任务与专业场景。Flash 版本速度更快、成本更低，API 价格仅 1.25 元每百万 Tokens，日常使用更划算。

测评同时指出，模型与海外顶尖模型在代码生成、复杂指令执行等方面仍有差距。整体来看，DeepSeek V4 凭借均衡能力与亲民成本，站稳国内第一梯队，成为日常办公、开发创作、长文本处理的优质选择。

宙世代