驱动之家 3小时前
DeepSeek V4中文能力测评出炉:重回国内第一!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 4 月 28 日消息,SuperCLUE 团队发布 DeepSeek V4 系列中文大模型测评结果,DeepSeek-V4-Pro 凭借综合表现拿下国内第一,Flash 版本紧随其后位居第二,国产开源模型再迎突破。

本次测评覆盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循、幻觉控制六大维度,Pro 版本得分 70.98 分,Flash 版本 68.82 分,两项成绩均大幅领先国内其他模型。

DeepSeek V4 系列采用全新注意力机制,全版本支持百万级长上下文,同时降低算力与显存占用,搭配国产芯片使用,整体效率更高。

相比上一代 V3.2,两个版本均实现全面提升。Pro 版本智能体能力提升超 20 分,数学推理提升近 10 分,指令遵循提升近 12 分,幻觉控制也有明显优化。

Flash 版本在保持高效推理的同时,智能体与数学推理同样大幅提升,性价比突出。

Pro 版本(15 元 / 百万 Tokens)侧重高性能,幻觉控制更稳,适合复杂任务与专业场景。Flash 版本速度更快、成本更低,API 价格仅 1.25 元每百万 Tokens,日常使用更划算。

测评同时指出,模型与海外顶尖模型在代码生成、复杂指令执行等方面仍有差距。整体来看,DeepSeek V4 凭借均衡能力与亲民成本,站稳国内第一梯队,成为日常办公、开发创作、长文本处理的优质选择。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

flash 数学 芯片 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论