每日新闻摘录 04-25
软硬协同,华为云实现 DeepSeek-V4 极致性能适配
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

(原标题:软硬协同,华为云实现 DeepSeek-V4 极致性能适配)

4 月 24 日,DeepSeek-V4 模型正式发布并开源,华为云首发适配。DeepSeek-V4 拥有百万 Token 超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。其中,DeepSeek-V4-Flash 模型参数下降至 284B,推理成本进一步降低,模型参数和激活更小,V4-Flash 能够提供更加快捷、经济的 API 服务,实现百万上下文普惠。当前,华为云 MaaS 模型即服务平台已为开发者提供免部署、一键调用 DeepSeek-V4 -Flash API 的 Tokens 服务。

在此次新模型适配过程中,华为云在系统层、算子层和集群层的关键能力上协同,分别从调度效率、计算效率和数据流转效率三个维度保障新模型快速适配与高性能落地。

针对 DeepSeek-V4,华为云首发适配模型分层注意力压缩机制,实现 V4 注意力机制下 KVCache 的高效分配管理,提供 TopK、SWA、CFA 等 10+ 昇腾高性能融合算子,搭配框架异步调度、MTP 多步投机等框架优化,支持原生 1M 长上下文的高性能推理。

华为云以高效的 AI 基础设施为核心打造 " 硅基黑土地 ",开放接纳自研和第三方主流大模型和众多智能体,为企业解难题,提升生产效率。

据悉,金山办公、360、核桃编程等企业已通过华为云接入 DeepSeek 新模型,此外,DeepSeek-V4-Pro 版本也将于近日上线。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

华为云 开源 金山办公 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论