在华为云上体验最新DeepSeek-V3.2-Exp

2025 年 9 月 29 日，DeepSeek-V3.2-Exp 模型正式发布并开源。模型引入稀疏 Attention 架构，这种架构能够有效降低计算资源消耗并提升模型推理效率。华为云第一时间完成对 DeepSeek-V3.2-Exp 模型的适配工作，最大可支持 160K 长序列上下文长度。目前，该模型已正式上架华为云大模型即服务平台 MaaS，为企业及开发者提供模型体验和 API 服务。

华为云 ModelArts 推理平台基于 CloudMatrix384 基础设施，为 DeepSeek-V3.2-Exp 模型提供稳定、高可靠推理服务。ModelArts 推理平台能够根据实际负载需求，按需供给和分配模型推理算力资源，实现资源分时复用与灵活扩缩容。针对 DeepSeek-V3.2-Exp 模型，此次仍沿用大 EP 并行方案部署，基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略，并兼顾模型时延和吞吐性能。

即刻开始体验：

目前可访问华为云官网，体验 DeepSeek-V3.2-Exp 模型的卓越能力：

访问华为云官网首页——导航菜单 " 大模型 " —— "DeepSeek-V3.2-Exp" 模型 " 立即体验 "，进入大模型服务平台模型体验页面，选择 "DeepSeek-V3.2-Exp" 模型体验。

宙世代

一起剪

相关标签