上周 DeepSeek-V3.1 正式发布,主要变化包括了引入混合推理架构(一个模型同时支持思考模式与非思考模式)、提供更高的思考效率(能在更短时间内给出答案)、更强的 Agent 能力(在工具使用与智能体任务中的表现有较大提升)。
英特尔宣布,Gaudi 2E AI 加速器现已为 DeepSeek-V3.1 提供深度优化支持。凭借出色的性能和成本效益,Gaudi 2E 以更低的投入、更高的效率,实现从模型训练的深度突破到推理部署的实时响应,为大模型的加速落地提供新选择。
Gaudi 2E 配备了 96GB 大容量内存,搭载先进的 HBM 控制器,针对随机访问、线性访问场景进行深度优化,有效避免了 AI 训练或推理任务的延迟,从而保障了计算流程的流畅性。同时还拥有卓越的可扩展能力,支持多卡互联,为用户提供了灵活的、可定制化的解决方案,满足其不断变化的 AI 需求。以出色的适配性和易用性,Gaudi 2E 为诸多大模型应用提供支持。
实测数据显示,在英特尔 Gaudi 2E 的支持下,DeepSeek-V3.1 无论是在问答还是编码上,能力都有着显著提升:在部署了 8 张英特尔 Gaudi 2E 的一体机服务器上运行 DeepSeek-V3.1 模型,在输入 / 输出 token 长度均为 1k、多用户并发数为 30 的条件下,每个并发 token 生成速率达到每秒 10 token;在输入 / 输出 token 长度均为 2k、多用户并发数为 28 的条件下,每个并发 token 生成速率达到每秒 10 token。
通过开放的架构、强大的技术支持和紧密的生态合作,英特尔将持续赋能 AI 产业的创新与发展,加速 AI 大模型技术的普惠落地。
登录后才可以发布评论哦
打开小程序可以发布评论哦