超能网 08-28
英特尔宣布为DeepSeek-V3.1提供加速支持:Gaudi 2E已进行深度优化
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

上周 DeepSeek-V3.1 正式发布,主要变化包括了引入混合推理架构(一个模型同时支持思考模式与非思考模式)、提供更高的思考效率(能在更短时间内给出答案)、更强的 Agent 能力(在工具使用与智能体任务中的表现有较大提升)。

英特尔宣布,Gaudi 2E AI 加速器现已为 DeepSeek-V3.1 提供深度优化支持。凭借出色的性能和成本效益,Gaudi 2E 以更低的投入、更高的效率,实现从模型训练的深度突破到推理部署的实时响应,为大模型的加速落地提供新选择。

Gaudi 2E 配备了 96GB 大容量内存,搭载先进的 HBM 控制器,针对随机访问、线性访问场景进行深度优化,有效避免了 AI 训练或推理任务的延迟,从而保障了计算流程的流畅性。同时还拥有卓越的可扩展能力,支持多卡互联,为用户提供了灵活的、可定制化的解决方案,满足其不断变化的 AI 需求。以出色的适配性和易用性,Gaudi 2E 为诸多大模型应用提供支持。

实测数据显示,在英特尔 Gaudi 2E 的支持下,DeepSeek-V3.1 无论是在问答还是编码上,能力都有着显著提升:在部署了 8 张英特尔 Gaudi 2E 的一体机服务器上运行 DeepSeek-V3.1 模型,在输入 / 输出 token 长度均为 1k、多用户并发数为 30 的条件下,每个并发 token 生成速率达到每秒 10 token;在输入 / 输出 token 长度均为 2k、多用户并发数为 28 的条件下,每个并发 token 生成速率达到每秒 10 token。

通过开放的架构、强大的技术支持和紧密的生态合作,英特尔将持续赋能 AI 产业的创新与发展,加速 AI 大模型技术的普惠落地。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英特尔 ai 一体机
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论