太平洋电脑网 前天
DeepSeek-V3.2-Exp模型发布 引入稀疏架构提升推理效率
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【太平洋科技快讯】9 月 29 日消息,深度求索公司正式发布 DeepSeek-V3.2-Exp 模型。据官方消息,这是一个实验性 ( Experimental ) 版本,旨在通过技术创新提升模型在处理长文本时的效率表现。

据了解,V3.2-Exp 模型在 V3.1-Terminus 的基础上引入了稀疏 DeepSeek Sparse Attention 架构。该架构专门针对长文本的训练和推理效率进行了探索性优化,能够有效降低计算资源消耗并提升模型推理效率。

虽然该模型已在公开评测集上完成有效性验证,但仍需在用户真实使用场景中进行更广泛、大规模的测试。为方便用户进行对比测试,官方为 V3.1-Terminus 临时保留了额外 API 访问接口,使得研究人员和开发者能够同时访问新旧两个版本,便于在实际应用中比较性能差异。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

技术创新
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论