驱动之家 04-29
阿里巴巴正式开源千问3 仅需4张H20即可部署满血版
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 4 月 29 日消息,今天凌晨,阿里巴巴开源新一代通义千问模型 Qwen3(简称千问 3),参数量为 DeepSeek-R1 的 1/3,成本大幅下降。

千问 3 是 " 混合推理模型 "," 快思考 " 与 " 慢思考 " 集成进同一个模型,对简单需求可低算力 " 秒回 " 答案,对复杂问题可多步骤 " 深度思考 ",节省算力消耗。

作为 Qwen 系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。

在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了 " 小而强大 "。

千问 3 总参数量 235B,刷新了开源模型的智能水平新高,阿里称仅需 4 张 H20 即可部署千问 3 满血版,显存占用仅为性能相近模型的三分之一。

千问 3 模型版本包含 2 款 30B、235B 的 MoE 模型,以及 0.6B、1.7B、4B、8B、14B、32B 等 6 款密集模型。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里巴巴 阿里 开源 通义千问
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论