快科技 4 月 29 日消息,今天凌晨,阿里巴巴开源新一代通义千问模型 Qwen3(简称千问 3),参数量为 DeepSeek-R1 的 1/3,成本大幅下降。
千问 3 是 " 混合推理模型 "," 快思考 " 与 " 慢思考 " 集成进同一个模型,对简单需求可低算力 " 秒回 " 答案,对复杂问题可多步骤 " 深度思考 ",节省算力消耗。
作为 Qwen 系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。
在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了 " 小而强大 "。
千问 3 总参数量 235B,刷新了开源模型的智能水平新高,阿里称仅需 4 张 H20 即可部署千问 3 满血版,显存占用仅为性能相近模型的三分之一。
千问 3 模型版本包含 2 款 30B、235B 的 MoE 模型,以及 0.6B、1.7B、4B、8B、14B、32B 等 6 款密集模型。
登录后才可以发布评论哦
打开小程序可以发布评论哦