快科技 4 月 29 日消息,今日,阿里云正式开源 Qwen3 系列模型,参数量为 DeepSeek-R1 的 1/3,成本大幅下降。
今晚,国家级算力服务平台超算互联网宣布,平台火速上线 Qwen3 全家桶,包含六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B;以及两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参数),Qwen3-30B-A3B(300 亿总参数、30 亿激活参数)。
Qwen3 系列模型采用 Apache2.0 协议开源,开发者、企业可在超算互联网下载模型文件进行快速开发。
超算互联网表示,平台即将上线 Qwen3 系列模型镜像、应用空间快速体验服务,无需安装依赖,用户可 0 代码体验 Qwen3 系统模型对话服务,实现云端开箱即用。
据介绍,Qwen3-235B-A22B 在编码、数学、通用能力等基准评测中表现出竞争力,能够与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等模型媲美。
此外,小型 MoE 模型 Qwen3-30B-A3B 以激活参数数量的 10 倍优势超越了 QwQ-32B,Qwen3-4B 小型模型也能匹敌 Qwen2.5-72B-Instruct 的性能。
登录后才可以发布评论哦
打开小程序可以发布评论哦