驱动之家 04-29
火速适配国产算力!阿里Qwen3全家桶上线超算互联网:支持企业级部署
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 4 月 29 日消息,今日,阿里云正式开源 Qwen3 系列模型,参数量为 DeepSeek-R1 的 1/3,成本大幅下降。

今晚,国家级算力服务平台超算互联网宣布,平台火速上线 Qwen3 全家桶,包含六个 Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B;以及两款 MoE 模型:Qwen3-235B-A22B(2350 多亿总参数、 220 多亿激活参数),Qwen3-30B-A3B(300 亿总参数、30 亿激活参数)。

Qwen3 系列模型采用 Apache2.0 协议开源,开发者、企业可在超算互联网下载模型文件进行快速开发。

超算互联网表示,平台即将上线 Qwen3 系列模型镜像、应用空间快速体验服务,无需安装依赖,用户可 0 代码体验 Qwen3 系统模型对话服务,实现云端开箱即用。

据介绍,Qwen3-235B-A22B 在编码、数学、通用能力等基准评测中表现出竞争力,能够与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等模型媲美。

此外,小型 MoE 模型 Qwen3-30B-A3B 以激活参数数量的 10 倍优势超越了 QwQ-32B,Qwen3-4B 小型模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里云 互联网 开源 数学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论