智东西 15小时前
马斯克惊呼太强了!国产0.8B模型开源,网友:已在iPhone上摩拳擦掌
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 李水青

编辑 | 心缘

智东西 3 月 3 日报道,昨日晚间,阿里开源 4 款 Qwen3.5 小尺寸模型系列:Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B,可部署于笔记本电脑等端侧设备。

Qwen3.5 社交平台 X 推文部分截图

模型一发布,不仅开发者圈讨论热烈,连马斯克也空降 Qwen 社交平台 X 推文下的评论区,他评价:" 令人惊叹的智能密度。" 自家 Grok4.2 发布在即,马斯克对中国大模型同行的关注度不减。

埃隆 · 马斯克在推文下的评论

在指令跟随、多语言、视觉推理等多项基准评测中,Qwen3.5-9B 在 GPQA Diamond、MMMU-Pro、ERQA、Video-MME 等多项评测中拔得头筹,大幅领先 GPT-OSS-20B、GPT-5 nano、Gemini 2.5 Flash-Lite 以及自家的

Qwen3-Next-80B-A3B-Thinking、Qwen3-30B-A3B-2507。

作为小型模型,Qwen3.5-4B 的表现已接近 Qwen3.5-9B,在多语言知识、视觉推理、文档理解等任务上媲美更大模型,在纯数学推理方面仍有差距,这也是小版本模型的普遍问题。

Qwen3.5-9B 和 Qwen3.5-4B 的测评情况

这些小型模型均基于 Qwen3.5 统一基座,Apache 2.0 开源可商用,支持 LoRA/ 全量微调,消费级显卡即可启动任务适配。具体来看:

0.8B/2B 版本具备小巧、快速的特点,是端侧首选。这两个模型非常适合移动设备、IoT 边缘设备部署,以及低延时的实时交互场景。

4B 版本性能更强劲,具备多模态基座模型。该版本适合作为轻量级智能体的核心大脑,平衡性能与资源消耗。

9B 版本模型结构紧凑,但性能媲美 gpt-oss-120B,适合需要较高智力水平但受限显存资源的服务器端部署,是性价比极高的通用模型选择。

目前所有模型均已在魔搭社区和 Hugging Face 开源,同时小尺寸模型的基座模型也已开源。

自 2 月中旬 Qwen3.5 模型正式推出之后,不少海内外开发者一直 " 催更 " 小规模版本 Qwen3.5。而随着今天小版本模型终于面世,开发者们也立即参与讨论并体验起来。

一位开发者称:"9B 在 MMMU-Pro 测试中以 13 分的优势击败 GPT-5-Nano 才是真正的亮点。一个可以在笔记本电脑上运行的模型,性能却超越了云端旗舰级的 Nano 模型,架构优势远胜于参数数量。"

社交平台 X 网友评论

另一位开发者称:" 这比人们想象的要强大得多。一台运行在 Mac mini 上的 Qwen 3.5 加上 24hx7 全天候运行的 OpenClaw,就能打造出一个成本不到一个月初级员工工资的 AI 员工。"

还有开发者分享,他使用 AMD Ryzen AI Max+395 处理器和 Q4_K_XL 量化算法,并开启完整的 256k 上下文窗口,处理速度达到了约 30 个 token/s。而且它只需要不到 16GB 的显存。对此他惊叹:" 我的天!Qwen3.5-9B 的体积虽小,但性能却非常强劲:多语言处理能力出色,通用知识储备丰富,视觉输入处理能力也很强。"

社交平台 X 网友评论

值得一提的是,有网友称 Qwen 3.5 不仅可在任何笔记本电脑上运行,它还能在手机上运行。此话一出,不少人追问:" 如何在 iPhone 上运行?"

社交平台 X 网友评论

不过也有开发者直截了当地说:"4B 模型只是一个智能自动补全工具,而不是一个思考伙伴。GPQA Diamond(研究生水平推理)的正确率约为 45%,HMMT 数学测试的正确率约为 15%。这意味着它在难题上超过一半的概率都会出错。"

社交平台 X 网友评论

小型模型的能力固然有限,但其在特定能力维度评测上已达到 Gemini 3 Flash 等云端部署模型的水平,这意味着其已经能在很多端边侧场景发挥实际效用。

至此,Qwen3.5 家族已开源:

1 个大尺寸模型:Qwen3.5-397B-A17B

3 个中型尺寸模型:Qwen3.5-122-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B

4 个小尺寸模型:Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B

Hugging Face 地址:

https://huggingface.co/collections/Qwen/qwen35

魔搭社区地址:

https://modelscope.cn/collections/Qwen/Qwen35

附 Qwen3.5-9B 和 Qwen3.5-4B 完整测评成绩:

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

马斯克 开源 社交平台 埃隆马斯克
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论