驱动之家 08-07
阿里通义千问发布小尺寸模型Qwen3-4B:超越GPT4.1-Nano 手机也能跑
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 8 月 7 日消息,今日,阿里通义千问宣布发布更小尺寸新模型—— Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507。

目前新模型已在魔搭社区、HuggingFace 正式开源。

据介绍,在非推理领域,Qwen3-4B-Instruct-2507 全面超越闭源的 GPT4.1-Nano。

在推理领域,Qwen3-4B-Thinking-2507 甚至可以媲美中等规模的 Qwen3-30B-A3B(thinking)。

官方表示,2507 版本的 Qwen3-4B 模型对手机等端侧硬件部署尤为友好。

以下为模型核心亮点

Qwen3-4B-Instruct-2507

通用能力均大幅提升,超越商业闭源的小尺寸模型 GPT-4.1-nano,与中等规模的 Qwen3-30B-A3B(non-thinking)性能接近。

新模型覆盖更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。

上下文理解扩展至 256K,小模型也能处理长文本。

Qwen3-4B-Thinking-2507  

推理能力大幅增强,AIME25 高达 81.3 分,Qwen3-4B-Thinking-2507 的推理表现可媲美中等模型 Qwen3-30B-Thinking。

特别是在聚焦数学能力的 AIME25 测评中,以 4B 参数量斩获 81.3 分成绩。

Agent 分数爆表,相关评测均超越更大尺寸的 Qwen3-30B-Thinking 模型。

256K tokens 上下文的理解能力,支持更复杂的文档分析、长篇内容生成、跨段落推理等场景。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 通义千问 数学 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论