量子位 09-06
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

总参数达到1 万亿,阿里迄今为止最大的模型来了!

没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)

1 万亿啥概念?几乎一下子就比前一代 Qwen3(235B)多了四倍之多,相当于给大学生换了个爱因斯坦的脑子(bushi~

根据官方介绍,其最大亮点如下:

相较于 2.5 系列,新版本在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强,同时大幅减少了知识幻觉,让模型更智能、更可靠。

而且发布即全面上线,目前可通过通义 APP、 Qwen Chat 网页和阿里云 API体验。

更多官方测评显示,Qwen3-Max-Preview 一登场不仅比自家前一代最强模型 Qwen3(235B)更强,而且还打败了包括Claude Opus 4在内的国内外劲敌。

国内外反响更是一片热烈,随之而来的还有一大波测评:

1 万亿!模型规模真是越来越扩张了,迫不及待想要尝试。

Qwen 再次令人惊叹!

so,模型真实效果如何?不妨简单实测一下见真章。

支持多模态,编程已无需抽卡

综合官方测评和网友反馈,接下来我们主要考查 Qwen3-Max-Preview 解答难题和动手编程的能力。

需要提醒一下,阿里从 Qwen3(235B)开始就不再使用混合思维模式,所以这次的 Instruct 版本仅支持非思考模式

使用 Qwen Chat 网页,一上来就给它扔一道AIME 数学竞赛题试试:

(AIME:美国数学邀请赛,是介于 AMC10、AMC12 及美国数学奥林匹克竞赛之间的一个数学竞赛。)

由于 Qwen3-Max-Preview支持多模态,这里我们可以直接上传图片。

几乎转眼间,模型就唰唰唰地给出了详细作答过程及结果,最终答案"204"也与 AIME 这道题的标准答案一致。

小试牛刀过后,接下来进入编程环节。

用 p5js 创建多彩的可交互动画。

速度同样很快,Qwen3-Max-Preview 几乎立即给出了一段完整代码,而且代码能够成功运行。

鼠标点到哪里,哪里就会产生交互效果:

生成一个扫雷游戏。

一句话制作扫雷这种经典小游戏也是轻轻松松,而且是一次成功,无需反复沟通和抽卡。

代码成功运行后,我们也简单试玩了一下,只是很快就 " 踩雷 " 了 ( doge):

最后来试试制作前端网页,不妨就让它来个自我介绍:

帮我制作一个介绍 Qwen3-Max-Preview 的可交互网站。

网站代码生成后,既可以保存成文件直接打开,还能在问答末尾点击 " 预览 " 一键查看效果。

预览效果如下,网站设计简洁直观,也具有初级交互效果:

当然,如果你更懂提示词,效果也会更好,某网友为 Qwen3-Max-Preview 制作的庆祝网页效果就还不错。

顺带一提,还有人对 Qwen3-Max-Preview 的生成速度进行了实际评估,大家可以感受一下:

以 >107 个 token/ 秒的速度生成 4467 个 token。

以上实测不难看出新模型确实能力更强了,尤其在编程方面,所有尝试都是一次成功。

此外,阿里云百炼平台还透露了模型的 API 价格——当前版本根据输入 Token 数,采取阶梯计费。

原生支持的上下文长度及最大输入 / 输出如下:

虽然目前官方并未正式宣布开源这款模型,但 Qwen 身为开源阵营的重要一员,其后续仍然值得期待。

One More Thing

就在 Qwen3-Max-Preview 基础版发布后,通义千问开源负责人林俊旸还在朋友圈透露其正式版很快到来

而且还表达了自己对这款模型的感受:

确实是我们搞过的最有趣的模型,(虽然)配方上没有大改,但比之前的 235B 版本明显好了不少。

这也让他对继续扩展模型规模充满信心。

另外,关于正式版人们现在也有了更多推测。

按照官方之前的节奏,预计大概率后面还有一个推理版本,而且或许就在几天之后。(Qwen3-235B 推理非推理中间仅隔了 4 天)

最后,你体验这款新模型了吗?欢迎回评论区分享一波 ~

立即体验:

Qwen Chat:https://chat.qwen.ai

阿里云百炼 API 服务:https://bailian.console.aliyun.com/?tab=model#/model-market

参考链接:

[ 1 ] https://x.com/alibaba_qwen/status/1963991502440562976?s=46&t=R82LqSqpRZuVhcZxqH_Vlw

[ 2 ] https://x.com/ali_tongyilab/status/1963979028890546222?s=46&t=R82LqSqpRZuVhcZxqH_Vlw

[ 3 ] https://x.com/vectro/status/1964080871759139322?s=46&t=R82LqSqpRZuVhcZxqH_Vlw

[ 4 ]

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题   扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~

进群后,你将直接获得:

  最新最专业的 AI 产品信息及分析  

   不定期发放的热门产品内测码

   内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

编程 阿里 数学 美国 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论