量子位 2小时前
中国最强编程模型来了! 阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

什么这 code 那 code,先别 code 了,因为——

中国最强编程模型来了!

就在刚刚,阿里突袭发布 Qwen3.6-Plus 新一代基座大模型,在编程和智能体能力上,直接捅破了国产大模型的天花板,强到 Next Level~

那…到底有多 Next 呢? ?

1M 上下文直接拉满,不仅能独立拆解任务、规划执行路径、全程自测迭代达到目标,还能根据简单提示词搓出 Vibe Coding。

这不嘛,前几天模型的 preview 版本提前上了 OpenRouter,小编也拿到开白资格抢先实测了一番!

我只给了 AI 一句话,几秒钟就得到了一个可移缩放的 3D 的雪山场景多模态网页,连雪花都是动态飘落的~

模型表现归模型表现,关键还是要拉到真实评测中见真章啊!!

值得一提的是,在涵盖智能体编程、真实世界任务的权威评测中,Qwen3.6-Plus 目前已经成为了最接近全球最强 Claude 系列的国产模型:

(Claude:不 er,哥们儿???)

专业搞代码的大佬们拿到 Qwen3.6-Plus 更是爽感拉满,这不嘛,提前体验过的网友们速速给出反馈了——

下面这位大哥直言,速度和生成体验感比 Claude 更夯,Opus 4.6 你还得加把劲儿啊!

更有硬核网友直接开了压力测试,在 5 个复合仓库里轮番轰炸,得出的结论嘛:甭说别的,这模型是真靠谱~

目前,Qwen3.6-Plus 已第一时间上线阿里云百炼,且 API 服务已全面开放;此外,在悟空、千问 APP 等阿里 AI 应用和平台也已同步上线。

这下好了,大家可以——直接上手搓搓搓了!!

Vibe Coding、多模态理解能力忒夯

不知道大家们还记不记得,上个月 Qwen3.5 刚发布的时候,全网都在感叹模型强大的编程能力。

但老话说得好,一代更比一代强,事实上相较于上一代模型,这次发布的 Qwen3.6-Plus 在编程 Coding 能力、智能体 Agent 能力和工具调用能力上直接上演了一场大型的《自己卷自己》的戏码。(doge)

咋个卷法呢?

在性能上,Qwen3.6-Plus 表现出了比上一代模型更敏锐的理解感知能力和更强大的多模态推理能力。

在 SWE-bench 系列真实编程任务测试、考察终端编程的 Terminal-Bench2、长程编程任务 NL2Repo,以及 Claw-Eval、QwenClawBench 等真实世界 Agent 能力评测中——

Qwen3.6-Plus 几乎直逼 Claude Opus 4.5,甚至部分性能表现比 Claude 更优,还超越了 2 倍乃至 3 倍参数量的其他主流模型。

看来,千问妥妥掌握了「以小胜大」的秘方啊??

不仅如此,基于百万 token 的上下文窗口。

模型还集中对 OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode 等系列 Agent 框架进行了优化支持。

是的,这模型卷的已经不只是模型本体,连整套 Agent 工作流的适配度都梭哈了…

只能说——《夯,极夯》。

咱们直接老规矩,围绕模型擅长的 Vibe Coding、多模态理解、问题重构等几个能力维度上实打实测一波!

Vibe Coding 能力实测

常言道,用编程模型必玩 Vibe Coding,所以,咱就先来考一考 Qwen3.6-Plus 在网页开发上的能力~

大家都知道,对 AI 或者 Agent 来说,网页开发其实不是啥难事儿,真正的挑战在于——

只用一句简单提示词,就能做出兼具视觉设计、交互逻辑与页面跳转的完整页面,所以咱这次直接把难度抬高。

用一句大白话指令,让 AI 一键生成一个可交互的「AI 资讯日历网站」!

帮我生成一个有科技感的 AI 日历网站。首页为月历视图,每一天标注对应的 AI 大事件,用户点击日期后可进入详情页查看完整内容,包括事件标题、一句话简介、时间和来源链接。

大概 2 分钟的时间,AI 就给我搓出来了个完成度相当高的 AI 资讯日历网页。

从前端生成效果来看,整体视觉简洁而且科技味儿还蛮浓,不仅清晰呈现了日历结构,还自动对不同资讯做了色彩区分,阅读体验十分友好!!!

在具体交互能力上,还支持前后月份翻阅查询,每日日期格子内均标注可点击的资讯入口,点一下就能查看摘要内容。

此外,不知道大家发现没,页面右侧还附带一个可跳转链接,一键就能跳到原资讯网站,查阅信息源贼方便:

接下来,我们换种玩法,不生成网页了,改玩点有意思的。

挑战用一句话让 AI 帮忙制作一个可交互的色彩度比较鲜明的 3D 的雪山场景,看看这 AI 在前端视觉上的表现力咋样。

制作一个 3D 的雪山场景,雪山中间有一个日式的寺庙,整体风格参考塞尔达旷野之息。

先看视觉效果,u1s1 确实有点塞尔达那种清新明快画风的意思,色彩饱和度和光影质感肉眼看都还是蛮舒服的。

不仅如此,我还可以灵活拖动视角,360 度旋转场景、用滚轮自由缩放远近这些都 ok,甚至,连雪花粒子都是动态飘落的???

我们继续挑战,再来实测一些更好玩的场景,这回看看 Qwen3.6-Plus 的「游戏网站」搭建能力咋样~

帮我做一个虚拟宠物养成网页,页面主体是宠物的房间,用户可以随时看到它的状态,宠物有饥饿、心情、体力和成长值,会随时间变化,用户可以在房间里进行喂食、玩耍、洗澡、睡觉等互动,加入简单动画、表情变化、随机事件和任务系统,完成可获得金币购买道具,整体风格可爱~

So cute!!瞬间梦回小时候玩的《皮卡堂》小游戏~(萌翻了 .jpg)

从实际效果看,在这个页面里我不仅可以查看宠物的动态,宠物还可以跟着我的鼠标位置进行移动。

不仅如此,页面右侧还设有状态值、互动功能、任务和商店四大板块,我还可以根据宠物状态进行喂食、玩耍等互动操作。

你还真别说,Qwen3.6-Plus 在审美和交互设计这块儿提升不少,确实真 · 有两下子…

咱们最后再来试一个大家几乎都玩过的消消乐小游戏,这次我直接把提示词写到简单不能再简单:

生成一个美食卡通主题的消消乐小游戏网站。

哪怕提示词如此大白话,哪怕如此简单,这输出效果也确实没得说。

是的,我只用了一句提示词,Qwen3.6-Plus 把核心玩法、连锁机制、视觉 UI、辅助能力这些全 cover 了…

多模态理解能力实测

除了强大的 Vibe Coding 能力外,Qwen3.6-Plus 在多模态理解这块儿也属实有两把刷子。

具体来说,就是从视觉感知,到多模态推理,再到智能体执行都能 hold 得住!

这次我喂给了模型一段 AI 资讯类的视频内容,整个视频时长说实话还蛮长的,很考验模型的内容解析能力。

我要让它做的,不单单只是解析视频核心内容,而是要让它帮我进行逐秒脚本分析,并且根据内容二创成一份适合小红书笔记发的爆款文案,以下是我喂给 Qwen3.6-Plus 的原视频:

请你帮我解析一下这条视频内容,做逐秒脚本拆解,并根据视频内容二创成一篇适合发小红书的爆款笔记文案:

可以看到,Qwen3.6-Plus 不仅给我进行了逐秒的视频脚本拆解,而且每一个视角戳里还帮我贴心地将脚本从视觉、内容、目的三个维度进行了推理判断。

不仅如此,在下方还按照要求输出了对应的小红书爆款文案,并将文案概括成开头钩子、核心内容、关键发现、引起共鸣几个维度,666 啊~

最后的最后,我们再来上点难度,让 Qwen3.6-Plus 尝试根据图片内容复刻一个在线网页。

这次,我喂给了它一个旅游规划的页面图片,让它根据页面里的功能,直接复刻并搭建出一个完整的在线网页——

哪怕几乎没有任何文字的提示词指令,Qwen3.6-Plus 依旧通过多模态能力准确出了图片的内容,并且嘛——比我图片里手画的页面布局效果更好、视觉呈现更牛、内容更充实??

更复杂的编程场景照样在行

看到这儿估计有朋友该说了,上面这些场景多少有点太简单了吧。

你还真别说,更硬核的编程场景这不就来了嘛!

事实上,除了能用简单提示词实现 Vibe Coding、解析并执行多模态内容外,Qwen3.6-Plus 还能基于命令行工具生成页面、进行代码问题分析与重构,甚至自主开发工具。

在命令行页面生成能力上,Qwen3.6-Plus 支持通过 CC 等工具直接调用 API。

我们只需输入 「根据开源仓库生成 landing page」这类简洁指令,就能快速产出完整网页,实现高效自动化的前端开发!!

话不多说!先给咱们「电子老婆」来个项目官网主页~

这里说的电子老婆,正是 GitHub 上的开源项目 AIRI —— 仿照超火虚拟主播 Neuro-sama 打造,能实时陪聊、陪打游戏,妥妥全天候在线的电子伴侣(doge)。

通过 VS Code 中的 Qwen Code 插件,我让 Qwen3.6-Plus 直接读取开源项目介绍,自主理解需求、规划页面结构,并一次性输出完整可用的代码:

(提供项目)根据这个开源项目生成 landing page,输出 HTML+tailwind CSS。

从 Thinking 过程可以清晰地观察到 Qwen3.6-Plus 一步步查看需求、创建文件,整个过程能够实时监测:

Done!耗时约 3 分钟,Qwen3.6-Plus 就生成好了项目官网页面,代码自动保存在 landing-page.html 文件中:

咱打开 html 文件来看下效果~

首先,看上去还蛮符合项目的宣传逻辑,把临时体验页面、项目开源地址、社区地址全都关联上了。

不仅如此,导航栏还能够跳转到对应内容,把项目介绍里包含的能力、可兼容的模型厂商、部署步骤都给概括全了,不戳不戳~

接下来,我们来测试模型的「问题分析与代码重构」能力。

这次我又在 Qwen Code 命令行工具里,喂给了 Qwen3.6-Plus 一坨问题不小的老旧代码,让它捉捉虫:

(提供项目)我刚接手这个项目,该怎么优化呢?

Qwen3.6-Plus 看懂了原有逻辑,自动整理了一份优化清单,但是在动手之前还是询问了一句「需要开始实施吗」。

比起其他大刀阔斧直接上手的模型来说,这份分寸感把握得还是相当不赖的~

下一步,当然就是让它帮我修改 x 山代码了!!我反手就是一个——

这里一定要说个好玩的,Qwen 你的碎碎念也有太活人感了,先给产品经理画饼,然后去 push 服务器,接着又在老板面前装!模!作!样!

(还有啥是你做不出来的??)

说归说闹归闹,任务还得按部就班搞下去,修完 Bug、再做优化,主打一个有条不紊~

优化完成!人家具体都改了点啥呢——请看下方总结。最后嘛,还来了点小建议,be like:

安装依赖、写测试脚本都可以直接交给它来做,我全程省心省力只负责点头。(美哉美哉~)

(Qwen3.6-Plus:俺的编程本事,可是不孬!!!)

AI 编程的门槛,这回是真被打下来了

说实话,从今年年初开始,我们真的接触了太多太多的 AI Agent 和各种 Claw 字辈儿的龙虾。

此外还有一个大家感知很深的事是,当下厂商们也越来越押注模型的编程能力,各种 Vibe Coding 产品也层出不穷。

我自己也在社交软件上刷到过很多感兴趣的项目,点开之前觉得蛮有意思,可一看对方用到的提示词和辅助工具,我很快就意识到了一个问题。

那就是没点提示词本事,没点基础编程能力,想做出和人家同款效果的 Vibe Coding 产品,真的蛮难的…(哭死…)

只能说,大家还是苦 Vibe Coding《上手门槛》久矣。

图片由 AI 生成

这次实测 Qwen3.6-Plus 下来,除了对于模型在复杂代码治理、跨域长程规划等真实世界的专业编程任务的中呈现的过硬能力外,我更大的感受在于——

它确确实实把普通人的「编程门槛」大幅拉低了。

基于自然语言驱动的 Vibe Coding 不再是概念,只要一句大白话,我们就能把脑子里的想法直接变成可运行的现实。

在过去很长一段时间,行业默认用参数规模来换性能提升,模型越大,效果越好,也越贵。

而这一次,Qwen3.6-Plus 通过一个体量更轻的模型,交出了可以对标甚至超过 2 到 3 倍参数模型的结果,这对我们用户来说当然是好事情。

当然,更进一步从行业角度看,也不难看出 Qwen3.6-Plus 也正是阿里 ATH(Alibaba Token Hub)思路在编程模型上一次很有代表性的落地。

创造高效 Token、输送低成本 Token、应用普惠化 Token,在 ATH 成立后仅一个月的时间,就速速口号照进现实了。

最后值得一提的是,Qwen3.6-Plus 是千问 3.6 系列推出的第一个模型。

后面千问 3.6 系列还会开源更多不同尺寸的版本给大家,另外性能更强的旗舰款 Qwen3.6-Max 也会在近期发布。

大家可以小小期待一下子~

体验链接:

[ 1 ] Qwen Chat:https://chat.qwen.ai/

[ 2 ] 阿里云百炼:https://bailian.console.aliyun.com/cn-beijing?tab=model#/model-market/detail/qwen3.6-plus

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论