量子位 10-22
Qwen深度研究一夜升级!可生成网页和音频播客,新模型能认医生手写体
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

Qwen 版深度研究加速进化,一觉起来增加了听觉和视觉输出:

可以生成网页和音频了。

AI 深度研究整合的内容,变成图文并茂的网页,还可以一键部署,任何人可凭链接查看,方便对外展示。

长篇文字内容也可以变成音频播客,方便自己在碎片时间消化吸收。

与此前火爆的 NoteBookLM 相比,深度研究作为输入还省去了给 AI 提供内容的环节。

改进产品功能的同时,Qwen 团队也在不断更新背后的模型。

最新版视觉语言模型 Qwen3 VL 甚至可以识别地狱难度的医生手写体。

实测新版 Qwen 深度研究

加上 OpenAI 新出的 ChatGPT Atlas,AI 浏览器这个品类已经有不少产品出现了。

那么该如何挑选呢?这个活就非常适合让深度研究产品来干。

打开深度研究功能,默认会选择最强的 Qwen3-Max 模型。

它不会直接闷头就开干,而是先向用户确认具体意图。

得到确认以后,智能体会开始分布操作,总共耗时 6 分钟。

新功能的入口藏的也太深了,没点提示真的找不到,需要点击在线查看文件。

之后会在右侧查看区域找到 " 创建 " 功能。

先尝试网页开发,需要生成一分钟左右。

完成的页面比较简洁美观,还带动效,甚至可以切换白天 / 黑夜模式。

这样观看 AI 深度研究的结果,确实比大段文字直观多了。

接下来点击部署,就可以公开或私密部署网页内容,我们把链接放到文章末尾。

接下来尝试生成播客功能,可以分别选择主持人和嘉宾的音色。

不同音色中还带不同方言,枯燥的文字一下子就生动起来了。

补齐视觉语言模型系列版图

与此同时,Qwen3-VL 系列更新最大参数 32B 和最小参数 2B 版本。

根据团队负责人林俊旸介绍,是这个系列最后一次更新了,目前 4 个版本都是密集模型。

确实从评测结果上看,32B 版本性能已经超越上代 Qwen2.5-VL 的 72B 版本,以及 OpenAI 和 Anthropic 的闭源方案,也没有什么必要再堆参数了。

Qwen 深度搜索生成网页预览:

https://chat.qwen.ai/s/deploy/591f175a-0ccc-46bf-9266-77187a1ce54a

在线试玩: https://chat.qwen.ai/?inputFeature=deep_research

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

  年度科技风向标「2025 人工智能年度榜单」评选报名火热进行中!我们正在寻找 AI+ 时代领航者  

❤️‍   企业、产品、人物 3 大维度,共设立了 5 类奖项,欢迎企业报名参与   

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 医生
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论