硅星人 6小时前
对话吴嘉:打通阿里生态之后,千问还要做什么?
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

千问对自己挺狠的,或者说阿里对自己挺狠的。

用一个千问,把过去二十年的阿里,变成了一个 AI Agent。

1 月 15 日,千问 App 宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等基本上阿里生态中的关键的所有业务,上线超 400 项 AI 办事功能,在全球首次实现点外卖、买东西、订机票等 AI 购物能力,向所有用户开放。

基本上你可以用一个千问,调用整个阿里。阿里巴巴副总裁、千问 C 端事业群总裁吴嘉进一步透露:" 千问计划在半年内打通整个阿里生态,并将持续规划引入第三方伙伴。"

这使得千问构建的能力壁垒,在全球范围内几乎难以复制:OpenAI 没有电商,谷歌没有支付,亚马逊没有自研的顶尖模型。它们的 Agent 能聊天、能搜索、能写代码,却难以深入真正的交易闭环。

或许大部分人还没有意识到,千问此次这次升级远非一次交互方式的变革,它标志着阿里在内部达成了前所未有的协同与统一。

以此为起点,阿里已经进入全面拥抱 AI 的 " 战时 " 状态。

实测:千问如何把阿里变成一个 Agent?

为了实测千问的边界,我给了它一个相当复杂的任务,可不是点个外卖那么简单:帮我制定北京到西藏七天的旅行计划,1 月 16 日~1 月 23 日,预算 2w,一个人。并帮我整理好御寒所需要的装备列表,选购加入淘宝购物车。

这是一个并行任务,需要调用搜索、高德、飞猪、淘宝等多个 APP,下面是完整的执行过程(只加速不剪辑),在执行的过程中,可以看出很多千问的思路。

整个任务千问用了 7 分钟,它头脑清楚,几乎没有多余的动作。

第一步千问先去搜了 "1 月西藏旅游注意事项 "" 冬季西藏穿什么 "" 拉萨到纳木错怎么走 " 这类基础信息。它在建立对这个任务的基本认知:冬天去西藏冷不冷、会不会有高原反应、哪些景点开放、大概的行程怎么安排。这一步像是一个人在做攻略前先搜一圈别人的游记。

有了基本概念之后,千问开始查具体的距离和路线。它在用高德把景点之间的空间关系搞清楚,这样才能把行程排得合理,不会让你上午在东边下午跑到一百公里外的西边。然后通过调用飞猪,去查 1 月 16 日北京到拉萨的机票,查 1 月 23 日拉萨回北京的机票,查拉萨市区的酒店。这一步是在确认真实的价格和库存,推荐用户选择具体哪个航班几点起飞多少钱还有没有票。

在生成结果时,千问用 Python 写了一段代码,用来计算预算分配并生成攻略。所有信息汇总,输出一份完整的七日行程单:每天去哪、住哪、怎么走、花多少钱,外加一份御寒装备清单。

有一个细节很关键:最终生成的攻略里,每一个环节都可以直接点击购票和预订,不用跳转到飞猪,不用跳转到高德,全在千问里完成。

这就是 " 调用 " 和 " 连接 " 的区别。它不是一个超级入口去连接十几个 APP,它是一个 Agent 直接调度十几个 APP 的能力。那些 APP 变成了千问的手和脚,而不是千问引流的目的地。

当然,目前的千问也存在着一些问题。比如我明确要求了 " 选购加入淘宝购物车 ",它没有执行。装备清单列出来了,但只是文字,没有真的帮我加进购物车。推测原因是千问目前一次只能完成一个主任务," 规划行程 " 和 " 加购物车 " 被它理解成了两件事,它做完第一件就停了。

但这并不是能力缺失,更像是一个对于复杂需求理解层级的问题。千问已经能够调度阿里的多项个服务来完成复杂任务,这件事本身成立了。今天呈现出来展示的,是它当前能力的下限,上限是什么样,取决于模型对人的需求能理解到多深。

先打通阿里,然后连接一切

时至今日我们早已经明白,AI 注定要连接一切,问题在于连接谁?怎么连接?

OpenAI 在这方面遇到了麻烦。即便它拥有世界上顶尖的闭源模型,但没有互联网生态的它只能去连接别人。亚马逊封禁了 ChatGPT 的访问,而这原本是 OpenAI 一项重要的商业计划,让 AI 直接在电商网站上帮用户下单以赚取成交费用。没有自己的电商、没有自己的支付、没有自己的本地生活,OpenAI 的模型能力再强,也得看别人脸色。

这背后其实是整个互联网格局的结构性问题:谷歌有搜索、有地图、有邮箱,但没有电商,没有支付,做不到真正的闭环。而亚马逊有电商、有支付,但没有基础模型。互联网巨头们各有各的长板,也各有各的缺口,很少有人能同时握住 " 模型 + 场景 + 交易 " 的完整链条。

可阿里的位置不一样。它几乎是唯一一个同时拥有全球范围内的顶尖模型和完整生态的企业,淘宝、支付宝、飞猪、高德、饿了么、优酷、1688、闲鱼等等,千问调用它们,不需要谈判,不需要分成,不需要担心哪天被封禁。

比如在更广泛的生活服务方向,千问 App 直接支付宝政务服务,上线签证、户口、公积金等 50 项民生服务。用户不再需要像过去那样在不同部门网站间奔波,只需一句 " 杭州户口怎么办护照 ",千问即可完成政策解读、材料清单梳理,并直达办理入口,而这些对于其他模型厂商而言,又是一场从头开始。

当前,业内普遍认为:模型能力和智能化水平是入场券门槛,它们决定 Agent 的下限,但生态的完整性和互通性,才决定了 Agent 的天花板边界。这一轮竞赛,阿里手里的牌很齐。

不过,这只是个起点。

吴嘉告诉硅星人,千问事业群与其他业务部门正在紧密配合,双方合作成立了虚拟项目组。目前 70% 的精力集中在技术侧的打通,每个功能采取了不同的方式,有的是内部接口直连,有的走 A2A 协议,有的环节用 GUI 去理解内容。

技术方向的打通将在半年之内完成。接下来是更深一层的整合:业务的打通、运营的打通。比如外卖的进度卡是否要在千问中实时显示?用户在千问下的打车订单,高德那边如何同步处理?这次新功能上线,千问和淘宝闪购一起为用户提供了一定的大额红包用于拉新,后续内部也会作为一个整体持续对外运营。

" 无论是在千问还是在淘宝、淘宝闪购的 APP 下单,都是在阿里体系里,对我们来说是一样的。" 吴嘉说道。

这句话背后的意思是:用户从哪个门进来不重要,重要的是进来之后,整个阿里都在为他服务。

打通内部,对于千问而言,也只是一次探索和验证。阿里生态再大,也不可能覆盖所有场景。如果千问只能调用阿里自己的服务,它的能力边界就被框死了。通过跑通阿里来跑通技术、验证模式、打磨体验。一旦这个样本成立,下一步就是把同样的能力开放给外部。

吴嘉透露,接下来千问会开放更多第三方应用接入,和合作伙伴一起共创更大的 Agent 生态。

这意味着千问的野心不止于 " 阿里的 Agent",而是想成为 " 所有服务的 Agent"。

评论
大家都在看