极客公园 9小时前
实测「微信小微」:当腾讯开始兑现国民 App 的 AI 潜能
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

这次真的不一样?

作者|连冉

编辑|郑玄

微信 AI,终于来了。

过去两年,AI 行业一直在寻找一个问题的答案:下一代 Agent 的入口在哪里?独立 App?浏览器?操作系统?

微信给出了另一种答案。前两天,微信原生 AI 助手「小微」开启了小范围灰度测试。在微信最新版本(8.0.75)里,用户可以在主界面左上角找到「小微」入口,点击即可进入 AI 助手;同时,向右滑动主界面,也可以快速唤起与「小微」的交互。

可以看到,小微并没有以一个新的 App 出现,也没有试图成为一个新的聊天入口,而是像一层被嵌入微信内部的 AI 能力:在聊天框里、公众号和视频号内容里、朋友圈、收藏、小程序等多个场景中出现,等待用户在需要的时候调用。

小微连接的是微信过去十多年积累下来的关系、内容和服务,但又没有急于替用户完成所有操作,从产品形态来看,更接近微信正在尝试打造的一层 AI 中间层。

这个选择背后,也是微信对于 Agent 在超级平台中应该扮演什么角色的一次探索。

01

小微不是新入口,

是微信的「AI 中间层」?

进入小微后,最直观的感受是,它并没有改变微信原有的使用方式,而是在原有场景里增加了一层理解能力。

目前,小微的入口分散在微信多个位置。首页左上角可以进入主入口,聊天窗口的「+」菜单里可以调用,公众号、视频号内容页也有对应入口。不同入口对应不同能力。

在聊天场景里,小微可以基于群聊上下文帮助用户总结聊天内容、提炼重点,甚至辅助生成回复

对于公众号或视频号内容,用户可以直接围绕文章、视频进行提问:

在朋友圈场景中,小微可以帮助用户快速了解近期好友动态:

对于收藏里的文件,也可以辅助整理信息,但这个整理目前还很初级,目前只能做到发信息给小微,小微自动提取关键信息、整理成笔记存入微信收藏,并不能做到理想中的帮忙整理整体收藏夹内容。

这些功能单独看并不陌生,但它们共同指向一个变化:AI 不再是一个需要用户主动打开的新工具,而开始成为微信内部的一种基础能力。

不过,小微的设计也非常克制。它拥有很强的信息理解能力,但执行权限并没有完全开放。

小微可以读取用户授权范围内的信息,帮助总结聊天、分析内容,但涉及发送消息、发红包等社交和资产相关操作时,都会要求用户确认。即使在帮助用户进入小程序、推荐服务时,也更多停留在「帮你找到、帮你组织、帮你抵达」,而不是直接替你完成交易。整理收藏夹的功能有限也是出于隐私保护的设计考量。

02

WeLM:微信需要的不是最大模型,

而是最懂场景的模型

小微背后,是微信自研的大模型 WeLM。它并没有用腾讯集团层面的混元大模型,而是把一款低调迭代多年的内部模型推到了台前。

WeLM 其实早在 2022 年 ChatGPT 爆火同期就已发布,之后几乎没有对外声量,甚至一度被外界认为项目搁置。

但实际上它一直在低调迭代,如今支撑小微的已经是 WeLM-V4 版本。过去几年,大模型行在卷参数、冲通用能力榜单,WeLM 始终没有凑这个热闹,可能它从诞生第一天起,目标就不是做「最强通用模型」,而是做「最适配微信生态的专用模型」。

这个定位的背后,或许是超级应用无法回避的现实约束:十亿级的用户规模,决定了它不能用通用大模型的思路做落地。

对独立 AI 产品来说,推理成本高一点、延迟久一点,只是体验优劣的问题;但对微信来说,每一次群聊总结、每一次内容问答、每一次服务调度,背后都是亿级的日常调用量,成本和延迟稍有偏差,全量铺开后就是天文数字的开销和无法接受的体验滑坡。

因此 WeLM 从架构上就选择了高度稀疏的 MoE 路线,通过单次推理仅激活部分参数控制计算量,再配合 KV-Mirror、分组查询注意力、多 Token 预测等一系列结构优化,核心目标只有一个:在保证能力达标的前提下,把单轮推理成本压到能服务十亿用户的区间。

成本之外,另一个硬约束是响应速度。

专业场景的 Agent,比如写代码、做方案,用户可以容忍几十秒甚至几分钟的「思考时间」;但微信里的 AI 交互全是碎片化的即时需求—— 问一句群聊重点、查一条聊天记录、总结一篇文章,用户的耐心只有几百毫秒。

实测中小微几乎能做到秒回,背后就是 WeLM 针对低延迟做的专项设计,比如 Hidden Decoding 技术:把复杂的推理过程全部放在模型内部完成,不在用户端展示冗长的生成过程,兼顾推理质量与交互效率,不让用户为「AI 的思考」买单。

而微信生态最独特的优势,也反过来成了 WeLM 的天然长板:长上下文。

通用大模型想要获得用户的个人上下文,需要用户主动上传文件、授权数据、对接第三方工具;但微信本身就是一个持续沉淀的上下文容器—— 聊天记录、社交动态、收藏内容、浏览轨迹、服务消费记录,所有个人数据天然就在这个生态里。

WeLM 在预训练阶段就针对性扩展了 128K 级的上下文窗口,不是为了刷榜单数据,而是为了原生适配微信里多维度、持续积累的个人数据环境。这也是为什么同样是内容总结、信息整理,小微的体验会比通用 AI 更贴合用户的真实语境。

当然微信也没有走完全自研的封闭路线。目前小微采用的是「自研为主、外部补充」的多模型策略:生态内的场景调度、日常交互由 WeLM 主导,保证成本与效率;遇到复杂推理、专业知识类的长尾需求,则调用 DeepSeek 等外部模型兜底。这种组合既守住了核心体验的可控性,也不用硬啃所有技术死角,是典型的务实路线。

说到底,WeLM 的路线,也是微信做 Agent 的底层逻辑的缩影:它不追参数规模的天花板,也不抢通用能力的榜单,所有技术选择都围绕「生态适配」四个字。

当小微全量开放后,WeLM 大概率会成为国内调用量最高的大模型之一—— 它未必是最「聪明」的,但一定是最懂微信场景、最贴近普通人日常数字生活的那一个。

03

真正的国民级 Agent,

应该出现在超级应用里?

在小微里更有想象力的功能,可能是小程序或者说小工具—— 只用一句自然语言描述,就能生成一个形态完整的轻量应用。

我给了小微一个「做一个碎片笔记」的指令,它几乎马上就生成了包括工作、灵感、生活的碎片笔记小程序,创建好之后,可以在设置里的小工具来持续使用。

对于普通用户来说,这意味着原本需要学习代码、设计页面、开发上线的小程序创建过程,被压缩成了一次自然语言对话。

当然,目前的小工具仍然处于早期阶段。生成后的工具只能由创建者自己使用,无法分享、分发,也不支持支付、多用户协作等复杂能力,更像是一个个人效率工具。

但它释放出的信号很重要。过去,小程序的供给主要来自开发者:有人提出需求,有团队负责开发,再通过平台分发给用户。

而 AI 正在改变这一链路。未来,一个普通用户也可能通过描述需求,生成一个满足自己场景的小工具。微信生态的供给,可能不再只来自专业开发者,而是来自用户和 AI 的共同创造。

但小工具只是开始。微信真正的优势,并不只是让用户生成工具,而是它已经拥有一个其他产品难以复制的上下文。

微信早已不只是一个聊天工具。用户的社交关系、工作沟通、内容消费、支付、本地生活服务,都在这个生态里持续沉淀。

因此,当 AI 开始理解和调用这些信息时,它改变的不只是回答问题的方式,而是在重新激活过去积累的数据。比如总结朋友圈,看似只是一个简单功能,但背后对应的是一个真实需求:用户没有时间浏览所有动态,却希望了解朋友近况。对于一些行业用户而言,朋友圈甚至也是获取行业信息的重要渠道。

AI 的价值,是把这些分散的信息重新组织起来。这也是小微和其他 AI 助手最大的区别。

目前来看,小微提供的能力并没有完全跳出行业已有范畴。美团、小红书、抖音等产品同样已经加入 AI 助手能力。

但微信的特殊性在于,它拥有长期积累的个人上下文。它天然更接近一个人的数字生活。未来,小微可能进一步演变成一个个人助理。

用户不需要记住某个功能在哪里,也不需要知道某个小程序叫什么,只需要表达需求,AI 就可以理解意图,并调用背后的服务完成任务。

这里实际上是一次从 GUI 到 LUI 的变化。过去,微信不断增加功能,但用户能看到和使用的入口始终有限。大量服务不是没有价值,而是隐藏在复杂的产品结构中。

AI 成为了这一层新的调度系统。过去是「人找服务」,用户需要搜索、点击、学习入口;未来可能变成「AI 找服务」,用户只需要描述需求。

比如,不需要主动打开外卖小程序、搜索商品、填写信息,而是告诉 AI「帮我安排一顿适合三个人的晚餐」;不需要翻找聊天记录,而是让 AI 帮忙整理某个项目的信息。

这也是微信做 Agent 最大的想象空间。过去几年,AI 产品竞争一直围绕一个问题展开:谁能成为下一个超级入口。

但微信给出的答案可能不同。它不是创造一个新的入口,而是让一个已经存在的超级 App 变成智能入口。

当然,这条路也并不简单。当 AI 开始理解用户关系、调用服务、参与交易,隐私边界、用户授权、平台与生态伙伴之间的利益平衡,都将成为新的挑战。

但如果 Agent 的终点是成为每个人的数字助手,那么它最可能生长的地方,或许不是一个新的 AI App,而是微信这样已经承载着人们数字生活的超级应用。

* 头图来源:AI 生成

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你期待使用「微信小微」吗?

评论
大家都在看