实测「微信小微」：当腾讯开始兑现国民 App 的 AI 潜能

这次真的不一样？

作者｜连冉

编辑｜郑玄

微信 AI，终于来了。

过去两年，AI 行业一直在寻找一个问题的答案：下一代 Agent 的入口在哪里？独立 App？浏览器？操作系统？

微信给出了另一种答案。前两天，微信原生 AI 助手「小微」开启了小范围灰度测试。在微信最新版本（8.0.75）里，用户可以在主界面左上角找到「小微」入口，点击即可进入 AI 助手；同时，向右滑动主界面，也可以快速唤起与「小微」的交互。

可以看到，小微并没有以一个新的 App 出现，也没有试图成为一个新的聊天入口，而是像一层被嵌入微信内部的 AI 能力：在聊天框里、公众号和视频号内容里、朋友圈、收藏、小程序等多个场景中出现，等待用户在需要的时候调用。

小微连接的是微信过去十多年积累下来的关系、内容和服务，但又没有急于替用户完成所有操作，从产品形态来看，更接近微信正在尝试打造的一层 AI 中间层。

这个选择背后，也是微信对于 Agent 在超级平台中应该扮演什么角色的一次探索。

小微不是新入口，

是微信的「AI 中间层」？

进入小微后，最直观的感受是，它并没有改变微信原有的使用方式，而是在原有场景里增加了一层理解能力。

目前，小微的入口分散在微信多个位置。首页左上角可以进入主入口，聊天窗口的「+」菜单里可以调用，公众号、视频号内容页也有对应入口。不同入口对应不同能力。

在聊天场景里，小微可以基于群聊上下文帮助用户总结聊天内容、提炼重点，甚至辅助生成回复

对于公众号或视频号内容，用户可以直接围绕文章、视频进行提问：

在朋友圈场景中，小微可以帮助用户快速了解近期好友动态：

对于收藏里的文件，也可以辅助整理信息，但这个整理目前还很初级，目前只能做到发信息给小微，小微自动提取关键信息、整理成笔记存入微信收藏，并不能做到理想中的帮忙整理整体收藏夹内容。

这些功能单独看并不陌生，但它们共同指向一个变化：AI 不再是一个需要用户主动打开的新工具，而开始成为微信内部的一种基础能力。

不过，小微的设计也非常克制。它拥有很强的信息理解能力，但执行权限并没有完全开放。

小微可以读取用户授权范围内的信息，帮助总结聊天、分析内容，但涉及发送消息、发红包等社交和资产相关操作时，都会要求用户确认。即使在帮助用户进入小程序、推荐服务时，也更多停留在「帮你找到、帮你组织、帮你抵达」，而不是直接替你完成交易。整理收藏夹的功能有限也是出于隐私保护的设计考量。

WeLM：微信需要的不是最大模型，

而是最懂场景的模型

小微背后，是微信自研的大模型 WeLM。它并没有用腾讯集团层面的混元大模型，而是把一款低调迭代多年的内部模型推到了台前。

WeLM 其实早在 2022 年 ChatGPT 爆火同期就已发布，之后几乎没有对外声量，甚至一度被外界认为项目搁置。

但实际上它一直在低调迭代，如今支撑小微的已经是 WeLM-V4 版本。过去几年，大模型行在卷参数、冲通用能力榜单，WeLM 始终没有凑这个热闹，可能它从诞生第一天起，目标就不是做「最强通用模型」，而是做「最适配微信生态的专用模型」。

这个定位的背后，或许是超级应用无法回避的现实约束：十亿级的用户规模，决定了它不能用通用大模型的思路做落地。

对独立 AI 产品来说，推理成本高一点、延迟久一点，只是体验优劣的问题；但对微信来说，每一次群聊总结、每一次内容问答、每一次服务调度，背后都是亿级的日常调用量，成本和延迟稍有偏差，全量铺开后就是天文数字的开销和无法接受的体验滑坡。

因此 WeLM 从架构上就选择了高度稀疏的 MoE 路线，通过单次推理仅激活部分参数控制计算量，再配合 KV-Mirror、分组查询注意力、多 Token 预测等一系列结构优化，核心目标只有一个：在保证能力达标的前提下，把单轮推理成本压到能服务十亿用户的区间。

成本之外，另一个硬约束是响应速度。

专业场景的 Agent，比如写代码、做方案，用户可以容忍几十秒甚至几分钟的「思考时间」；但微信里的 AI 交互全是碎片化的即时需求—— 问一句群聊重点、查一条聊天记录、总结一篇文章，用户的耐心只有几百毫秒。

实测中小微几乎能做到秒回，背后就是 WeLM 针对低延迟做的专项设计，比如 Hidden Decoding 技术：把复杂的推理过程全部放在模型内部完成，不在用户端展示冗长的生成过程，兼顾推理质量与交互效率，不让用户为「AI 的思考」买单。

而微信生态最独特的优势，也反过来成了 WeLM 的天然长板：长上下文。

通用大模型想要获得用户的个人上下文，需要用户主动上传文件、授权数据、对接第三方工具；但微信本身就是一个持续沉淀的上下文容器—— 聊天记录、社交动态、收藏内容、浏览轨迹、服务消费记录，所有个人数据天然就在这个生态里。

WeLM 在预训练阶段就针对性扩展了 128K 级的上下文窗口，不是为了刷榜单数据，而是为了原生适配微信里多维度、持续积累的个人数据环境。这也是为什么同样是内容总结、信息整理，小微的体验会比通用 AI 更贴合用户的真实语境。

当然微信也没有走完全自研的封闭路线。目前小微采用的是「自研为主、外部补充」的多模型策略：生态内的场景调度、日常交互由 WeLM 主导，保证成本与效率；遇到复杂推理、专业知识类的长尾需求，则调用 DeepSeek 等外部模型兜底。这种组合既守住了核心体验的可控性，也不用硬啃所有技术死角，是典型的务实路线。

说到底，WeLM 的路线，也是微信做 Agent 的底层逻辑的缩影：它不追参数规模的天花板，也不抢通用能力的榜单，所有技术选择都围绕「生态适配」四个字。

当小微全量开放后，WeLM 大概率会成为国内调用量最高的大模型之一—— 它未必是最「聪明」的，但一定是最懂微信场景、最贴近普通人日常数字生活的那一个。

真正的国民级 Agent，

应该出现在超级应用里？

在小微里更有想象力的功能，可能是小程序或者说小工具—— 只用一句自然语言描述，就能生成一个形态完整的轻量应用。

我给了小微一个「做一个碎片笔记」的指令，它几乎马上就生成了包括工作、灵感、生活的碎片笔记小程序，创建好之后，可以在设置里的小工具来持续使用。

对于普通用户来说，这意味着原本需要学习代码、设计页面、开发上线的小程序创建过程，被压缩成了一次自然语言对话。

当然，目前的小工具仍然处于早期阶段。生成后的工具只能由创建者自己使用，无法分享、分发，也不支持支付、多用户协作等复杂能力，更像是一个个人效率工具。

但它释放出的信号很重要。过去，小程序的供给主要来自开发者：有人提出需求，有团队负责开发，再通过平台分发给用户。

而 AI 正在改变这一链路。未来，一个普通用户也可能通过描述需求，生成一个满足自己场景的小工具。微信生态的供给，可能不再只来自专业开发者，而是来自用户和 AI 的共同创造。

但小工具只是开始。微信真正的优势，并不只是让用户生成工具，而是它已经拥有一个其他产品难以复制的上下文。

微信早已不只是一个聊天工具。用户的社交关系、工作沟通、内容消费、支付、本地生活服务，都在这个生态里持续沉淀。

因此，当 AI 开始理解和调用这些信息时，它改变的不只是回答问题的方式，而是在重新激活过去积累的数据。比如总结朋友圈，看似只是一个简单功能，但背后对应的是一个真实需求：用户没有时间浏览所有动态，却希望了解朋友近况。对于一些行业用户而言，朋友圈甚至也是获取行业信息的重要渠道。

AI 的价值，是把这些分散的信息重新组织起来。这也是小微和其他 AI 助手最大的区别。

目前来看，小微提供的能力并没有完全跳出行业已有范畴。美团、小红书、抖音等产品同样已经加入 AI 助手能力。

但微信的特殊性在于，它拥有长期积累的个人上下文。它天然更接近一个人的数字生活。未来，小微可能进一步演变成一个个人助理。

用户不需要记住某个功能在哪里，也不需要知道某个小程序叫什么，只需要表达需求，AI 就可以理解意图，并调用背后的服务完成任务。

这里实际上是一次从 GUI 到 LUI 的变化。过去，微信不断增加功能，但用户能看到和使用的入口始终有限。大量服务不是没有价值，而是隐藏在复杂的产品结构中。

AI 成为了这一层新的调度系统。过去是「人找服务」，用户需要搜索、点击、学习入口；未来可能变成「AI 找服务」，用户只需要描述需求。

比如，不需要主动打开外卖小程序、搜索商品、填写信息，而是告诉 AI「帮我安排一顿适合三个人的晚餐」；不需要翻找聊天记录，而是让 AI 帮忙整理某个项目的信息。

这也是微信做 Agent 最大的想象空间。过去几年，AI 产品竞争一直围绕一个问题展开：谁能成为下一个超级入口。

但微信给出的答案可能不同。它不是创造一个新的入口，而是让一个已经存在的超级 App 变成智能入口。

当然，这条路也并不简单。当 AI 开始理解用户关系、调用服务、参与交易，隐私边界、用户授权、平台与生态伙伴之间的利益平衡，都将成为新的挑战。

但如果 Agent 的终点是成为每个人的数字助手，那么它最可能生长的地方，或许不是一个新的 AI App，而是微信这样已经承载着人们数字生活的超级应用。

* 头图来源：AI 生成

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

极客一问

你期待使用「微信小微」吗？