微信AI助手“小微”背后的技术用的是谁家的模型?

微信 AI 助手 " 小微 " 背后的核心技术采用了腾讯自研的 WeLM 模型作为主模型，并在部分复杂任务或回答中调用 DeepSeek 模型进行辅助兜底，同时根据腾讯客服官方确认，实际使用了包括腾讯自研及开源优质模型在内的多个 AI 模型。

一、小微模型架构：双模型协同

1. 主模型：WeLM（微信语言模型）

WeLM 是微信团队自研的中文大语言模型，作为小微的主模型，负责日常对话、基础问答和大部分服务调用的语义理解与生成。

该模型专门针对微信生态内的对话场景和任务型指令进行了优化，能够深度理解用户通过自然语言发出的操作请求。

在灰度测试中，小微的自我介绍明确标注 " 主模型为 WeLM"。

2. 辅助模型：DeepSeek 兜底

当遇到复杂推理需求或 WeLM 自身能力不足以提供高质量回答时，系统会自动调用 DeepSeek 模型进行响应。

这种 " 主模型 + 兜底模型 " 的混合架构，旨在平衡性能与成本，同时确保在复杂场景下依然能输出可靠结果。

DeepSeek 作为开源优质模型，被用于补足 WeLM 在特定类型推理任务上的短板。

二、技术路线：" 混合用模 " 策略

1. 务实主义的技术选择

腾讯并未完全押注自家混元大模型，而是采用双轨并行的技术路线。

除 WeLM 和 DeepSeek 外，微信团队还测试了智谱、阿里等其他第三方大模型。

这种策略的核心逻辑是：借用外部成熟模型的能力，快速抢占 AI 应用入口，优先构建用户体验和服务生态。

2. 自研轻量化小模型并行推进

微信团队同步自研了轻量化小模型，用于高频、低延迟的场景。

轻量化模型可降低推理成本，适应微信庞大用户体量下的算力约束。

三、模型能力支撑的服务范围

1. 原生功能操控

用户通过文字或语音指令，小微可直接操作微信设置、发送消息、拨打电话、管理朋友圈。

这些功能的背后依赖 WeLM 对微信系统接口的深度理解与调用能力。

2. 跨应用服务调度

小微能识别用户意图，自动调起小程序完成打车、点外卖、挂号、买咖啡等任务。

目前美团、京东、携程、滴滴等头部平台已完成接入。

DeepSeek 在复杂任务链的规划与调度中起到辅助保障作用。

3. 内容创作与工具生成

支持搜索公众号 / 视频号内容、生成图片、推荐音乐歌单。

最受关注的功能是 " 一句话生成小程序 "，用户用自然语言描述需求即可产出简易小程序雏形。

四、安全与隐私的模型层设计

1. 双重授权机制

小微在调用小程序执行支付类操作前，必须经用户二次确认。

微信支付同步推出 "AI 专属卡 "，资金与主账户隔离，每笔消费需用户手动确认。

2. 记忆与隐私管理

小微支持上下文记忆，但用户可在 " 小微 > 右上角设置 > 记忆与隐私 " 中管理或清除记录。

模型层设计上，对话数据仅用于会话期间，不跨场景滥用。

五、模型生态的未来演进方向

1. 混元模型的迭代机遇

腾讯正加速推进混元 4.0 旗舰模型，目标挤入第一梯队。

一旦混元模型能力提升，微信 AI 可能逐步减少对第三方模型的依赖，实现全栈自研闭环。

2. 算力与灰度节奏

微信 14 亿月活用户规模下，全量开放对后台推理能力是巨大考验。

当前灰度测试仅覆盖部分用户，正式上线时间尚未确定，需等待算力底座储备充足。

六、总结：技术选择的关键特征

双模型混合：WeLM 主控 + DeepSeek 兜底，兼顾能力与安全。

多模型备用：同步测试智谱、阿里等第三方，保持技术弹性。

自研并行：轻量化小模型降低长期运营成本。

生态优先：模型选择服务于微信小程序的原子化服务调用，而非单纯追求模型性能指标。

本文由 AI 生成

宙世代

一起剪

相关标签