微信 AI 助手 " 小微 " 背后的核心技术采用了腾讯自研的 WeLM 模型作为主模型,并在部分复杂任务或回答中调用 DeepSeek 模型进行辅助兜底,同时根据腾讯客服官方确认,实际使用了包括腾讯自研及开源优质模型在内的多个 AI 模型。

一、小微模型架构:双模型协同
1. 主模型:WeLM(微信语言模型)
WeLM 是微信团队自研的中文大语言模型,作为小微的主模型,负责日常对话、基础问答和大部分服务调用的语义理解与生成。
该模型专门针对微信生态内的对话场景和任务型指令进行了优化,能够深度理解用户通过自然语言发出的操作请求。
在灰度测试中,小微的自我介绍明确标注 " 主模型为 WeLM"。
2. 辅助模型:DeepSeek 兜底
当遇到复杂推理需求或 WeLM 自身能力不足以提供高质量回答时,系统会自动调用 DeepSeek 模型进行响应。
这种 " 主模型 + 兜底模型 " 的混合架构,旨在平衡性能与成本,同时确保在复杂场景下依然能输出可靠结果。
DeepSeek 作为开源优质模型,被用于补足 WeLM 在特定类型推理任务上的短板。
二、技术路线:" 混合用模 " 策略
1. 务实主义的技术选择
腾讯并未完全押注自家混元大模型,而是采用双轨并行的技术路线。
除 WeLM 和 DeepSeek 外,微信团队还测试了智谱、阿里等其他第三方大模型。
这种策略的核心逻辑是:借用外部成熟模型的能力,快速抢占 AI 应用入口,优先构建用户体验和服务生态。
2. 自研轻量化小模型并行推进
微信团队同步自研了轻量化小模型,用于高频、低延迟的场景。
轻量化模型可降低推理成本,适应微信庞大用户体量下的算力约束。
三、模型能力支撑的服务范围
1. 原生功能操控
用户通过文字或语音指令,小微可直接操作微信设置、发送消息、拨打电话、管理朋友圈。
这些功能的背后依赖 WeLM 对微信系统接口的深度理解与调用能力。
2. 跨应用服务调度
小微能识别用户意图,自动调起小程序完成打车、点外卖、挂号、买咖啡等任务。
目前美团、京东、携程、滴滴等头部平台已完成接入。
DeepSeek 在复杂任务链的规划与调度中起到辅助保障作用。
3. 内容创作与工具生成
支持搜索公众号 / 视频号内容、生成图片、推荐音乐歌单。
最受关注的功能是 " 一句话生成小程序 ",用户用自然语言描述需求即可产出简易小程序雏形。

四、安全与隐私的模型层设计
1. 双重授权机制
小微在调用小程序执行支付类操作前,必须经用户二次确认。
微信支付同步推出 "AI 专属卡 ",资金与主账户隔离,每笔消费需用户手动确认。
2. 记忆与隐私管理
小微支持上下文记忆,但用户可在 " 小微 > 右上角设置 > 记忆与隐私 " 中管理或清除记录。
模型层设计上,对话数据仅用于会话期间,不跨场景滥用。
五、模型生态的未来演进方向
1. 混元模型的迭代机遇
腾讯正加速推进混元 4.0 旗舰模型,目标挤入第一梯队。
一旦混元模型能力提升,微信 AI 可能逐步减少对第三方模型的依赖,实现全栈自研闭环。
2. 算力与灰度节奏
微信 14 亿月活用户规模下,全量开放对后台推理能力是巨大考验。
当前灰度测试仅覆盖部分用户,正式上线时间尚未确定,需等待算力底座储备充足。
六、总结:技术选择的关键特征
双模型混合:WeLM 主控 + DeepSeek 兜底,兼顾能力与安全。
多模型备用:同步测试智谱、阿里等第三方,保持技术弹性。
自研并行:轻量化小模型降低长期运营成本。
生态优先:模型选择服务于微信小程序的原子化服务调用,而非单纯追求模型性能指标。
本文由 AI 生成


登录后才可以发布评论哦
打开小程序可以发布评论哦