新浪极客前线 13小时前
微信AI助手“小微”背后的技术用的是谁家的模型?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

微信 AI 助手 " 小微 " 背后的核心技术采用了腾讯自研的 WeLM 模型作为主模型,并在部分复杂任务或回答中调用 DeepSeek 模型进行辅助兜底,同时根据腾讯客服官方确认,实际使用了包括腾讯自研及开源优质模型在内的多个 AI 模型。

一、小微模型架构:双模型协同

1. 主模型:WeLM(微信语言模型)

WeLM 是微信团队自研的中文大语言模型,作为小微的主模型,负责日常对话、基础问答和大部分服务调用的语义理解与生成。

该模型专门针对微信生态内的对话场景和任务型指令进行了优化,能够深度理解用户通过自然语言发出的操作请求。

在灰度测试中,小微的自我介绍明确标注 " 主模型为 WeLM"。

2. 辅助模型:DeepSeek 兜底

当遇到复杂推理需求或 WeLM 自身能力不足以提供高质量回答时,系统会自动调用 DeepSeek 模型进行响应。

这种 " 主模型 + 兜底模型 " 的混合架构,旨在平衡性能与成本,同时确保在复杂场景下依然能输出可靠结果。

DeepSeek 作为开源优质模型,被用于补足 WeLM 在特定类型推理任务上的短板。

二、技术路线:" 混合用模 " 策略

1. 务实主义的技术选择

腾讯并未完全押注自家混元大模型,而是采用双轨并行的技术路线。

除 WeLM 和 DeepSeek 外,微信团队还测试了智谱、阿里等其他第三方大模型。

这种策略的核心逻辑是:借用外部成熟模型的能力,快速抢占 AI 应用入口,优先构建用户体验和服务生态。

2. 自研轻量化小模型并行推进

微信团队同步自研了轻量化小模型,用于高频、低延迟的场景。

轻量化模型可降低推理成本,适应微信庞大用户体量下的算力约束。

三、模型能力支撑的服务范围

1. 原生功能操控

用户通过文字或语音指令,小微可直接操作微信设置、发送消息、拨打电话、管理朋友圈。

这些功能的背后依赖 WeLM 对微信系统接口的深度理解与调用能力。

2. 跨应用服务调度

小微能识别用户意图,自动调起小程序完成打车、点外卖、挂号、买咖啡等任务。

目前美团、京东、携程、滴滴等头部平台已完成接入。

DeepSeek 在复杂任务链的规划与调度中起到辅助保障作用。

3. 内容创作与工具生成

支持搜索公众号 / 视频号内容、生成图片、推荐音乐歌单。

最受关注的功能是 " 一句话生成小程序 ",用户用自然语言描述需求即可产出简易小程序雏形。

四、安全与隐私的模型层设计

1. 双重授权机制

小微在调用小程序执行支付类操作前,必须经用户二次确认。

微信支付同步推出 "AI 专属卡 ",资金与主账户隔离,每笔消费需用户手动确认。

2. 记忆与隐私管理

小微支持上下文记忆,但用户可在 " 小微 > 右上角设置 > 记忆与隐私 " 中管理或清除记录。

模型层设计上,对话数据仅用于会话期间,不跨场景滥用。

五、模型生态的未来演进方向

1. 混元模型的迭代机遇

腾讯正加速推进混元 4.0 旗舰模型,目标挤入第一梯队。

一旦混元模型能力提升,微信 AI 可能逐步减少对第三方模型的依赖,实现全栈自研闭环。

2. 算力与灰度节奏

微信 14 亿月活用户规模下,全量开放对后台推理能力是巨大考验。

当前灰度测试仅覆盖部分用户,正式上线时间尚未确定,需等待算力底座储备充足。

六、总结:技术选择的关键特征

双模型混合:WeLM 主控 + DeepSeek 兜底,兼顾能力与安全。

多模型备用:同步测试智谱、阿里等第三方,保持技术弹性。

自研并行:轻量化小模型降低长期运营成本。

生态优先:模型选择服务于微信小程序的原子化服务调用,而非单纯追求模型性能指标。

本文由 AI 生成

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

微信 ai 腾讯 小程序 轻量化
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论