微信原生智能体「小微」调研：灰度进展与 WeLM 技术架构

写在前面：本文按 2026-07-02 之前的公开报道与微信 AI 官方博客整理，我没有拿到内测资格，功能实测部分转述自界面新闻等媒体的灰度体验，属外部观察。

一、先给结论

微信把智能体做成了系统能力而非聊天窗口：小微的价值不在问答，在于它拿到了操作微信本体和小程序生态的权限。

2026-06-20 起小范围灰度，入口是主界面左上角绿色机器人图标，标注「测试版」，需微信 8.0.75+；多方报道称目标 Q3 扩大开放。
能力核心：自然语言（文字/语音）发消息、打电话、改设置、设提醒；调起并代操作小程序（点外卖、挂号、打车、订酒店）；总结群聊/公众号内容；一句话生成小工具。
底层是多模型混合：主模型为微信自研 WeLM 新一代（V4-80B-A3B 高稀疏 MoE），复杂推理由 DeepSeek 兜底，高频低延迟任务（设提醒、查天气）走自研轻量小模型。
权限做了明显克制：不能静默读私聊、不能自动发消息、不能一键转账，社交与资金操作一律二次确认；对话记忆用户可查可清。
截至 7 月 2 日，没有看到灰度范围扩大或功能更新的新公告，状态仍是 6 月下旬那一轮灰度的延续。

二、事实层

2.1 灰度时间线

时间	事件	来源口径
2026-06-16	支付宝上线自家 AI 助手（报道名称有「阿波」「阿宝」两种写法，见未能验证）	媒体报道
2026-06-20	首批用户发现微信主界面出现绿色机器人图标；腾讯客服确认正在灰度测试「小微」	新浪财经、IT之家
2026-06-22 前后	Bloomberg、CNBC 等外媒跟进报道，确认小规模测试、多系统覆盖，正式发布日期未定	外媒
2026-06 下旬	界面新闻等媒体拿到资格做实测报道	界面新闻
2026 Q3（计划）	多方报道称目标向更大范围用户开放	媒体转述，官方未给日期

个别报道把灰度起点写作 6 月 21 日或「6 月底」，主流口径是 6 月 20 日。

2.2 产品形态与功能（转述自媒体实测）

入口：主界面左上角「小微」图标，或主界面右滑唤起；对话界面标注「测试版」；支持文字与语音。
微信原生操作：发消息（发送前二次确认）、拨电话、调设置、设提醒、转账（需手动输密码）。
内容处理：不能主动读取私聊和群聊；用户在具体对话里手动触发才能做总结。打通了公众号与视频号的内容分析。界面新闻转述其内容推荐「不基于阅读量、转发量、粉丝数」。
小程序代操作：可调起小程序完成任务——通过美团点奶茶、在京东搜纸巾、线上挂号、打车、订酒店；执行流畅度取决于小程序界面复杂度。
生成小工具：「一句话生成小程序」，实测能做出「夸夸文案生成器」「亲戚关系计算器」这类小工具，但目前生成物接不了小程序体系和微信支付。
记忆与隐私：有对话记忆；「设置-记忆与隐私」里可查看、管理、清除；报道称对话数据不用于跨场景挖掘。

2.3 WeLM 谱系与新一代架构

WeLM 是微信 AI 团队（非混元团队）的自研模型线，官方博客 welm.weixin.qq.com 至今活跃（最近更新 2026-03-02）。

版本	规格	备注
WeLM（2022）	1.3B / 2.7B / 10B dense	论文《WeLM: A Well-Read Pre-trained Language Model for Chinese》；10TB 原始语料清洗后约 262B tokens
WeLM-V3	258B-A22B MoE	官方博客作为后训练参考版本提及
WeLM-V4	80B-A3B 高稀疏 MoE	训练数据不到 14T tokens；另有基于 Qwen3-8B 的 dense 对照
WeLM-130B	V4 的深度扩展（depth scaling）变体	少量追加训练得到

V4 的架构要点（官方博客 + 极客公园转述）：

高稀疏 MoE：80B 总参、约 3B 激活；采用 loss-free balance routing、未归一化的 sigmoid gate、一个共享专家；网络深度上参考 Qwen 系做得更深。
官方博客重点介绍过 Hidden Decoding 方法：不增加 Transformer 主体参数，通过复制多份 Vocab Embedding 把序列长度扩展 n 倍。
有 Hugging Face 开源权重与 SGLang 本地部署支持（开源的是哪个规格，见未能验证）。
界面新闻实测报道称小微支持 128k tokens（约 9–10 万字）上下文。

2.4 小微的模型调度

多家报道口径一致：小微是多模型混合，分工大致是——

层	模型	承担任务
主模型	WeLM 新一代	微信生态知识、长期记忆、上下文管理、任务规划
兜底	DeepSeek	通用问答、复杂推理
轻量层	自研小模型	设提醒、查天气等高频低延迟指令，控制推理成本

三、结构分析

腾讯的三套模型体系并行。 混元做通用大模型和元宝 App，WeLM 做微信场景专用模型，外加第三方采购（DeepSeek）。小微选 WeLM 而非混元做主模型，外部能确认的事实是：WeLM 的技术选择（高稀疏、低激活参数、轻量分流）都指向控制 14 亿月活规模下的推理成本，而非刷通用榜单。

小微改变的是小程序的分发逻辑。 小程序过去靠入口和搜索分发，现在多了一条「被 AI 调用」的路径。对开发者，考核指标可能从停留时长转向调用次数和任务完成率——这一点目前是媒体分析而非微信官方表态。

权限克制是合规约束下的必然设计。 禁止静默读私聊、资金操作二次确认，既是产品选择，也是社交数据合规的硬边界。这条边界同时锁住了「基于聊天记录做深度个性化」的想象空间。

时间点上是超级 App 的贴身竞争。 支付宝的 AI 助手比小微早四天上线，豆包走独立 App 路线。三种获客模式（交易场景嵌入 / 独立 App / 社交原生嵌入）在同一个月内摆开。

四、外部研判

以下是观察，不是事实陈述。

「原生」是这次真正的分水岭。 元宝是把模型装进一个 App，小微是把模型接进微信的操作权限。后者不需要用户改变习惯，这是 14 亿月活的应用才有的选项。一种可能的外部解读是：腾讯此前在 C 端 AI 上的保守，换来的是直接跳过「独立 AI App 抢日活」那一轮消耗战。
WeLM-V4 的 80B-A3B 规格放在 2026 年年中不算激进，但和场景匹配。 3B 激活参数意味着单次推理成本低，配合轻量小模型分流，这是为全量 14 亿用户准备的成本结构，与追求能力上限的旗舰模型是两种目标函数。
「一句话生成小程序」目前更像技术演示。 生成物接不了支付和小程序体系，短期内不构成对开发者的替代；但如果 Q3 全量时打通，会是小程序生态十年来最大的一次门槛变化。
最大不确定性在体验兑现度。 代操作小程序依赖对第三方界面的理解，媒体实测已指出流畅度受界面复杂度影响；灰度到全量之间，这类长尾失败率是主要风险。

判断：跟进。 理由：这是国内第一个拿到国民级 App 操作权限的原生智能体，无论成败都会定义「超级 App + Agent」的参照系；且 WeLM 有开源权重和活跃官方博客，技术上可持续追踪。

下一步：

关注 Q3 是否如期扩大灰度/全量，以及「生成小工具」是否接入小程序体系与支付。
蹲 WeLM 官方博客与 Hugging Face 页面，确认开源规格和许可证，评估是否值得本地跑一版。
若拿到内测资格，重点实测小程序代操作的成功率与失败形态，补一篇一手实测。

五、未能验证

小微是否全量使用 WeLM-V4-80B-A3B：媒体称「新一代 WeLM」，但官方未逐一确认线上服务对应哪个规格（80B-A3B 还是 130B 变体）。
128k 上下文：出自界面新闻实测转述，官方博客未见对应说明。
支付宝助手的名称：不同报道写作「阿波」「阿宝」，未找到支付宝官方公告核对。
Q3 全量计划：均为媒体转述，微信官方未公布时间表。
灰度规模：「小范围」没有任何数量级披露。
WeLM 开源的具体规格与许可证：官方博客提到 Hugging Face 开源与 SGLang 部署，未核对具体模型卡。
腾讯客服 6-20 表态的原文：仅见新浪财经转述。

六、信息来源

官方 / 一手

WeLM 官方博客（微信 AI 团队） — 架构与版本信息正本，最近更新 2026-03-02
WeLM 论文（2022, arXiv）

实测与深度报道

消息面

站内交叉

微信 AI 小程序生态 — 小微出现前的微信 AI 生态基线
中国通用智能体格局
豆包 App 架构推想 — 独立 App 路线的对照组
类 AGI 智能体的用户版图

写在前面：本文按 2026-07-02 之前的公开报道与微信 AI 官方博客整理，我没有拿到内测资格，功能实测部分转述自界面新闻等媒体的灰度体验，属外部观察。

一、先给结论

微信把智能体做成了系统能力而非聊天窗口：小微的价值不在问答，在于它拿到了操作微信本体和小程序生态的权限。

2026-06-20 起小范围灰度，入口是主界面左上角绿色机器人图标，标注「测试版」，需微信 8.0.75+；多方报道称目标 Q3 扩大开放。
能力核心：自然语言（文字/语音）发消息、打电话、改设置、设提醒；调起并代操作小程序（点外卖、挂号、打车、订酒店）；总结群聊/公众号内容；一句话生成小工具。
底层是多模型混合：主模型为微信自研 WeLM 新一代（V4-80B-A3B 高稀疏 MoE），复杂推理由 DeepSeek 兜底，高频低延迟任务（设提醒、查天气）走自研轻量小模型。
权限做了明显克制：不能静默读私聊、不能自动发消息、不能一键转账，社交与资金操作一律二次确认；对话记忆用户可查可清。
截至 7 月 2 日，没有看到灰度范围扩大或功能更新的新公告，状态仍是 6 月下旬那一轮灰度的延续。

二、事实层

2.1 灰度时间线

时间	事件	来源口径
2026-06-16	支付宝上线自家 AI 助手（报道名称有「阿波」「阿宝」两种写法，见未能验证）	媒体报道
2026-06-20	首批用户发现微信主界面出现绿色机器人图标；腾讯客服确认正在灰度测试「小微」	新浪财经、IT之家
2026-06-22 前后	Bloomberg、CNBC 等外媒跟进报道，确认小规模测试、多系统覆盖，正式发布日期未定	外媒
2026-06 下旬	界面新闻等媒体拿到资格做实测报道	界面新闻
2026 Q3（计划）	多方报道称目标向更大范围用户开放	媒体转述，官方未给日期

个别报道把灰度起点写作 6 月 21 日或「6 月底」，主流口径是 6 月 20 日。

2.2 产品形态与功能（转述自媒体实测）

入口：主界面左上角「小微」图标，或主界面右滑唤起；对话界面标注「测试版」；支持文字与语音。
微信原生操作：发消息（发送前二次确认）、拨电话、调设置、设提醒、转账（需手动输密码）。
内容处理：不能主动读取私聊和群聊；用户在具体对话里手动触发才能做总结。打通了公众号与视频号的内容分析。界面新闻转述其内容推荐「不基于阅读量、转发量、粉丝数」。
小程序代操作：可调起小程序完成任务——通过美团点奶茶、在京东搜纸巾、线上挂号、打车、订酒店；执行流畅度取决于小程序界面复杂度。
生成小工具：「一句话生成小程序」，实测能做出「夸夸文案生成器」「亲戚关系计算器」这类小工具，但目前生成物接不了小程序体系和微信支付。
记忆与隐私：有对话记忆；「设置-记忆与隐私」里可查看、管理、清除；报道称对话数据不用于跨场景挖掘。

2.3 WeLM 谱系与新一代架构

WeLM 是微信 AI 团队（非混元团队）的自研模型线，官方博客 welm.weixin.qq.com 至今活跃（最近更新 2026-03-02）。

版本	规格	备注
WeLM（2022）	1.3B / 2.7B / 10B dense	论文《WeLM: A Well-Read Pre-trained Language Model for Chinese》；10TB 原始语料清洗后约 262B tokens
WeLM-V3	258B-A22B MoE	官方博客作为后训练参考版本提及
WeLM-V4	80B-A3B 高稀疏 MoE	训练数据不到 14T tokens；另有基于 Qwen3-8B 的 dense 对照
WeLM-130B	V4 的深度扩展（depth scaling）变体	少量追加训练得到

V4 的架构要点（官方博客 + 极客公园转述）：

高稀疏 MoE：80B 总参、约 3B 激活；采用 loss-free balance routing、未归一化的 sigmoid gate、一个共享专家；网络深度上参考 Qwen 系做得更深。
官方博客重点介绍过 Hidden Decoding 方法：不增加 Transformer 主体参数，通过复制多份 Vocab Embedding 把序列长度扩展 n 倍。
有 Hugging Face 开源权重与 SGLang 本地部署支持（开源的是哪个规格，见未能验证）。
界面新闻实测报道称小微支持 128k tokens（约 9–10 万字）上下文。

2.4 小微的模型调度

多家报道口径一致：小微是多模型混合，分工大致是——

层	模型	承担任务
主模型	WeLM 新一代	微信生态知识、长期记忆、上下文管理、任务规划
兜底	DeepSeek	通用问答、复杂推理
轻量层	自研小模型	设提醒、查天气等高频低延迟指令，控制推理成本

三、结构分析

四、外部研判

以下是观察，不是事实陈述。

「原生」是这次真正的分水岭。 元宝是把模型装进一个 App，小微是把模型接进微信的操作权限。后者不需要用户改变习惯，这是 14 亿月活的应用才有的选项。一种可能的外部解读是：腾讯此前在 C 端 AI 上的保守，换来的是直接跳过「独立 AI App 抢日活」那一轮消耗战。
WeLM-V4 的 80B-A3B 规格放在 2026 年年中不算激进，但和场景匹配。 3B 激活参数意味着单次推理成本低，配合轻量小模型分流，这是为全量 14 亿用户准备的成本结构，与追求能力上限的旗舰模型是两种目标函数。
「一句话生成小程序」目前更像技术演示。 生成物接不了支付和小程序体系，短期内不构成对开发者的替代；但如果 Q3 全量时打通，会是小程序生态十年来最大的一次门槛变化。
最大不确定性在体验兑现度。 代操作小程序依赖对第三方界面的理解，媒体实测已指出流畅度受界面复杂度影响；灰度到全量之间，这类长尾失败率是主要风险。

下一步：

关注 Q3 是否如期扩大灰度/全量，以及「生成小工具」是否接入小程序体系与支付。
蹲 WeLM 官方博客与 Hugging Face 页面，确认开源规格和许可证，评估是否值得本地跑一版。
若拿到内测资格，重点实测小程序代操作的成功率与失败形态，补一篇一手实测。

五、未能验证

小微是否全量使用 WeLM-V4-80B-A3B：媒体称「新一代 WeLM」，但官方未逐一确认线上服务对应哪个规格（80B-A3B 还是 130B 变体）。
128k 上下文：出自界面新闻实测转述，官方博客未见对应说明。
支付宝助手的名称：不同报道写作「阿波」「阿宝」，未找到支付宝官方公告核对。
Q3 全量计划：均为媒体转述，微信官方未公布时间表。
灰度规模：「小范围」没有任何数量级披露。
WeLM 开源的具体规格与许可证：官方博客提到 Hugging Face 开源与 SGLang 部署，未核对具体模型卡。
腾讯客服 6-20 表态的原文：仅见新浪财经转述。

六、信息来源

官方 / 一手

WeLM 官方博客（微信 AI 团队） — 架构与版本信息正本，最近更新 2026-03-02
WeLM 论文（2022, arXiv）

实测与深度报道

消息面

站内交叉

微信 AI 小程序生态 — 小微出现前的微信 AI 生态基线
中国通用智能体格局
豆包 App 架构推想 — 独立 App 路线的对照组
类 AGI 智能体的用户版图

微信原生智能体「小微」调研：灰度进展与 WeLM 技术架构

一、先给结论

二、事实层

2.1 灰度时间线

2.2 产品形态与功能（转述自媒体实测）

2.3 WeLM 谱系与新一代架构

2.4 小微的模型调度

三、结构分析

四、外部研判

五、未能验证

六、信息来源

讨论

微信原生智能体「小微」调研：灰度进展与 WeLM 技术架构

一、先给结论

二、事实层

2.1 灰度时间线

2.2 产品形态与功能（转述自媒体实测）

2.3 WeLM 谱系与新一代架构

2.4 小微的模型调度

三、结构分析

四、外部研判

五、未能验证

六、信息来源

讨论