写在前面:本文按 2026-07-02 之前的公开报道与微信 AI 官方博客整理,我没有拿到内测资格,功能实测部分转述自界面新闻等媒体的灰度体验,属外部观察。
一、先给结论
微信把智能体做成了系统能力而非聊天窗口:小微的价值不在问答,在于它拿到了操作微信本体和小程序生态的权限。
- 2026-06-20 起小范围灰度,入口是主界面左上角绿色机器人图标,标注「测试版」,需微信 8.0.75+;多方报道称目标 Q3 扩大开放。
- 能力核心:自然语言(文字/语音)发消息、打电话、改设置、设提醒;调起并代操作小程序(点外卖、挂号、打车、订酒店);总结群聊/公众号内容;一句话生成小工具。
- 底层是多模型混合:主模型为微信自研 WeLM 新一代(V4-80B-A3B 高稀疏 MoE),复杂推理由 DeepSeek 兜底,高频低延迟任务(设提醒、查天气)走自研轻量小模型。
- 权限做了明显克制:不能静默读私聊、不能自动发消息、不能一键转账,社交与资金操作一律二次确认;对话记忆用户可查可清。
- 截至 7 月 2 日,没有看到灰度范围扩大或功能更新的新公告,状态仍是 6 月下旬那一轮灰度的延续。
二、事实层
2.1 灰度时间线
| 时间 | 事件 | 来源口径 |
|---|---|---|
| 2026-06-16 | 支付宝上线自家 AI 助手(报道名称有「阿波」「阿宝」两种写法,见未能验证) | 媒体报道 |
| 2026-06-20 | 首批用户发现微信主界面出现绿色机器人图标;腾讯客服确认正在灰度测试「小微」 | 新浪财经、IT之家 |
| 2026-06-22 前后 | Bloomberg、CNBC 等外媒跟进报道,确认小规模测试、多系统覆盖,正式发布日期未定 | 外媒 |
| 2026-06 下旬 | 界面新闻等媒体拿到资格做实测报道 | 界面新闻 |
| 2026 Q3(计划) | 多方报道称目标向更大范围用户开放 | 媒体转述,官方未给日期 |
个别报道把灰度起点写作 6 月 21 日或「6 月底」,主流口径是 6 月 20 日。
2.2 产品形态与功能(转述自媒体实测)
- 入口:主界面左上角「小微」图标,或主界面右滑唤起;对话界面标注「测试版」;支持文字与语音。
- 微信原生操作:发消息(发送前二次确认)、拨电话、调设置、设提醒、转账(需手动输密码)。
- 内容处理:不能主动读取私聊和群聊;用户在具体对话里手动触发才能做总结。打通了公众号与视频号的内容分析。界面新闻转述其内容推荐「不基于阅读量、转发量、粉丝数」。
- 小程序代操作:可调起小程序完成任务——通过美团点奶茶、在京东搜纸巾、线上挂号、打车、订酒店;执行流畅度取决于小程序界面复杂度。
- 生成小工具:「一句话生成小程序」,实测能做出「夸夸文案生成器」「亲戚关系计算器」这类小工具,但目前生成物接不了小程序体系和微信支付。
- 记忆与隐私:有对话记忆;「设置-记忆与隐私」里可查看、管理、清除;报道称对话数据不用于跨场景挖掘。
2.3 WeLM 谱系与新一代架构
WeLM 是微信 AI 团队(非混元团队)的自研模型线,官方博客 welm.weixin.qq.com 至今活跃(最近更新 2026-03-02)。
| 版本 | 规格 | 备注 |
|---|---|---|
| WeLM(2022) | 1.3B / 2.7B / 10B dense | 论文《WeLM: A Well-Read Pre-trained Language Model for Chinese》;10TB 原始语料清洗后约 262B tokens |
| WeLM-V3 | 258B-A22B MoE | 官方博客作为后训练参考版本提及 |
| WeLM-V4 | 80B-A3B 高稀疏 MoE | 训练数据不到 14T tokens;另有基于 Qwen3-8B 的 dense 对照 |
| WeLM-130B | V4 的深度扩展(depth scaling)变体 | 少量追加训练得到 |
V4 的架构要点(官方博客 + 极客公园转述):
- 高稀疏 MoE:80B 总参、约 3B 激活;采用 loss-free balance routing、未归一化的 sigmoid gate、一个共享专家;网络深度上参考 Qwen 系做得更深。
- 官方博客重点介绍过 Hidden Decoding 方法:不增加 Transformer 主体参数,通过复制多份 Vocab Embedding 把序列长度扩展 n 倍。
- 有 Hugging Face 开源权重与 SGLang 本地部署支持(开源的是哪个规格,见未能验证)。
- 界面新闻实测报道称小微支持 128k tokens(约 9–10 万字)上下文。
2.4 小微的模型调度
多家报道口径一致:小微是多模型混合,分工大致是——
| 层 | 模型 | 承担任务 |
|---|---|---|
| 主模型 | WeLM 新一代 | 微信生态知识、长期记忆、上下文管理、任务规划 |
| 兜底 | DeepSeek | 通用问答、复杂推理 |
| 轻量层 | 自研小模型 | 设提醒、查天气等高频低延迟指令,控制推理成本 |
三、结构分析
腾讯的三套模型体系并行。 混元做通用大模型和元宝 App,WeLM 做微信场景专用模型,外加第三方采购(DeepSeek)。小微选 WeLM 而非混元做主模型,外部能确认的事实是:WeLM 的技术选择(高稀疏、低激活参数、轻量分流)都指向控制 14 亿月活规模下的推理成本,而非刷通用榜单。
小微改变的是小程序的分发逻辑。 小程序过去靠入口和搜索分发,现在多了一条「被 AI 调用」的路径。对开发者,考核指标可能从停留时长转向调用次数和任务完成率——这一点目前是媒体分析而非微信官方表态。
权限克制是合规约束下的必然设计。 禁止静默读私聊、资金操作二次确认,既是产品选择,也是社交数据合规的硬边界。这条边界同时锁住了「基于聊天记录做深度个性化」的想象空间。
时间点上是超级 App 的贴身竞争。 支付宝的 AI 助手比小微早四天上线,豆包走独立 App 路线。三种获客模式(交易场景嵌入 / 独立 App / 社交原生嵌入)在同一个月内摆开。
四、外部研判
以下是观察,不是事实陈述。
- 「原生」是这次真正的分水岭。 元宝是把模型装进一个 App,小微是把模型接进微信的操作权限。后者不需要用户改变习惯,这是 14 亿月活的应用才有的选项。一种可能的外部解读是:腾讯此前在 C 端 AI 上的保守,换来的是直接跳过「独立 AI App 抢日活」那一轮消耗战。
- WeLM-V4 的 80B-A3B 规格放在 2026 年年中不算激进,但和场景匹配。 3B 激活参数意味着单次推理成本低,配合轻量小模型分流,这是为全量 14 亿用户准备的成本结构,与追求能力上限的旗舰模型是两种目标函数。
- 「一句话生成小程序」目前更像技术演示。 生成物接不了支付和小程序体系,短期内不构成对开发者的替代;但如果 Q3 全量时打通,会是小程序生态十年来最大的一次门槛变化。
- 最大不确定性在体验兑现度。 代操作小程序依赖对第三方界面的理解,媒体实测已指出流畅度受界面复杂度影响;灰度到全量之间,这类长尾失败率是主要风险。
判断:跟进。 理由:这是国内第一个拿到国民级 App 操作权限的原生智能体,无论成败都会定义「超级 App + Agent」的参照系;且 WeLM 有开源权重和活跃官方博客,技术上可持续追踪。
下一步:
- 关注 Q3 是否如期扩大灰度/全量,以及「生成小工具」是否接入小程序体系与支付。
- 蹲 WeLM 官方博客与 Hugging Face 页面,确认开源规格和许可证,评估是否值得本地跑一版。
- 若拿到内测资格,重点实测小程序代操作的成功率与失败形态,补一篇一手实测。
五、未能验证
- 小微是否全量使用 WeLM-V4-80B-A3B:媒体称「新一代 WeLM」,但官方未逐一确认线上服务对应哪个规格(80B-A3B 还是 130B 变体)。
- 128k 上下文:出自界面新闻实测转述,官方博客未见对应说明。
- 支付宝助手的名称:不同报道写作「阿波」「阿宝」,未找到支付宝官方公告核对。
- Q3 全量计划:均为媒体转述,微信官方未公布时间表。
- 灰度规模:「小范围」没有任何数量级披露。
- WeLM 开源的具体规格与许可证:官方博客提到 Hugging Face 开源与 SGLang 部署,未核对具体模型卡。
- 腾讯客服 6-20 表态的原文:仅见新浪财经转述。
六、信息来源
官方 / 一手
- WeLM 官方博客(微信 AI 团队) — 架构与版本信息正本,最近更新 2026-03-02
- WeLM 论文(2022, arXiv)
实测与深度报道
消息面
- 微信 AI 助手「小微」灰度上线 · IT之家
- 腾讯客服:微信正在灰度测试 AI 助手「小微」 · 新浪财经
- Tencent Tests AI Assistant for Its Super App WeChat · Bloomberg
- WeChat begins testing Xiaowei as Tencent eyes a Q3 AI rollout · TNW
站内交叉
- 微信 AI 小程序生态 — 小微出现前的微信 AI 生态基线
- 中国通用智能体格局
- 豆包 App 架构推想 — 独立 App 路线的对照组
- 类 AGI 智能体的用户版图
Discussion
讨论
还没有讨论