T
TUARAN涂阿燃 · 网络日志

Menu

...

检查登录状态…

© 2025—2026 网络日志·关于本站·关于站长·聊合作·留言板·RSS·支持本站·流量统计·提建议·CI Status

知识库·事项调研·产品·2026-07-02 14:50·12 min read·阅读量 -·协助:claude-fable-5
RSS

微信原生智能体「小微」调研:灰度进展与 WeLM 技术架构

涂阿燃 · tuaran前端 / AI Agent / 政企方案

在 2aran.com 写技术调研、AI 工程实践与独立开发笔记。 关于站长 →

TL;DR小微是微信第一个原生智能体入口,能发消息、打电话、点外卖、代操作小程序,直接拿到了微信本体的操作权限。主模型 WeLM-V4 是 80B-A3B 的高稀疏 MoE(loss-free balance routing + sigmoid gate + 共享专家),配 DeepSeek 兜底与轻量小模型分流。截至 7 月 2 日仍在灰度,未全量。
#微信#小微#WeLM#智能体#Agent#腾讯#MoE#DeepSeek#小程序
文章目录
  • 一、先给结论
  • 二、事实层
  • 三、结构分析
  • 四、外部研判
  • 五、未能验证
  • 六、信息来源

写在前面:本文按 2026-07-02 之前的公开报道与微信 AI 官方博客整理,我没有拿到内测资格,功能实测部分转述自界面新闻等媒体的灰度体验,属外部观察。

一、先给结论

微信把智能体做成了系统能力而非聊天窗口:小微的价值不在问答,在于它拿到了操作微信本体和小程序生态的权限。

  • 2026-06-20 起小范围灰度,入口是主界面左上角绿色机器人图标,标注「测试版」,需微信 8.0.75+;多方报道称目标 Q3 扩大开放。
  • 能力核心:自然语言(文字/语音)发消息、打电话、改设置、设提醒;调起并代操作小程序(点外卖、挂号、打车、订酒店);总结群聊/公众号内容;一句话生成小工具。
  • 底层是多模型混合:主模型为微信自研 WeLM 新一代(V4-80B-A3B 高稀疏 MoE),复杂推理由 DeepSeek 兜底,高频低延迟任务(设提醒、查天气)走自研轻量小模型。
  • 权限做了明显克制:不能静默读私聊、不能自动发消息、不能一键转账,社交与资金操作一律二次确认;对话记忆用户可查可清。
  • 截至 7 月 2 日,没有看到灰度范围扩大或功能更新的新公告,状态仍是 6 月下旬那一轮灰度的延续。

二、事实层

2.1 灰度时间线

时间 事件 来源口径
2026-06-16 支付宝上线自家 AI 助手(报道名称有「阿波」「阿宝」两种写法,见未能验证) 媒体报道
2026-06-20 首批用户发现微信主界面出现绿色机器人图标;腾讯客服确认正在灰度测试「小微」 新浪财经、IT之家
2026-06-22 前后 Bloomberg、CNBC 等外媒跟进报道,确认小规模测试、多系统覆盖,正式发布日期未定 外媒
2026-06 下旬 界面新闻等媒体拿到资格做实测报道 界面新闻
2026 Q3(计划) 多方报道称目标向更大范围用户开放 媒体转述,官方未给日期

个别报道把灰度起点写作 6 月 21 日或「6 月底」,主流口径是 6 月 20 日。

2.2 产品形态与功能(转述自媒体实测)

  • 入口:主界面左上角「小微」图标,或主界面右滑唤起;对话界面标注「测试版」;支持文字与语音。
  • 微信原生操作:发消息(发送前二次确认)、拨电话、调设置、设提醒、转账(需手动输密码)。
  • 内容处理:不能主动读取私聊和群聊;用户在具体对话里手动触发才能做总结。打通了公众号与视频号的内容分析。界面新闻转述其内容推荐「不基于阅读量、转发量、粉丝数」。
  • 小程序代操作:可调起小程序完成任务——通过美团点奶茶、在京东搜纸巾、线上挂号、打车、订酒店;执行流畅度取决于小程序界面复杂度。
  • 生成小工具:「一句话生成小程序」,实测能做出「夸夸文案生成器」「亲戚关系计算器」这类小工具,但目前生成物接不了小程序体系和微信支付。
  • 记忆与隐私:有对话记忆;「设置-记忆与隐私」里可查看、管理、清除;报道称对话数据不用于跨场景挖掘。

2.3 WeLM 谱系与新一代架构

WeLM 是微信 AI 团队(非混元团队)的自研模型线,官方博客 welm.weixin.qq.com 至今活跃(最近更新 2026-03-02)。

版本 规格 备注
WeLM(2022) 1.3B / 2.7B / 10B dense 论文《WeLM: A Well-Read Pre-trained Language Model for Chinese》;10TB 原始语料清洗后约 262B tokens
WeLM-V3 258B-A22B MoE 官方博客作为后训练参考版本提及
WeLM-V4 80B-A3B 高稀疏 MoE 训练数据不到 14T tokens;另有基于 Qwen3-8B 的 dense 对照
WeLM-130B V4 的深度扩展(depth scaling)变体 少量追加训练得到

V4 的架构要点(官方博客 + 极客公园转述):

  • 高稀疏 MoE:80B 总参、约 3B 激活;采用 loss-free balance routing、未归一化的 sigmoid gate、一个共享专家;网络深度上参考 Qwen 系做得更深。
  • 官方博客重点介绍过 Hidden Decoding 方法:不增加 Transformer 主体参数,通过复制多份 Vocab Embedding 把序列长度扩展 n 倍。
  • 有 Hugging Face 开源权重与 SGLang 本地部署支持(开源的是哪个规格,见未能验证)。
  • 界面新闻实测报道称小微支持 128k tokens(约 9–10 万字)上下文。

2.4 小微的模型调度

多家报道口径一致:小微是多模型混合,分工大致是——

层 模型 承担任务
主模型 WeLM 新一代 微信生态知识、长期记忆、上下文管理、任务规划
兜底 DeepSeek 通用问答、复杂推理
轻量层 自研小模型 设提醒、查天气等高频低延迟指令,控制推理成本

三、结构分析

腾讯的三套模型体系并行。 混元做通用大模型和元宝 App,WeLM 做微信场景专用模型,外加第三方采购(DeepSeek)。小微选 WeLM 而非混元做主模型,外部能确认的事实是:WeLM 的技术选择(高稀疏、低激活参数、轻量分流)都指向控制 14 亿月活规模下的推理成本,而非刷通用榜单。

小微改变的是小程序的分发逻辑。 小程序过去靠入口和搜索分发,现在多了一条「被 AI 调用」的路径。对开发者,考核指标可能从停留时长转向调用次数和任务完成率——这一点目前是媒体分析而非微信官方表态。

设计与草图工作台

权限克制是合规约束下的必然设计。 禁止静默读私聊、资金操作二次确认,既是产品选择,也是社交数据合规的硬边界。这条边界同时锁住了「基于聊天记录做深度个性化」的想象空间。

时间点上是超级 App 的贴身竞争。 支付宝的 AI 助手比小微早四天上线,豆包走独立 App 路线。三种获客模式(交易场景嵌入 / 独立 App / 社交原生嵌入)在同一个月内摆开。

四、外部研判

以下是观察,不是事实陈述。

  • 「原生」是这次真正的分水岭。 元宝是把模型装进一个 App,小微是把模型接进微信的操作权限。后者不需要用户改变习惯,这是 14 亿月活的应用才有的选项。一种可能的外部解读是:腾讯此前在 C 端 AI 上的保守,换来的是直接跳过「独立 AI App 抢日活」那一轮消耗战。
  • WeLM-V4 的 80B-A3B 规格放在 2026 年年中不算激进,但和场景匹配。 3B 激活参数意味着单次推理成本低,配合轻量小模型分流,这是为全量 14 亿用户准备的成本结构,与追求能力上限的旗舰模型是两种目标函数。
  • 「一句话生成小程序」目前更像技术演示。 生成物接不了支付和小程序体系,短期内不构成对开发者的替代;但如果 Q3 全量时打通,会是小程序生态十年来最大的一次门槛变化。
  • 最大不确定性在体验兑现度。 代操作小程序依赖对第三方界面的理解,媒体实测已指出流畅度受界面复杂度影响;灰度到全量之间,这类长尾失败率是主要风险。

笔记本与工作台俯拍

判断:跟进。 理由:这是国内第一个拿到国民级 App 操作权限的原生智能体,无论成败都会定义「超级 App + Agent」的参照系;且 WeLM 有开源权重和活跃官方博客,技术上可持续追踪。

下一步:

  1. 关注 Q3 是否如期扩大灰度/全量,以及「生成小工具」是否接入小程序体系与支付。
  2. 蹲 WeLM 官方博客与 Hugging Face 页面,确认开源规格和许可证,评估是否值得本地跑一版。
  3. 若拿到内测资格,重点实测小程序代操作的成功率与失败形态,补一篇一手实测。

五、未能验证

  • 小微是否全量使用 WeLM-V4-80B-A3B:媒体称「新一代 WeLM」,但官方未逐一确认线上服务对应哪个规格(80B-A3B 还是 130B 变体)。
  • 128k 上下文:出自界面新闻实测转述,官方博客未见对应说明。
  • 支付宝助手的名称:不同报道写作「阿波」「阿宝」,未找到支付宝官方公告核对。
  • Q3 全量计划:均为媒体转述,微信官方未公布时间表。
  • 灰度规模:「小范围」没有任何数量级披露。
  • WeLM 开源的具体规格与许可证:官方博客提到 Hugging Face 开源与 SGLang 部署,未核对具体模型卡。
  • 腾讯客服 6-20 表态的原文:仅见新浪财经转述。

深色背景的代码流

六、信息来源

官方 / 一手

  • WeLM 官方博客(微信 AI 团队) — 架构与版本信息正本,最近更新 2026-03-02
  • WeLM 论文(2022, arXiv)

实测与深度报道

  • 实测微信AI助手,微信迎来史上最大更新 · 界面新闻
  • 微信推了 AI 助手「小微」,它会成为 AI 大模型的战场吗? · 极客公园
  • 微信助手「小微」,能否缓解腾讯的AI焦虑? · 36氪

消息面

  • 微信 AI 助手「小微」灰度上线 · IT之家
  • 腾讯客服:微信正在灰度测试 AI 助手「小微」 · 新浪财经
  • Tencent Tests AI Assistant for Its Super App WeChat · Bloomberg
  • WeChat begins testing Xiaowei as Tencent eyes a Q3 AI rollout · TNW

站内交叉

  • 微信 AI 小程序生态 — 小微出现前的微信 AI 生态基线
  • 中国通用智能体格局
  • 豆包 App 架构推想 — 独立 App 路线的对照组
  • 类 AGI 智能体的用户版图

Support

支持这篇调研

一下点赞、一句评论,都是对继续写下去的支持。

评论

Related

同类调研

  • 2026-07-02 09:27策展人平台调研:从收藏夹到可商业化的内容入口
  • 2026-07-02Cloudflare 免费与付费服务边界深度调研
  • 2026-07-01 18:206 月,我把个人站从作品集改造成了运营台

Discussion

讨论

还没有讨论

以游客身份发表 —— 登录后历史评论会自动绑定到你的账号
1000 字
来留下第一条讨论。

Stay in touch

写完一篇 · 走到下一段

Newsletter

每周收一封,少刷一点信息流

我会把新文章、调研、资源更新和工具发布整理成一封邮件。频率克制,不做日更轰炸。

先用本站 D1 记录订阅;配置 Buttondown token 后会同步到 Buttondown。

📡
RSS 订阅 →

2aran.com/rss.xml · 用你的阅读器订阅,不错过任何一篇

💬
加入社群 →

微信小红书读者群,不焦虑,慢节奏

📚
知识库 →

精选文章 + 公司调研 + 事项调研 + 人物调研

👋
关于站长 →

前端 · AI Agent · 政企方案

合作 / 咨询 / 调研定制见 合作说明 · 微信 atar24