信息来源说明:本调研基于姚顺雨个人主页(ysymyth.github.io)、姚顺宇个人主页(alfredyao.github.io)、普林斯顿大学博士论文公开摘要、ReAct / Tree of Thoughts 论文、腾讯混元 Hy3 preview 公开报道、智源社区 / 钛媒体 / 张小珺商业访谈录等对姚顺宇转职的公开整理,以及汤道生 × 姚顺雨对谈实录。英文简历中两人常被写作 Shunyu Yao,中文报道偶发混名;本文按可交叉印证的公开材料区分「雨」「宇」二人,不涉及未公开的组织内幕与薪酬传闻。
一、先给结论
2024—2026 年的中文 AI 讨论里,「姚顺宇」三个字出现频率很高,但读者经常不知道在说哪一个人。
更准确地说,硅谷与中文媒体里至少活跃着两位常被写成 Shunyu Yao 的华人研究者:
| 姚顺雨(雨) | 姚顺宇(宇) | |
|---|---|---|
| 学术底色 | 计算机 / NLP / Agent | 理论物理 / 量子混沌 |
| 代表工作 | ReAct、Tree of Thoughts、WebShop、SWE-bench 等 | 非厄米趋肤效应、Scramblon 理论;Claude / Gemini 侧 RL 与 Agentic Coding |
| 公开身份(2026 初) | 腾讯首席 AI 科学家,混元与大模型基础设施负责人 | Google DeepMind 高级研究科学家(前 Anthropic) |
| 核心问题 | 智能体如何定义任务、推理并作用于数字世界? | 大模型如何在规模化 RL 里稳定学会编码与工具使用? |
- 姚顺雨更像在回答「Agent 是什么、怎么测、怎么搭系统」;
- 姚顺宇更像在回答「模型内部如何通过 RL 与数值工程获得 Agent 能力」。
他们不是同一个人的两种报道,而是同名不同轨的两位研究者。混淆本身,也说明 Agent 与大模型 RL 已成为同一张牌桌上的两种语言。
二、名字为什么会缠在一起
2.1 拼音与英文简历
两人英文名都常被写作 Shunyu Yao。在 Google Scholar、X、招聘新闻和中文转译里,「顺宇」「顺雨」极易被统一成「姚顺宇」。
辨别的小技巧:
- 雨:个人站与论文作者页多用 ysymyth.github.io,普林斯顿 CS 背景,论文主题集中在 language agents。
- 宇:个人站为 alfredyao.github.io,斯坦福理论物理博士,博客标题常见 My infant year as an AI researcher,讨论物理转向 AI 的反思。
2.2 中文报道的惯性
2025 年底姚顺雨加盟腾讯时,大量标题使用「OpenAI 科学家姚顺宇加盟腾讯」——把「雨」写成「宇」。与此同时,姚顺宇离开 Anthropic 加入 DeepMind 的新闻也在同周期发酵。读者在信息流里看到两个「姚顺宇」,却对应两家巨头、两条技术线,混乱是结构性的,不是偶然笔误。
三、对照时间线
| 时间 | 姚顺雨(雨) | 姚顺宇(宇) |
|---|---|---|
| 本科 | 清华大学姚班 | 清华大学物理系,本科特等奖学金;IAS 阶段参与非厄米趋肤效应相关研究 |
| 博士 | 普林斯顿大学 CS,导师 Karthik Narasimhan;论文题旨为 language agents 与 digital automation | 斯坦福大学理论物理,导师含 Douglas Stanford;博士论文聚焦量子混沌与量子引力教训 |
| 2022—2023 | ReAct(ICLR 2023 Oral)、Tree of Thoughts(NeurIPS 2023 Oral)等 Agent 方法论集中发表 | 物理学术生涯收尾,短暂 UC Berkeley 博后 |
| 2024 | 博士毕业;8 月加入 OpenAI,参与 Operator、Deep Research 等智能体产品方向 | 10 月加入 Anthropic,参与 Claude 3.7 Agentic coding 与 Claude 4 系列 RL 数值 |
| 2025 | 12 月转任腾讯首席 AI 科学家,兼 AI Infra 与大语言模型部负责人;推动混元架构重组 | 9 月离开 Anthropic;约 10 天后加入 Google DeepMind |
| 2026 初 | 混元 Hy3 preview 发布,被称作「混元重建第一步」;腾讯 AI Lab 并入大模型主线 | 参与 Gemini 3 Deep Think 等新一代 RL 方向(公开报道与其个人站职业轨迹互证) |
四、姚顺雨:把 Agent 从论文做成「可评测的世界」
4.1 学术贡献:不止 ReAct 一个名字
姚顺雨博士论文的标题是 Language Agents: From Next-Token Prediction to Digital Automation。这句话本身就把他的长期问题说透了:语言模型不止该会生成下一句,还要能在数字环境里持续决策。
公开代表作包括:
- ReAct(ICLR 2023 Oral):交错生成推理轨迹与动作,让模型既能「想」也能「查、点、改环境」,缓解纯 CoT 的幻觉与误差传播。
- Tree of Thoughts(NeurIPS 2023 Oral):把推理从单链扩展为可搜索、可回溯的思维树,在需要规划与试探的任务上大幅提升成功率。
- 任务层创新:WebShop、InterCode、SWE-bench 等 benchmark,把「上网购物」「写代码修 bug」变成可量化的 Agent 考场。
他的风格是 先定义世界,再定义智能体:没有评测与交互界面,Agent 很容易停留在 prompt 技巧;有了任务与反馈,才谈得上系统演进。
4.2 OpenAI 阶段:从方法论到产品
2024 年加入 OpenAI 后,姚顺雨的工作更接近「语言智能体产品化」——公开报道将其与 Operator、Deep Research 等方向关联。这与他在博士阶段 Part I「digital automation」的脉络一致:互联网与代码界面上的长程任务,正是今天 Coding Agent 与 Web Agent 的产品前沿。
4.3 腾讯阶段:研究—工程一体化的压力测试
2025 年 12 月腾讯任命姚顺雨为 CEO/总裁办公室首席 AI 科学家,并让其负责 AI Infra 部 与 大语言模型部。这在组织语义上很重要:
- 过去大厂常见的「基建归基建、算法归算法」被刻意打通;
- 目标是效仿 OpenAI 式 研究—工程一体化,让混元不止「能发布」,还要能承接微信生态里的 Agent 入口与开发者预期。
2026 年 4 月 混元 Hy3 preview 开源,被团队表述为「从读万卷书到行万里路的开端」「混元重建第一步」。同期报道还提到:成立十年的 腾讯 AI Lab 撤销,核心人力并入大模型部——说明这场调整不是人事噱头,而是研发主线的重排。
姚顺雨在公开对谈里强调 Coding Agent 的图灵完备性:当模型能操作文件系统与容器,Agent 就不只是聊天外壳,而是可闭环的执行系统。他也坦言腾讯会走 体系全面化 路线——数据、训练、Agent 形态与产品 Co-design 同步迭代,而不是单点模型秀肌肉。
人物关键词:任务定义、Agent 范式、数字自动化、研究工程一体、混元重建。
五、姚顺宇:从物理系统到大模型 RL 的「数值直觉」
5.1 物理学术遗产
在转向 AI 之前,姚顺宇已是理论物理圈的高辨识度年轻学者:
- 本科在清华物理系,曾获 本科生特等奖学金;
- 2018 年在 Physical Review Letters 发表非厄米系统拓扑能带相关工作;
- 斯坦福博士阶段研究量子黑洞、全息与 Scramblon 等量子混沌议题。
物理训练留给他的,不是某个 AI 技巧,而是两套习惯:
- 复杂系统直觉——信息如何在多体系统里扩散、失稳、饱和;
- 对数值与尺度的敏感——大系统里,参数边界往往决定「能不能训下去」。
5.2 Anthropic:Agentic Coding 与 RL 数值
2024 年加入 Anthropic 后,姚顺宇的工作重心转向 「学习的科学」:如何让 Claude 在规模化强化学习中稳定获得 Agentic coding 与工具使用能力。公开材料将其与 Claude 3.7 的 agentic coding 能力、Claude 4 家族 的 RL numerics 相关联。
他在离职博文里谈到几件事(均为其本人公开表述的归纳):
- 希望经验不要锁死在单一公司范式;
- Anthropic 核心研究员不再以发论文为主要产出形式,这与他的学术习惯存在张力;
- 组织文化、决策机制与个人长期成长路径的匹配,会影响顶尖研究者去留——这在 2025 年多家 lab 的人才流动中是共性,而非孤例。
5.3 Google DeepMind:进入 Gemini 的集体主义工程
离开 Anthropic 约 10 天后,姚顺宇加入 Google DeepMind 任高级研究科学家。后续公开节点包括 Gemini 3 Deep Think 等重大升级的时间邻接性——外界无法逐行对应其个人 commit,但可以确定:他把 跨 lab 的 RL 工程经验 带入了 Google 更偏 bottom-up 大项目协同 的文化。
张小珺 2025 年末 4 小时访谈 中,姚顺宇几个观点值得单独记录(访谈对象为 宇,非雨):
- 英雄主义时代过去:Transformer 与 Scaling Law 被证明之后,竞争更像集体主义系统工程,胜负取决于团队能否长期投入高质量迭代,而非某一个「天才瞬间」。
- 「靠谱」比「聪明」更稀缺:细致、对系统负责、能把数值与流程跑稳,在超大规模训练里比口头创新更重要。
- 从物理转 AI 的动机:高能理论一度让他厌倦「缺少客观评价标准」的环境;AI 仍有清晰 benchmark 与产品反馈,这是他愿意承受「人生最大跨步」的原因之一。
人物关键词:RL 数值、Agentic coding、复杂系统、集体主义工程、跨学科迁移。
六、并置阅读:两条路线如何拼接成今天的 Agent 竞争
如果把 2026 年的 Agent 竞赛拆成两层,两人恰好站在不同层:
┌─────────────────────────────────────────────────────────┐
│ 产品 / 生态层:入口、任务、用户留存(微信、Gemini App) │
├─────────────────────────────────────────────────────────┤
│ 模型能力层:Coding / Tool Use / RL 后训练(Claude/Gemini)│ ← 姚顺宇(宇)
├─────────────────────────────────────────────────────────┤
│ 范式与评测层:ReAct、ToT、SWE-bench、Web Agent 任务定义 │ ← 姚顺雨(雨)
└─────────────────────────────────────────────────────────┘
- 没有雨的范式与 benchmark,模型很强也不知道「强在哪道题」;
- 没有宇的 RL 与数值工程,范式很难沉淀进权重,而不是停留在 demo;
- 没有腾讯 / Google 的组织容器,个人方法论也无法变成持续交付的基础设施。
这也是为什么「两个 Shunyu Yao」会同时出现在 2025—2026 的新闻峰值:他们分别代表了 Agent 研究的上游定义 与 大模型能力的下游锻造,而两人都被推到了各自公司的关键岗位。
七、对读者与从业者的三条启示
- 先分清名字,再谈立场。引用英文材料时,核对作者单位与主页域名,避免把 ReAct 作者与 Gemini RL 研究者混为一谈。
- Agent 竞争已是「双轮驱动」。只做产品入口没有模型深度会空心化;只做模型没有任务与生态则难以留存。腾讯与 Google 的用人布局,都是这一判断的组织化表达。
- 跨学科迁移的两种模板。姚顺雨是 计算机内部纵深(从 NLP 到 Agent 到 infra);姚顺宇是 物理 → AI 的硬切换。前者依赖连续积累,后者依赖对复杂系统与评价标准的重新选择。两条路都走得通,但代价结构不同。
八、延伸阅读与核对清单
| 资源 | 说明 |
|---|---|
| 姚顺雨个人主页 | ReAct、ToT 论文与项目索引 |
| 姚顺宇个人主页 | 物理与 AI 职业轨迹、博客 |
| ReAct 论文 | ICLR 2023,推理与行动交错 |
| Tree of Thoughts | NeurIPS 2023 Oral |
| 汤道生 × 姚顺雨对谈 | 腾讯 AI 下半场、Coding Agent 与混元 |
| 张小珺 × 姚顺宇访谈(2025) | 英雄主义、组织文化、RL 工程化(注意访谈对象为 宇) |
快速核对表
- 提到 ReAct / WebShop / 腾讯混元 Hy3 → 通常是 姚顺雨(雨)
- 提到 非厄米趋肤效应 / Claude RL numerics / Gemini Deep Think → 通常是 姚顺宇(宇)
- 英文 Shunyu Yao → 必查机构与主页,不要默认同一人
本文由 TUARAN 整理撰写;协助工具:Codex。若你发现媒体将二人混名的新案例,欢迎反馈以便补充「名字迷宫」一节。
Discussion
讨论
还没有讨论