姚顺雨与姚顺宇人物调研：两个 Shunyu Yao，两条 AI 路线

信息来源说明：本调研基于姚顺雨个人主页（ysymyth.github.io）、姚顺宇个人主页（alfredyao.github.io）、普林斯顿大学博士论文公开摘要、ReAct / Tree of Thoughts 论文、腾讯混元 Hy3 preview 公开报道、智源社区 / 钛媒体 / 张小珺商业访谈录等对姚顺宇转职的公开整理，以及汤道生 × 姚顺雨对谈实录。英文简历中两人常被写作 Shunyu Yao，中文报道偶发混名；本文按可交叉印证的公开材料区分「雨」「宇」二人，不涉及未公开的组织内幕与薪酬传闻。

一、先给结论

2024—2026 年的中文 AI 讨论里，「姚顺宇」三个字出现频率很高，但读者经常不知道在说哪一个人。

更准确地说，硅谷与中文媒体里至少活跃着两位常被写成 Shunyu Yao 的华人研究者：

	姚顺雨（雨）	姚顺宇（宇）
学术底色	计算机 / NLP / Agent	理论物理 / 量子混沌
代表工作	ReAct、Tree of Thoughts、WebShop、SWE-bench 等	非厄米趋肤效应、Scramblon 理论；Claude / Gemini 侧 RL 与 Agentic Coding
公开身份（2026 初）	腾讯首席 AI 科学家，混元与大模型基础设施负责人	Google DeepMind 高级研究科学家（前 Anthropic）
核心问题	智能体如何定义任务、推理并作用于数字世界？	大模型如何在规模化 RL 里稳定学会编码与工具使用？

姚顺雨更像在回答「Agent 是什么、怎么测、怎么搭系统」；
姚顺宇更像在回答「模型内部如何通过 RL 与数值工程获得 Agent 能力」。

他们不是同一个人的两种报道，而是同名不同轨的两位研究者。混淆本身，也说明 Agent 与大模型 RL 已成为同一张牌桌上的两种语言。

二、名字为什么会缠在一起

2.1 拼音与英文简历

两人英文名都常被写作 Shunyu Yao。在 Google Scholar、X、招聘新闻和中文转译里，「顺宇」「顺雨」极易被统一成「姚顺宇」。

辨别的小技巧：

雨：个人站与论文作者页多用 ysymyth.github.io，普林斯顿 CS 背景，论文主题集中在 language agents。
宇：个人站为 alfredyao.github.io，斯坦福理论物理博士，博客标题常见 My infant year as an AI researcher，讨论物理转向 AI 的反思。

2.2 中文报道的惯性

2025 年底姚顺雨加盟腾讯时，大量标题使用「OpenAI 科学家姚顺宇加盟腾讯」——把「雨」写成「宇」。与此同时，姚顺宇离开 Anthropic 加入 DeepMind 的新闻也在同周期发酵。读者在信息流里看到两个「姚顺宇」，却对应两家巨头、两条技术线，混乱是结构性的，不是偶然笔误。

三、对照时间线

时间	姚顺雨（雨）	姚顺宇（宇）
本科	清华大学姚班	清华大学物理系，本科特等奖学金；IAS 阶段参与非厄米趋肤效应相关研究
博士	普林斯顿大学 CS，导师 Karthik Narasimhan；论文题旨为 language agents 与 digital automation	斯坦福大学理论物理，导师含 Douglas Stanford；博士论文聚焦量子混沌与量子引力教训
2022—2023	ReAct（ICLR 2023 Oral）、Tree of Thoughts（NeurIPS 2023 Oral）等 Agent 方法论集中发表	物理学术生涯收尾，短暂 UC Berkeley 博后
2024	博士毕业；8 月加入 OpenAI，参与 Operator、Deep Research 等智能体产品方向	10 月加入 Anthropic，参与 Claude 3.7 Agentic coding 与 Claude 4 系列 RL 数值
2025	12 月转任腾讯首席 AI 科学家，兼 AI Infra 与大语言模型部负责人；推动混元架构重组	9 月离开 Anthropic；约 10 天后加入 Google DeepMind
2026 初	混元 Hy3 preview 发布，被称作「混元重建第一步」；腾讯 AI Lab 并入大模型主线	参与 Gemini 3 Deep Think 等新一代 RL 方向（公开报道与其个人站职业轨迹互证）

四、姚顺雨：把 Agent 从论文做成「可评测的世界」

4.1 学术贡献：不止 ReAct 一个名字

姚顺雨博士论文的标题是 Language Agents: From Next-Token Prediction to Digital Automation。这句话本身就把他的长期问题说透了：语言模型不止该会生成下一句，还要能在数字环境里持续决策。

公开代表作包括：

ReAct（ICLR 2023 Oral）：交错生成推理轨迹与动作，让模型既能「想」也能「查、点、改环境」，缓解纯 CoT 的幻觉与误差传播。
Tree of Thoughts（NeurIPS 2023 Oral）：把推理从单链扩展为可搜索、可回溯的思维树，在需要规划与试探的任务上大幅提升成功率。
任务层创新：WebShop、InterCode、SWE-bench 等 benchmark，把「上网购物」「写代码修 bug」变成可量化的 Agent 考场。

他的风格是 先定义世界，再定义智能体：没有评测与交互界面，Agent 很容易停留在 prompt 技巧；有了任务与反馈，才谈得上系统演进。

4.2 OpenAI 阶段：从方法论到产品

2024 年加入 OpenAI 后，姚顺雨的工作更接近「语言智能体产品化」——公开报道将其与 Operator、Deep Research 等方向关联。这与他在博士阶段 Part I「digital automation」的脉络一致：互联网与代码界面上的长程任务，正是今天 Coding Agent 与 Web Agent 的产品前沿。

4.3 腾讯阶段：研究—工程一体化的压力测试

2025 年 12 月腾讯任命姚顺雨为 CEO/总裁办公室首席 AI 科学家，并让其负责 AI Infra 部 与 大语言模型部。这在组织语义上很重要：

过去大厂常见的「基建归基建、算法归算法」被刻意打通；
目标是效仿 OpenAI 式 研究—工程一体化，让混元不止「能发布」，还要能承接微信生态里的 Agent 入口与开发者预期。

2026 年 4 月 混元 Hy3 preview 开源，被团队表述为「从读万卷书到行万里路的开端」「混元重建第一步」。同期报道还提到：成立十年的 腾讯 AI Lab 撤销，核心人力并入大模型部——说明这场调整不是人事噱头，而是研发主线的重排。

姚顺雨在公开对谈里强调 Coding Agent 的图灵完备性：当模型能操作文件系统与容器，Agent 就不只是聊天外壳，而是可闭环的执行系统。他也坦言腾讯会走 体系全面化 路线——数据、训练、Agent 形态与产品 Co-design 同步迭代，而不是单点模型秀肌肉。

人物关键词：任务定义、Agent 范式、数字自动化、研究工程一体、混元重建。

五、姚顺宇：从物理系统到大模型 RL 的「数值直觉」

5.1 物理学术遗产

在转向 AI 之前，姚顺宇已是理论物理圈的高辨识度年轻学者：

本科在清华物理系，曾获 本科生特等奖学金；
2018 年在 Physical Review Letters 发表非厄米系统拓扑能带相关工作；
斯坦福博士阶段研究量子黑洞、全息与 Scramblon 等量子混沌议题。

物理训练留给他的，不是某个 AI 技巧，而是两套习惯：

复杂系统直觉——信息如何在多体系统里扩散、失稳、饱和；
对数值与尺度的敏感——大系统里，参数边界往往决定「能不能训下去」。

5.2 Anthropic：Agentic Coding 与 RL 数值

2024 年加入 Anthropic 后，姚顺宇的工作重心转向 「学习的科学」：如何让 Claude 在规模化强化学习中稳定获得 Agentic coding 与工具使用能力。公开材料将其与 Claude 3.7 的 agentic coding 能力、Claude 4 家族 的 RL numerics 相关联。

他在离职博文里谈到几件事（均为其本人公开表述的归纳）：

希望经验不要锁死在单一公司范式；
Anthropic 核心研究员不再以发论文为主要产出形式，这与他的学术习惯存在张力；
组织文化、决策机制与个人长期成长路径的匹配，会影响顶尖研究者去留——这在 2025 年多家 lab 的人才流动中是共性，而非孤例。

5.3 Google DeepMind：进入 Gemini 的集体主义工程

离开 Anthropic 约 10 天后，姚顺宇加入 Google DeepMind 任高级研究科学家。后续公开节点包括 Gemini 3 Deep Think 等重大升级的时间邻接性——外界无法逐行对应其个人 commit，但可以确定：他把 跨 lab 的 RL 工程经验 带入了 Google 更偏 bottom-up 大项目协同 的文化。

张小珺 2025 年末 4 小时访谈 中，姚顺宇几个观点值得单独记录（访谈对象为宇，非雨）：

英雄主义时代过去：Transformer 与 Scaling Law 被证明之后，竞争更像集体主义系统工程，胜负取决于团队能否长期投入高质量迭代，而非某一个「天才瞬间」。
「靠谱」比「聪明」更稀缺：细致、对系统负责、能把数值与流程跑稳，在超大规模训练里比口头创新更重要。
从物理转 AI 的动机：高能理论一度让他厌倦「缺少客观评价标准」的环境；AI 仍有清晰 benchmark 与产品反馈，这是他愿意承受「人生最大跨步」的原因之一。

人物关键词：RL 数值、Agentic coding、复杂系统、集体主义工程、跨学科迁移。

六、并置阅读：两条路线如何拼接成今天的 Agent 竞争

如果把 2026 年的 Agent 竞赛拆成两层，两人恰好站在不同层：

┌─────────────────────────────────────────────────────────┐
│  产品 / 生态层：入口、任务、用户留存（微信、Gemini App）   │
├─────────────────────────────────────────────────────────┤
│  模型能力层：Coding / Tool Use / RL 后训练（Claude/Gemini）│  ← 姚顺宇（宇）
├─────────────────────────────────────────────────────────┤
│  范式与评测层：ReAct、ToT、SWE-bench、Web Agent 任务定义   │  ← 姚顺雨（雨）
└─────────────────────────────────────────────────────────┘

没有雨的范式与 benchmark，模型很强也不知道「强在哪道题」；
没有宇的 RL 与数值工程，范式很难沉淀进权重，而不是停留在 demo；
没有腾讯 / Google 的组织容器，个人方法论也无法变成持续交付的基础设施。

这也是为什么「两个 Shunyu Yao」会同时出现在 2025—2026 的新闻峰值：他们分别代表了 Agent 研究的上游定义 与 大模型能力的下游锻造，而两人都被推到了各自公司的关键岗位。

七、对读者与从业者的三条启示

先分清名字，再谈立场。引用英文材料时，核对作者单位与主页域名，避免把 ReAct 作者与 Gemini RL 研究者混为一谈。
Agent 竞争已是「双轮驱动」。只做产品入口没有模型深度会空心化；只做模型没有任务与生态则难以留存。腾讯与 Google 的用人布局，都是这一判断的组织化表达。
跨学科迁移的两种模板。姚顺雨是 计算机内部纵深（从 NLP 到 Agent 到 infra）；姚顺宇是 物理 → AI 的硬切换。前者依赖连续积累，后者依赖对复杂系统与评价标准的重新选择。两条路都走得通，但代价结构不同。

八、延伸阅读与核对清单

资源	说明
姚顺雨个人主页	ReAct、ToT 论文与项目索引
姚顺宇个人主页	物理与 AI 职业轨迹、博客
ReAct 论文	ICLR 2023，推理与行动交错
Tree of Thoughts	NeurIPS 2023 Oral
汤道生 × 姚顺雨对谈	腾讯 AI 下半场、Coding Agent 与混元
张小珺 × 姚顺宇访谈（2025）	英雄主义、组织文化、RL 工程化（注意访谈对象为宇）

快速核对表

提到 ReAct / WebShop / 腾讯混元 Hy3 → 通常是 姚顺雨（雨）
提到 非厄米趋肤效应 / Claude RL numerics / Gemini Deep Think → 通常是 姚顺宇（宇）
英文 Shunyu Yao → 必查机构与主页，不要默认同一人

本文由 TUARAN 整理撰写；协助工具：Codex。若你发现媒体将二人混名的新案例，欢迎反馈以便补充「名字迷宫」一节。

信息来源说明：本调研基于姚顺雨个人主页（ysymyth.github.io）、姚顺宇个人主页（alfredyao.github.io）、普林斯顿大学博士论文公开摘要、ReAct / Tree of Thoughts 论文、腾讯混元 Hy3 preview 公开报道、智源社区 / 钛媒体 / 张小珺商业访谈录等对姚顺宇转职的公开整理，以及汤道生 × 姚顺雨对谈实录。英文简历中两人常被写作 Shunyu Yao，中文报道偶发混名；本文按可交叉印证的公开材料区分「雨」「宇」二人，不涉及未公开的组织内幕与薪酬传闻。

一、先给结论

2024—2026 年的中文 AI 讨论里，「姚顺宇」三个字出现频率很高，但读者经常不知道在说哪一个人。

更准确地说，硅谷与中文媒体里至少活跃着两位常被写成 Shunyu Yao 的华人研究者：

	姚顺雨（雨）	姚顺宇（宇）
学术底色	计算机 / NLP / Agent	理论物理 / 量子混沌
代表工作	ReAct、Tree of Thoughts、WebShop、SWE-bench 等	非厄米趋肤效应、Scramblon 理论；Claude / Gemini 侧 RL 与 Agentic Coding
公开身份（2026 初）	腾讯首席 AI 科学家，混元与大模型基础设施负责人	Google DeepMind 高级研究科学家（前 Anthropic）
核心问题	智能体如何定义任务、推理并作用于数字世界？	大模型如何在规模化 RL 里稳定学会编码与工具使用？

姚顺雨更像在回答「Agent 是什么、怎么测、怎么搭系统」；
姚顺宇更像在回答「模型内部如何通过 RL 与数值工程获得 Agent 能力」。

他们不是同一个人的两种报道，而是同名不同轨的两位研究者。混淆本身，也说明 Agent 与大模型 RL 已成为同一张牌桌上的两种语言。

二、名字为什么会缠在一起

2.1 拼音与英文简历

两人英文名都常被写作 Shunyu Yao。在 Google Scholar、X、招聘新闻和中文转译里，「顺宇」「顺雨」极易被统一成「姚顺宇」。

辨别的小技巧：

雨：个人站与论文作者页多用 ysymyth.github.io，普林斯顿 CS 背景，论文主题集中在 language agents。
宇：个人站为 alfredyao.github.io，斯坦福理论物理博士，博客标题常见 My infant year as an AI researcher，讨论物理转向 AI 的反思。

2.2 中文报道的惯性

三、对照时间线

时间	姚顺雨（雨）	姚顺宇（宇）
本科	清华大学姚班	清华大学物理系，本科特等奖学金；IAS 阶段参与非厄米趋肤效应相关研究
博士	普林斯顿大学 CS，导师 Karthik Narasimhan；论文题旨为 language agents 与 digital automation	斯坦福大学理论物理，导师含 Douglas Stanford；博士论文聚焦量子混沌与量子引力教训
2022—2023	ReAct（ICLR 2023 Oral）、Tree of Thoughts（NeurIPS 2023 Oral）等 Agent 方法论集中发表	物理学术生涯收尾，短暂 UC Berkeley 博后
2024	博士毕业；8 月加入 OpenAI，参与 Operator、Deep Research 等智能体产品方向	10 月加入 Anthropic，参与 Claude 3.7 Agentic coding 与 Claude 4 系列 RL 数值
2025	12 月转任腾讯首席 AI 科学家，兼 AI Infra 与大语言模型部负责人；推动混元架构重组	9 月离开 Anthropic；约 10 天后加入 Google DeepMind
2026 初	混元 Hy3 preview 发布，被称作「混元重建第一步」；腾讯 AI Lab 并入大模型主线	参与 Gemini 3 Deep Think 等新一代 RL 方向（公开报道与其个人站职业轨迹互证）

四、姚顺雨：把 Agent 从论文做成「可评测的世界」

4.1 学术贡献：不止 ReAct 一个名字

公开代表作包括：

ReAct（ICLR 2023 Oral）：交错生成推理轨迹与动作，让模型既能「想」也能「查、点、改环境」，缓解纯 CoT 的幻觉与误差传播。
Tree of Thoughts（NeurIPS 2023 Oral）：把推理从单链扩展为可搜索、可回溯的思维树，在需要规划与试探的任务上大幅提升成功率。
任务层创新：WebShop、InterCode、SWE-bench 等 benchmark，把「上网购物」「写代码修 bug」变成可量化的 Agent 考场。

他的风格是 先定义世界，再定义智能体：没有评测与交互界面，Agent 很容易停留在 prompt 技巧；有了任务与反馈，才谈得上系统演进。

4.2 OpenAI 阶段：从方法论到产品

4.3 腾讯阶段：研究—工程一体化的压力测试

2025 年 12 月腾讯任命姚顺雨为 CEO/总裁办公室首席 AI 科学家，并让其负责 AI Infra 部 与 大语言模型部。这在组织语义上很重要：

过去大厂常见的「基建归基建、算法归算法」被刻意打通；
目标是效仿 OpenAI 式 研究—工程一体化，让混元不止「能发布」，还要能承接微信生态里的 Agent 入口与开发者预期。

人物关键词：任务定义、Agent 范式、数字自动化、研究工程一体、混元重建。

五、姚顺宇：从物理系统到大模型 RL 的「数值直觉」

5.1 物理学术遗产

在转向 AI 之前，姚顺宇已是理论物理圈的高辨识度年轻学者：

本科在清华物理系，曾获 本科生特等奖学金；
2018 年在 Physical Review Letters 发表非厄米系统拓扑能带相关工作；
斯坦福博士阶段研究量子黑洞、全息与 Scramblon 等量子混沌议题。

物理训练留给他的，不是某个 AI 技巧，而是两套习惯：

复杂系统直觉——信息如何在多体系统里扩散、失稳、饱和；
对数值与尺度的敏感——大系统里，参数边界往往决定「能不能训下去」。

5.2 Anthropic：Agentic Coding 与 RL 数值

他在离职博文里谈到几件事（均为其本人公开表述的归纳）：

希望经验不要锁死在单一公司范式；
Anthropic 核心研究员不再以发论文为主要产出形式，这与他的学术习惯存在张力；
组织文化、决策机制与个人长期成长路径的匹配，会影响顶尖研究者去留——这在 2025 年多家 lab 的人才流动中是共性，而非孤例。

5.3 Google DeepMind：进入 Gemini 的集体主义工程

张小珺 2025 年末 4 小时访谈 中，姚顺宇几个观点值得单独记录（访谈对象为宇，非雨）：

英雄主义时代过去：Transformer 与 Scaling Law 被证明之后，竞争更像集体主义系统工程，胜负取决于团队能否长期投入高质量迭代，而非某一个「天才瞬间」。
「靠谱」比「聪明」更稀缺：细致、对系统负责、能把数值与流程跑稳，在超大规模训练里比口头创新更重要。
从物理转 AI 的动机：高能理论一度让他厌倦「缺少客观评价标准」的环境；AI 仍有清晰 benchmark 与产品反馈，这是他愿意承受「人生最大跨步」的原因之一。

人物关键词：RL 数值、Agentic coding、复杂系统、集体主义工程、跨学科迁移。

六、并置阅读：两条路线如何拼接成今天的 Agent 竞争

如果把 2026 年的 Agent 竞赛拆成两层，两人恰好站在不同层：

┌─────────────────────────────────────────────────────────┐
│  产品 / 生态层：入口、任务、用户留存（微信、Gemini App）   │
├─────────────────────────────────────────────────────────┤
│  模型能力层：Coding / Tool Use / RL 后训练（Claude/Gemini）│  ← 姚顺宇（宇）
├─────────────────────────────────────────────────────────┤
│  范式与评测层：ReAct、ToT、SWE-bench、Web Agent 任务定义   │  ← 姚顺雨（雨）
└─────────────────────────────────────────────────────────┘

没有雨的范式与 benchmark，模型很强也不知道「强在哪道题」；
没有宇的 RL 与数值工程，范式很难沉淀进权重，而不是停留在 demo；
没有腾讯 / Google 的组织容器，个人方法论也无法变成持续交付的基础设施。

七、对读者与从业者的三条启示

先分清名字，再谈立场。引用英文材料时，核对作者单位与主页域名，避免把 ReAct 作者与 Gemini RL 研究者混为一谈。
Agent 竞争已是「双轮驱动」。只做产品入口没有模型深度会空心化；只做模型没有任务与生态则难以留存。腾讯与 Google 的用人布局，都是这一判断的组织化表达。
跨学科迁移的两种模板。姚顺雨是 计算机内部纵深（从 NLP 到 Agent 到 infra）；姚顺宇是 物理 → AI 的硬切换。前者依赖连续积累，后者依赖对复杂系统与评价标准的重新选择。两条路都走得通，但代价结构不同。

八、延伸阅读与核对清单

资源	说明
姚顺雨个人主页	ReAct、ToT 论文与项目索引
姚顺宇个人主页	物理与 AI 职业轨迹、博客
ReAct 论文	ICLR 2023，推理与行动交错
Tree of Thoughts	NeurIPS 2023 Oral
汤道生 × 姚顺雨对谈	腾讯 AI 下半场、Coding Agent 与混元
张小珺 × 姚顺宇访谈（2025）	英雄主义、组织文化、RL 工程化（注意访谈对象为宇）

快速核对表

提到 ReAct / WebShop / 腾讯混元 Hy3 → 通常是 姚顺雨（雨）
提到 非厄米趋肤效应 / Claude RL numerics / Gemini Deep Think → 通常是 姚顺宇（宇）
英文 Shunyu Yao → 必查机构与主页，不要默认同一人

本文由 TUARAN 整理撰写；协助工具：Codex。若你发现媒体将二人混名的新案例，欢迎反馈以便补充「名字迷宫」一节。