T
TUARAN涂阿燃 · 网络日志

Menu

...

检查登录状态…

© 2025—2026 网络日志·关于本站·关于站长·聊合作·留言板·RSS·支持本站·流量统计·提建议·CI Status

知识库·人物调研·2026-06-10·15 min read·阅读量 -·协助:GPT5.5
RSS

姚顺雨与姚顺宇人物调研:两个 Shunyu Yao,两条 AI 路线

涂阿燃 · tuaran前端 / AI Agent / 政企方案

在 2aran.com 写技术调研、AI 工程实践与独立开发笔记。 关于站长 →

TL;DR这对人物最值得研究的地方,不是「谁更厉害」,而是他们恰好站在同一条技术河流的两个闸口:姚顺雨把「语言智能体如何与世界互动」做成可评测的任务与方法论,并试图在腾讯把研究—工程一体化落到混元与 Agent 入口;姚顺宇则把物理学家对复杂系统与数值稳定性的敏感,带进大模型 RL 与 Agentic Coding 的工程现场。媒体混写、简历撞名,但路线并不重叠。
#姚顺雨#姚顺宇#AI Agent#ReAct#Tree of Thoughts#腾讯混元#Anthropic#Google DeepMind#强化学习
文章目录
  • 一、先给结论
  • 二、名字为什么会缠在一起
  • 三、对照时间线
  • 四、姚顺雨:把 Agent 从论文做成「可评测的世界」
  • 五、姚顺宇:从物理系统到大模型 RL 的「数值直觉」
  • 六、并置阅读:两条路线如何拼接成今天的 Agent 竞争
  • 七、对读者与从业者的三条启示
  • 八、延伸阅读与核对清单

信息来源说明:本调研基于姚顺雨个人主页(ysymyth.github.io)、姚顺宇个人主页(alfredyao.github.io)、普林斯顿大学博士论文公开摘要、ReAct / Tree of Thoughts 论文、腾讯混元 Hy3 preview 公开报道、智源社区 / 钛媒体 / 张小珺商业访谈录等对姚顺宇转职的公开整理,以及汤道生 × 姚顺雨对谈实录。英文简历中两人常被写作 Shunyu Yao,中文报道偶发混名;本文按可交叉印证的公开材料区分「雨」「宇」二人,不涉及未公开的组织内幕与薪酬传闻。

一、先给结论

2024—2026 年的中文 AI 讨论里,「姚顺宇」三个字出现频率很高,但读者经常不知道在说哪一个人。

更准确地说,硅谷与中文媒体里至少活跃着两位常被写成 Shunyu Yao 的华人研究者:

姚顺雨(雨) 姚顺宇(宇)
学术底色 计算机 / NLP / Agent 理论物理 / 量子混沌
代表工作 ReAct、Tree of Thoughts、WebShop、SWE-bench 等 非厄米趋肤效应、Scramblon 理论;Claude / Gemini 侧 RL 与 Agentic Coding
公开身份(2026 初) 腾讯首席 AI 科学家,混元与大模型基础设施负责人 Google DeepMind 高级研究科学家(前 Anthropic)
核心问题 智能体如何定义任务、推理并作用于数字世界? 大模型如何在规模化 RL 里稳定学会编码与工具使用?
  • 姚顺雨更像在回答「Agent 是什么、怎么测、怎么搭系统」;
  • 姚顺宇更像在回答「模型内部如何通过 RL 与数值工程获得 Agent 能力」。

他们不是同一个人的两种报道,而是同名不同轨的两位研究者。混淆本身,也说明 Agent 与大模型 RL 已成为同一张牌桌上的两种语言。

二、名字为什么会缠在一起

2.1 拼音与英文简历

两人英文名都常被写作 Shunyu Yao。在 Google Scholar、X、招聘新闻和中文转译里,「顺宇」「顺雨」极易被统一成「姚顺宇」。

办公桌前的讨论

辨别的小技巧:

  • 雨:个人站与论文作者页多用 ysymyth.github.io,普林斯顿 CS 背景,论文主题集中在 language agents。
  • 宇:个人站为 alfredyao.github.io,斯坦福理论物理博士,博客标题常见 My infant year as an AI researcher,讨论物理转向 AI 的反思。

2.2 中文报道的惯性

2025 年底姚顺雨加盟腾讯时,大量标题使用「OpenAI 科学家姚顺宇加盟腾讯」——把「雨」写成「宇」。与此同时,姚顺宇离开 Anthropic 加入 DeepMind 的新闻也在同周期发酵。读者在信息流里看到两个「姚顺宇」,却对应两家巨头、两条技术线,混乱是结构性的,不是偶然笔误。

三、对照时间线

时间 姚顺雨(雨) 姚顺宇(宇)
本科 清华大学姚班 清华大学物理系,本科特等奖学金;IAS 阶段参与非厄米趋肤效应相关研究
博士 普林斯顿大学 CS,导师 Karthik Narasimhan;论文题旨为 language agents 与 digital automation 斯坦福大学理论物理,导师含 Douglas Stanford;博士论文聚焦量子混沌与量子引力教训
2022—2023 ReAct(ICLR 2023 Oral)、Tree of Thoughts(NeurIPS 2023 Oral)等 Agent 方法论集中发表 物理学术生涯收尾,短暂 UC Berkeley 博后
2024 博士毕业;8 月加入 OpenAI,参与 Operator、Deep Research 等智能体产品方向 10 月加入 Anthropic,参与 Claude 3.7 Agentic coding 与 Claude 4 系列 RL 数值
2025 12 月转任腾讯首席 AI 科学家,兼 AI Infra 与大语言模型部负责人;推动混元架构重组 9 月离开 Anthropic;约 10 天后加入 Google DeepMind
2026 初 混元 Hy3 preview 发布,被称作「混元重建第一步」;腾讯 AI Lab 并入大模型主线 参与 Gemini 3 Deep Think 等新一代 RL 方向(公开报道与其个人站职业轨迹互证)

四、姚顺雨:把 Agent 从论文做成「可评测的世界」

4.1 学术贡献:不止 ReAct 一个名字

姚顺雨博士论文的标题是 Language Agents: From Next-Token Prediction to Digital Automation。这句话本身就把他的长期问题说透了:语言模型不止该会生成下一句,还要能在数字环境里持续决策。

俯瞰城市街区

公开代表作包括:

  • ReAct(ICLR 2023 Oral):交错生成推理轨迹与动作,让模型既能「想」也能「查、点、改环境」,缓解纯 CoT 的幻觉与误差传播。
  • Tree of Thoughts(NeurIPS 2023 Oral):把推理从单链扩展为可搜索、可回溯的思维树,在需要规划与试探的任务上大幅提升成功率。
  • 任务层创新:WebShop、InterCode、SWE-bench 等 benchmark,把「上网购物」「写代码修 bug」变成可量化的 Agent 考场。

他的风格是 先定义世界,再定义智能体:没有评测与交互界面,Agent 很容易停留在 prompt 技巧;有了任务与反馈,才谈得上系统演进。

4.2 OpenAI 阶段:从方法论到产品

2024 年加入 OpenAI 后,姚顺雨的工作更接近「语言智能体产品化」——公开报道将其与 Operator、Deep Research 等方向关联。这与他在博士阶段 Part I「digital automation」的脉络一致:互联网与代码界面上的长程任务,正是今天 Coding Agent 与 Web Agent 的产品前沿。

4.3 腾讯阶段:研究—工程一体化的压力测试

2025 年 12 月腾讯任命姚顺雨为 CEO/总裁办公室首席 AI 科学家,并让其负责 AI Infra 部 与 大语言模型部。这在组织语义上很重要:

  • 过去大厂常见的「基建归基建、算法归算法」被刻意打通;
  • 目标是效仿 OpenAI 式 研究—工程一体化,让混元不止「能发布」,还要能承接微信生态里的 Agent 入口与开发者预期。

2026 年 4 月 混元 Hy3 preview 开源,被团队表述为「从读万卷书到行万里路的开端」「混元重建第一步」。同期报道还提到:成立十年的 腾讯 AI Lab 撤销,核心人力并入大模型部——说明这场调整不是人事噱头,而是研发主线的重排。

姚顺雨在公开对谈里强调 Coding Agent 的图灵完备性:当模型能操作文件系统与容器,Agent 就不只是聊天外壳,而是可闭环的执行系统。他也坦言腾讯会走 体系全面化 路线——数据、训练、Agent 形态与产品 Co-design 同步迭代,而不是单点模型秀肌肉。

人物关键词:任务定义、Agent 范式、数字自动化、研究工程一体、混元重建。

五、姚顺宇:从物理系统到大模型 RL 的「数值直觉」

5.1 物理学术遗产

在转向 AI 之前,姚顺宇已是理论物理圈的高辨识度年轻学者:

  • 本科在清华物理系,曾获 本科生特等奖学金;
  • 2018 年在 Physical Review Letters 发表非厄米系统拓扑能带相关工作;
  • 斯坦福博士阶段研究量子黑洞、全息与 Scramblon 等量子混沌议题。

物理训练留给他的,不是某个 AI 技巧,而是两套习惯:

  1. 复杂系统直觉——信息如何在多体系统里扩散、失稳、饱和;
  2. 对数值与尺度的敏感——大系统里,参数边界往往决定「能不能训下去」。

5.2 Anthropic:Agentic Coding 与 RL 数值

2024 年加入 Anthropic 后,姚顺宇的工作重心转向 「学习的科学」:如何让 Claude 在规模化强化学习中稳定获得 Agentic coding 与工具使用能力。公开材料将其与 Claude 3.7 的 agentic coding 能力、Claude 4 家族 的 RL numerics 相关联。

他在离职博文里谈到几件事(均为其本人公开表述的归纳):

  • 希望经验不要锁死在单一公司范式;
  • Anthropic 核心研究员不再以发论文为主要产出形式,这与他的学术习惯存在张力;
  • 组织文化、决策机制与个人长期成长路径的匹配,会影响顶尖研究者去留——这在 2025 年多家 lab 的人才流动中是共性,而非孤例。

5.3 Google DeepMind:进入 Gemini 的集体主义工程

离开 Anthropic 约 10 天后,姚顺宇加入 Google DeepMind 任高级研究科学家。后续公开节点包括 Gemini 3 Deep Think 等重大升级的时间邻接性——外界无法逐行对应其个人 commit,但可以确定:他把 跨 lab 的 RL 工程经验 带入了 Google 更偏 bottom-up 大项目协同 的文化。

张小珺 2025 年末 4 小时访谈 中,姚顺宇几个观点值得单独记录(访谈对象为 宇,非雨):

  • 英雄主义时代过去:Transformer 与 Scaling Law 被证明之后,竞争更像集体主义系统工程,胜负取决于团队能否长期投入高质量迭代,而非某一个「天才瞬间」。
  • 「靠谱」比「聪明」更稀缺:细致、对系统负责、能把数值与流程跑稳,在超大规模训练里比口头创新更重要。
  • 从物理转 AI 的动机:高能理论一度让他厌倦「缺少客观评价标准」的环境;AI 仍有清晰 benchmark 与产品反馈,这是他愿意承受「人生最大跨步」的原因之一。

人物关键词:RL 数值、Agentic coding、复杂系统、集体主义工程、跨学科迁移。

六、并置阅读:两条路线如何拼接成今天的 Agent 竞争

如果把 2026 年的 Agent 竞赛拆成两层,两人恰好站在不同层:

┌─────────────────────────────────────────────────────────┐
│  产品 / 生态层:入口、任务、用户留存(微信、Gemini App)   │
├─────────────────────────────────────────────────────────┤
│  模型能力层:Coding / Tool Use / RL 后训练(Claude/Gemini)│  ← 姚顺宇(宇)
├─────────────────────────────────────────────────────────┤
│  范式与评测层:ReAct、ToT、SWE-bench、Web Agent 任务定义   │  ← 姚顺雨(雨)
└─────────────────────────────────────────────────────────┘
  • 没有雨的范式与 benchmark,模型很强也不知道「强在哪道题」;
  • 没有宇的 RL 与数值工程,范式很难沉淀进权重,而不是停留在 demo;
  • 没有腾讯 / Google 的组织容器,个人方法论也无法变成持续交付的基础设施。

这也是为什么「两个 Shunyu Yao」会同时出现在 2025—2026 的新闻峰值:他们分别代表了 Agent 研究的上游定义 与 大模型能力的下游锻造,而两人都被推到了各自公司的关键岗位。

七、对读者与从业者的三条启示

  1. 先分清名字,再谈立场。引用英文材料时,核对作者单位与主页域名,避免把 ReAct 作者与 Gemini RL 研究者混为一谈。
  2. Agent 竞争已是「双轮驱动」。只做产品入口没有模型深度会空心化;只做模型没有任务与生态则难以留存。腾讯与 Google 的用人布局,都是这一判断的组织化表达。
  3. 跨学科迁移的两种模板。姚顺雨是 计算机内部纵深(从 NLP 到 Agent 到 infra);姚顺宇是 物理 → AI 的硬切换。前者依赖连续积累,后者依赖对复杂系统与评价标准的重新选择。两条路都走得通,但代价结构不同。

并肩工作的两人

八、延伸阅读与核对清单

资源 说明
姚顺雨个人主页 ReAct、ToT 论文与项目索引
姚顺宇个人主页 物理与 AI 职业轨迹、博客
ReAct 论文 ICLR 2023,推理与行动交错
Tree of Thoughts NeurIPS 2023 Oral
汤道生 × 姚顺雨对谈 腾讯 AI 下半场、Coding Agent 与混元
张小珺 × 姚顺宇访谈(2025) 英雄主义、组织文化、RL 工程化(注意访谈对象为 宇)

快速核对表

  • 提到 ReAct / WebShop / 腾讯混元 Hy3 → 通常是 姚顺雨(雨)
  • 提到 非厄米趋肤效应 / Claude RL numerics / Gemini Deep Think → 通常是 姚顺宇(宇)
  • 英文 Shunyu Yao → 必查机构与主页,不要默认同一人

本文由 TUARAN 整理撰写;协助工具:Codex。若你发现媒体将二人混名的新案例,欢迎反馈以便补充「名字迷宫」一节。

Support

支持这篇调研

一下点赞、一句评论,都是对继续写下去的支持。

评论

Related

同类调研

  • 2026-06-30 22:15张一鸣早期博客调研:或者说,怎样看《字节跳动方法论》
  • 2026-06-05从天涯重启谈起:回顾当年明月,江湖上还流传着他的故事
  • 2026-05-20人工智能先驱人物调研:六个把神经网络从冷宫带回王座的人

Discussion

讨论

还没有讨论

以游客身份发表 —— 登录后历史评论会自动绑定到你的账号
1000 字
来留下第一条讨论。

Stay in touch

写完一篇 · 走到下一段

Newsletter

每周收一封,少刷一点信息流

我会把新文章、调研、资源更新和工具发布整理成一封邮件。频率克制,不做日更轰炸。

先用本站 D1 记录订阅;配置 Buttondown token 后会同步到 Buttondown。

📡
RSS 订阅 →

2aran.com/rss.xml · 用你的阅读器订阅,不错过任何一篇

💬
加入社群 →

微信小红书读者群,不焦虑,慢节奏

📚
知识库 →

精选文章 + 公司调研 + 事项调研 + 人物调研

👋
关于站长 →

前端 · AI Agent · 政企方案

合作 / 咨询 / 调研定制见 合作说明 · 微信 atar24