5月19日晚上11点,Andrej Karpathy亲自官宣加入了Anthropic。
这个名字的分量不需要多解释。
OpenAI联合创始人,特斯拉前AI总监,「Vibe Coding」之父,全球最有影响力的AI教育者。
他在AI领域的地位,大概相当于篮球界的詹姆斯,到哪支队伍都是头条。
他在X上只发了三句话。
https://x.com/karpathy/status/2056753169888334312
第一句说LLM前沿的未来几年「尤其具有塑造性」。第三句说他仍然热爱教育。中间那句最关键,五个词,「回归研发」。
这是两年内第三位从OpenAI阵营投奔Anthropic的核心人物。
也是一个即将40岁、功成名就、财务自由的人,主动选择去给别人的下属当下属。
为什么走?为什么是Anthropic?Anthropic又为什么非要招他?
每一个问题背后都有一层值得拆开看的东西。
Karpathy本周已经开始工作,进入了Anthropic预训练团队。
这个团队由Nick Joseph领导,负责Claude所有大规模训练运行。
Anthropic发言人向TechCrunch确认,Karpathy将组建一个新的子团队,专注于用Claude自身来加速预训练研究。
Nick Joseph也在X上补充了背景,「他将建立一个团队,专注于用Claude加速预训练研究本身。」
https://x.com/nickevanjoseph/status/2056760504949842219
TechCrunch评价称,「Karpathy是少数能在LLM理论与大规模训练实践之间架起桥梁的研究者之一。」
Axios则把这件事定性为「Anthropic在人才争夺中的重大胜利」。
同日宣布加入Anthropic的还有网络安全专家Chris Rohlf,此前xAI创始成员Ross Nordeen也于本月早些时候加入。人才流向的方向性越来越明显。
https://x.com/chrisrohlf/status/2056744653165092983
在Polymarket的数据可以作为市场情绪的旁证——交易者给Anthropic在6月底拥有最佳AI模型的概率定价为65%,而OpenAI为4%。
https://polymarket.com/event/which-company-has-best-ai-model-end-of-june
Karpathy的加入进一步强化了这个判断。
要理解这次加入的重量,需要理解Karpathy这个人的稀缺性。
他的稀缺不在于技术能力,顶级研究者有一批。
他的稀缺,在于他能用一个词改变整个行业理解某件事的方式。
1986年生于斯洛伐克,15岁移民加拿大多伦多。
在多伦多大学读本科时选修了Geoffrey Hinton的课程并参加了他的读书会。
Hinton是深度学习复兴运动的精神领袖,2018年图灵奖得主,2024年诺贝尔物理学奖得主。
Karpathy是最早被这把火点燃的年轻人之一。
之后在Stanford师从另一位传奇人物李飞飞,博士期间创建了CS231n课程。
这门课从2015年的150名学生涨到2017年的750人,全部视频讲义公开上网,成为全球无数工程师自学深度学习的第一站,更是计算机视觉第一神课,没有之一。
2015年,他成为OpenAI的创始研究科学家。
2017年被马斯克招至特斯拉担任AI高级总监,推动自动驾驶走向纯视觉方案。
在这次挖角中,马斯克承受了巨大的压力。
https://www.cnbc.com/2026/05/19/anthropic-hires-openai-cofounder-andrej-karpathy-former-tesla-ai-lead.html
同年,Karpathy在Medium上发表了一篇文章,提出了「Software 2.0」概念,主张神经网络权重就是新的代码,数据集就是新的源代码,梯度下降就是新的编译器。
这个框架重塑了整个行业对「什么是编程」的认知。
2022年离开特斯拉后,他在YouTube上创建了「Neural Networks: Zero to Hero」系列课程,频道突破百万订阅。
同期的开源项目micrograd、nanoGPT、nanochat,代码量极少但精准击中核心概念,被称为「可运行的教科书」。
2025年2月,他造出了「Vibe Coding」一词,被柯林斯词典选为年度词汇。
https://x.com/karpathy/status/1886192184808149383
6月在YC AI Startup School演讲中提出「Software 3.0」和「Agent的十年」框架,成为当年讨论最广的AI演讲之一。
TIME在2024年将他列入「AI领域最具影响力100人」。
从Hinton,到李飞飞,到奥特曼,再到马斯克,他在每个节点都站在最前沿。
但他留下的最持久的东西不是任何一个产品或论文,而是那些概念框架。
Software 2.0、Vibe Coding、LLM OS。这些词改变了人们思考AI的方式。
Karpathy的职业生涯有一条清晰的线索,他追逐的从来不是头衔。
他做过Hinton和李飞飞的学生、奥特曼的同事、马斯克的直接下属。
每一段经历里,他的组织架构位置都是高层。
现在他加入Anthropic,直接上司是Nick Joseph,预训练负责人。
Nick Joseph汇报给Dario Amodei。
Karpathy在组织架构中排到了第三层。
Nick Joseph是Anthropic创始11人之一,此前在Vicarious和OpenAI工作。
在OpenAI期间,他在安全团队做代码模型,看到GPT-3微调之后能写代码,意识到AI可以自我改进,于是跟着安全团队的领导一起离开,创建了Anthropic。
他的团队训出了Claude全系列模型,包括Mythos。
Karpathy愿意在Nick Joseph下面做研究,原因很简单,这个位置离他想做的事最近。
回溯他的每一次职业变动,驱动力都是同一个,「此刻最大的实验在哪里」。
2017年去Tesla,因为自动驾驶是Software 2.0最大的实验场。
2022年离开,因为架构已定,剩下的是工程优化。
2023年回OpenAI,因为ChatGPT随着GPT-4发布带来的爆发期是最刺激的前沿。
2024年创办Eureka Labs,想验证AI原生教育的假设。
2026年加入Anthropic,因为「用AI研究AI」的预训练革命正在这里发生。
每一次离开都不是出于不满,而是当下的位置不再是最大的实验所在。
Jan Leike,OpenAI前对齐负责人,2024年5月加入Anthropic。
OpenAI联合创始人John Schulman,同年8月跟进。
现在轮到了Karpathy。
两年三人,全部单向流动,没有任何可比的反向案例。
OpenAI的战略重心已经从纯研究转向了平台化和收购。Chat.com、io Products、Windsurf、TBPN,收购间隔越来越短,金额越来越大。
这是一家正在变成「AI时代消费巨头」的公司。
对一个想「回归研发」的研究者来说,Anthropic「以研究质量取胜」的路线更有吸引力。
Anthropic的招聘动机可以分成几层。
最表层是技术需求。
Anthropic的算力预算再大,也比不过微软撑腰的OpenAI和坐拥TPU的谷歌。
纯堆算力的竞赛,Anthropic赢不了。
它必须找到一种用更少算力训出更好模型的方法。
「用Claude加速预训练研究」就是这条路线,而Karpathy同时具备预训练理论深度、大规模工程经验、和对AI辅助研究的直觉,三者兼备的人极少。
再往下是人才信号。
两年三位OpenAI核心人物单向流入Anthropic,「一线研究者用脚投票」的叙事已经成型。
每一个Karpathy级别的加入,都在降低下一个顶级人才加入的心理门槛。人才吸引人才,飞轮自转。
还有IPO前的品牌镀金。
Anthropic正在以9000亿美元估值谈300亿美元融资,IPO准备也在推进。
Karpathy是AI领域公众辨识度最高的技术人物之一,百万YouTube订阅,年度词汇造词者,22万GitHub星标的CLAUD.md仓库。
他的名字出现在Anthropic的员工名单上,直接给了投行一句可以写进招股书的话。
但最有意思的一层可能是Anthropic没有明确作为招聘动机、却注定会收获最大回报的东西,Karpathy定义范式的能力。
他在Anthropic做的任何技术探索都会被他公开谈论,推文、博客、YouTube视频。
当他用他特有的方式给正在发生的事情命名时,Anthropic就自然成为那个范式的原产地。
招了一个顶级预训练研究者,附带获得了行业最有影响力的技术叙事者。
把这件人事变动放到更大的背景下看,它标记的是一个技术拐点。
2026年4月,Anthropic发布了Mythos Preview,迄今最强大的AI模型。
Mythos过于强大,仅能通过Project Glasswing受邀内测
Mythos在没有被专门训练网络安全的情况下,自主发现并利用了FreeBSD中一个存在17年的远程代码执行漏洞,找到了OpenBSD中27年的漏洞和FFmpeg中16年的缺陷。
英国AI安全研究所的独立评估确认,它是第一个能从头到尾完成32步企业网络攻击模拟的模型。
Anthropic自己也承认,这些能力不是刻意训练的结果,是通用推理和软件工程能力提升的「下游涌现」。
预训练做得越好,涌现出的能力越超出预期。
Mythos是当前最强大的模型,也是当前最强大的工具。
Karpathy来Anthropic要做的,就是拿这把最强的锤子,去改进锤子本身的制造方式。
用Mythos / Claude来发现更优的训练架构、数据配比、实验方向,让模型改进的速度脱离人类研究者的线性节奏,转起「AI改进AI」的进化飞轮。
这也是Anthropic最期望的结局。
当这个飞轮真正转起来,「AI自我改进预训练」就不再只是一个研究方向,而是通往AGI乃至ASI的加速通道。
目前所有关于算力军备竞赛、数据壁垒、人才争夺的竞争维度,都可能被这一个变量改写。
三年内,OpenAI失去三位核心人物给同一个竞争对手。
这个事实的影响可能比任何融资数字都大。
算力可以用钱买,数据可以用时间积累,但能让AI进化飞轮转起来的人,全世界一只手数得过来。