编者按:在大模型能力持续跃迁、AI 编程工具快速普及的背景下,行业讨论正在从「模型能否完成任务」转向「模型能力如何被组织成产品、工作流和商业系统」。
过去一年,Claude Code、Codex、Co-work 等产品相继进入开发者和知识工作者场景,AI 不再只是一个回答问题的聊天框,而开始成为可以调用工具、执行任务、验证结果的生产接口。但当「agent 会成为下一代软件形态」逐渐成为共识,一个更关键的问题开始浮现:谁能率先把模型能力转化为可复用、可分发、可规模化的工作系统?
本文整理自 ACCESS Podcast 对 Mike Krieger 的访谈。Mike Krieger 是 Instagram 联合创始人,目前是 Anthropic 的首席产品官,负责 Anthropic Labs,旨在带领团队探索 Claude Code 之后 Anthropic 的下一批前沿产品方向。
Alex Heath(左)和 Mike Krieger(右)
在这场对谈中,Mike Krieger 并不是单纯讨论 Anthropic 下一个产品会是什么,而是将 AI 产品竞争拆解为一组更底层的结构性问题:模型能力如何进入真实工作流,AI 公司内部如何组织创新,平台公司如何处理与生态客户的边界,以及当 AI 执行能力越来越强,人类判断力在生产链条中将被重新放在哪里。
第一,是产品形态从「聊天」转向「任务」。过去,大模型主要以对话框形式存在,用户输入 prompt,模型生成回答;现在,Claude Code、Co-work、Claude Design 代表的是另一种产品逻辑:让 AI 围绕一个目标持续推进工作,并在过程中调用工具、生成结果、进行验证。这意味着,AI 产品的关键不再只是回答质量,而是任务拆解、上下文连续性、工具调用和结果校验能力。谁能把这些能力封装成顺滑的工作流,谁就更接近下一代生产力入口。
第二,是组织方法从「大团队规划」转向「小团队试错」。Anthropic Labs 的运转方式,更像一个嵌入大公司内部的创业单元:两三个人起步,两周一次评审,用高频反馈判断项目是否继续推进。过去,大公司创新实验室容易陷入周期过长、责任模糊和「还可以」的项目被拖延;现在,模型降低了构建成本,真正稀缺的反而是判断力、品味和决策速度。这意味着,AI 时代的组织效率不只取决于工程人数,而取决于能否用更小团队更快验证方向。
第三,是平台与应用的边界正在重新划定。Claude Code 的成功让 Anthropic 不再只是模型供应商,也开始亲自定义应用形态;Claude Design 与 Figma 的争议,则显示模型公司下场做应用会不可避免地触碰客户和生态伙伴的利益。过去,基础模型公司更多提供底层能力,由 Cursor、Figma 等垂直应用完成用户界面和场景封装;现在,模型公司也需要通过自有产品展示 agent-first 的未来形态。这意味着,AI 平台竞争不仅是 API 竞争,也是产品范式竞争。
第四,是 AI 越强,人类判断越稀缺。Mike 反复强调,Claude 可以更快写代码、生成原型、执行任务,但它无法替代从 0 到 1 过程中最困难的部分:提出正确问题、理解真实用户、定义产品北极星,以及判断什么才是「对的」。过去,执行能力是知识工作的主要瓶颈;现在,执行正在被模型加速,人的价值更集中在前置判断、创造力、关系网络和组织能力上。AI 不会自动消除艰难决策,反而会让错误方向被更快放大。
如果将这场对谈压缩为一个判断,那就是:Claude Code 之后,Anthropic 要寻找的不是单一爆款产品,而是一套让 AI 从模型能力转化为生产系统的方法。在这个意义上,本文讨论的对象,已经不只是 Anthropic 的下一步产品路线,而是整个 AI 行业从「模型竞赛」进入「系统竞赛」的结构性转折。
以下为原文内容(为便于阅读理解,原内容有所整编):
TL;DR
·AI 产品竞争已从「模型更强」转向「能力如何落地」,本质是大模型公司开始争夺工作流入口。
·Claude Code 的意义不只是写代码,而是证明了 agent 可以在明确目标下持续执行任务,推动 AI 从聊天工具变·成生产系统。
·Anthropic Labs 的核心价值不在发布多少产品,而在用小团队快速验证模型下一步应该具备什么能力。
·Co-work 代表 Anthropic 想把 Claude Code 的方法论扩展到非程序员,本质是把「编程能力」抽象成普通人的工作自动化能力。
·OpenAI Codex 的追赶让 Claude 的优势不再只是技术领先,而取决于 Anthropic 能否把 Claude Code、Co-work、Claude.ai 整合成统一体验。
·模型公司亲自下场做应用会加剧与客户的边界冲突,但这也是它们定义下一代 AI 产品形态的必然路径。
·AI 越能快速执行,人的价值越集中在前置判断、产品品味和问题定义上,因为错误方向也会被 AI 更快放大。
·AI 对就业的冲击不是单一公司能解决的问题,本质上会迫使社会重新讨论技能重塑、分配机制与人类不可替代能力。
原文内容
Alex Heath(主持人):Claude Code 之后,Anthropic 的下一个大产品会是什么?本周节目,我们请到了 Mike Krieger。他是 Instagram 联合创始人,现在负责 Anthropic 内部做「登月项目」的团队。
Mike Krieger(Anthropic 首席产品官):
我在 Anthropic 任职期间最黑暗的一天之一,就是把它命名为 3.5 v2。至于我们为什么最后会取这个名字,我可以解释。
Alex Heath:我和 Mike 是在旧金山 Anthropic 最近举办的 Claude Code 大会期间,线下录制了这场对话。那次大会上,Anthropic 宣布与 Elon Musk 达成了一项新的大型算力合作。所以,你们现在算是要和 Elon 一起上太空了?
Mike Krieger:完全正确。是的,我们正在寻找新的、甚至有些意想不到的算力来源。
Alex Heath:我们聊到了 Mike 现在正在做什么,Anthropic 与 OpenAI 之间激烈的竞争,以及 Mike 认为,即便 AI 变得越来越强,人类工作中哪些部分依然会继续重要。
这里是《Access》。
Mike,很高兴在旧金山的 Claude Code 大会上见到你。我刚才还在回想我们上一次对话。那时候你刚接手 Labs 没多久,但现在已经过去几个月了吧?
Mike Krieger:是的,差不多快四个月了。
Labs 如何运转:两周一次淘汰,用小团队验证大产品
Alex Heath:差不多四个月。对于不了解 Labs 的人,我想从这里开始。因为这是一个挺特别的组织架构。几个月前我去你们办公室的时候,我们也聊过这个。Labs 到底是什么?它在 Anthropic 内部的使命是什么?
Mike Krieger:简单来说,我对 Labs 的理解是——现在这个版本,我会称之为 Labs v2。我们也可以之后再展开讲 Labs v1 做过什么,以及 Labs v2 想做什么。
但我认为 Labs 主要做两件事。
第一,是缩小 Claude 理论能力与普通人日常使用体验之间的差距。也就是说,Claude 在理论上能做很多事情,但这些能力如何真正进入人们的日常工作和生活?我们要做哪些产品、原型或项目,才能展示如何释放更多这种潜力,如何把这中间的差距尽可能缩小?
第二,我们更像是一支「前沿侦察队」,去判断模型未来需要往哪个方向演进,才能满足不同用户的需求。
所以,一个成功的 Labs 项目,不一定是最终发布成产品。它也可能是一个原型。我们做出来之后发现:模型目前还不够好,暂时无法完成这个任务。那我们就把它先放到一边,等下一代模型发布时再重新评估,或者把它变成未来模型开发中的一个评测指标,然后继续迭代。
因此,和纯产品公司的产品实验室不同,那里衡量成功的标准可能是「你有没有发布一个产品」。但在 Anthropic,Labs 的价值还可以体现在其他方面:它可以影响 Anthropic 未来的方向。
Alex Heath:Labs 确实做出过一些爆款,对吧?Claude Code 是其中之一,MCP 也是。还有哪些?
Mike Krieger:Agent Skills 也是 Labs 做出的一个很重要的东西。另外我还可以讲一个当时没有发布、但对研究非常有帮助的项目:computer use,也就是让 Claude 使用电脑。
我是在 2024 年 5 月加入 Anthropic 的。下周就是我加入两周年,我们内部叫「antiversary」。
Alex Heath:是 anniversary 吗?
Mike Krieger:是 antiversary。Anthropic 里面什么都要和 ant 扯上关系。一开始我还挺抗拒的。我们也不说 dogfood,而是说 antfood。
我加入后,我们开始搭建 Labs。当时最早被提出来的项目之一就是:为什么不试试看,让 Claude 来使用一台电脑?
Alex Heath:也就是 computer use。
Mike Krieger:对。
Alex Heath:那是什么模型时代?
Mike Krieger:那是 Claude Sonnet 3.5。那也是我参与发布的第一代模型。我加入第三周就开始做这个发布。我们经常开玩笑说,Anthropic 没有所谓 onboarding 项目,它会直接把一个很难的项目丢给你。而我就是第三周直接参与发布。
Sonnet 3.5 是一个很有意思的模型,因为它是最早真正解锁部分编程场景的模型之一。还不到完整 agentic coding 的程度,但已经能看到一些苗头。
所以,我们把 Sonnet 3.5 放进来,围绕它做了一个 computer use 产品。但它有很多问题。比如它使用电脑的速度太慢,准确度也不够高,视觉能力也不够好。它会看到屏幕,然后说「我需要点击那个按钮」,结果实际点到了别的地方。
但搭建这个「不完全可用」的测试框架本身非常有帮助。因为后来当我们做到 Sonnet 3.5 v2 的时候——这个命名可以以后再展开讲,那真的是我在 Anthropic 最黑暗的一天之一——我们就可以把新模型放进这个框架里测试。
后来我们又试了 3.6,还是不够好,但已经有一点起色。再到 3.7,我对那一天印象非常深。当时我在纽约出差,去见纽约团队。突然有人发消息给我说:我们觉得之前 Labs 做的那个东西,也就是当时已经放了九个月的 computer use 项目,在 Sonnet 3.7 上真的开始展现生命迹象了。我们认为,是时候把 computer use 作为一项能力,对外开放并公开讨论了。
这中间大概经历了九个月。我们每隔几个月就把新模型放进同一个测试框架里试一次。即便 Labs 当时已经把这个项目暂时放下了,它仍然非常有用,因为它成了评估模型中 computer use 能力演进的一套测试集。
Alex Heath:你刚加入 Anthropic 的时候,是首席产品官。我记得当时我还想了一下:Mike Krieger,这个 Instagram 联合创始人,在我印象里是非常偏消费者产品的创始人,怎么会加入一家企业级 AI 公司?
Mike Krieger:是的。
Alex Heath:我们当时可能也聊过这个。我当时觉得,这是一个很有意思的选择。事后看,这是一个正确的选择。当然,时机也非常好。
我很好奇,你一开始是作为 CPO 加入,负责整个产品线。而「AI 产品」这个概念本身就有点模糊,而且变化很快。你是怎么在大概四五个月前转到 Labs 的?据我了解,你现在更像是一个 IC,也就是个人贡献者?你现在还管人吗?
Mike Krieger:我现在不管人。我们刚好要进入绩效评估周期了。
Alex Heath:所以这就是你想要的,对吧?你是为了逃离写绩效评估?
Mike Krieger:没错。我打开系统,看自己要写哪些评估,结果发现:你只需要写自己的自评,以及对你经理的评价。
Alex Heath:就这些?
Mike Krieger:就这些。
Alex Heath:现在都是 Claude 来写绩效评估了。
Mike Krieger:Claude 确实会帮忙写一些评估,这挺有用的。它不会替你全部写完,但至少可以帮你回忆:过去六个月我到底做了什么?
我觉得公司经历过不同阶段,不同阶段对我真正有热情的事情,匹配程度是不一样的。
我刚加入的时候,整个产品和工程团队大概只有 30 个人,也许产品和工程各占一半。我们当然也有一些工程团队在做研究基础设施、可扩展性等工作,但如果只看真正围绕产品构建的人,当时主要就是 Claude.ai 和我们那时还叫 API 的东西——当时甚至还没有叫 Claude Platform——总共可能也就 30 到 35 个人,非常非常小。
那时它仍然很像一家早期创业公司,很多事情都还在定义阶段。比如「这个产品到底是什么」还远没有成形。当时的 Claude.ai 没有 Projects,没有 Artifacts,基本上就是你和 Claude 的一串对话列表,上面几乎没有额外功能。
所以,那时加入 Anthropic 的感觉,很像加入一家正在寻找产品形态的创业公司。当然,它已经有顺风了。
Alex Heath:你加入的时候,Claude 3 系列已经发布了,对吧?包括 Opus、Sonnet 和 Haiku。
Mike Krieger:是的。那是 Anthropic 第一次拿出一个至少接近前沿水平的模型系列。那时还有太多产品层面的事情要做:这个产品到底要成为什么?
虽然我的背景更偏消费者产品,但我之所以很兴奋,是因为在 Instagram 到 Anthropic 之间的那段时间,我和 Instagram 的联合创始人 Kevin 做了很多投资。我们有一整套投资主题,其中一个就是「工作的未来」——未来工作会如何被完成。
而 Anthropic 看起来非常有可能解锁这一主题:当你拥有一个非常聪明的助手来帮助你工作时,会发生什么?我当时甚至没有预见到,这件事会变得这么具有颠覆性。
Alex Heath:你当时可能觉得:这是一家挺有意思的小 AI 公司,也许能帮我理解一些投资主题。
Mike Krieger:对,可能会帮助我们理解一些正在思考的主题。但实际上,它改变的东西远比我想象中多得多。
那是第一阶段:团队很小,正在做的项目一只手就能数过来。然后我们快进到去年年底,产品团队已经有几百人了。我们有一整个项目组合,很多工作开始变成部署、理解客户需求、面向客户、管理层级,以及所有这些随着公司成长必然出现的事情。
我逐渐意识到,有些人非常喜欢这类工作,也非常擅长。我非常尊重他们。但对我来说,我有一个很好的教练,她把这种状态称为「能力区」——也就是你擅长做的事,你做得很好,也能胜任,但它并不是最终真正点燃你、驱动你的事情。
这其实是一个很危险的位置。因为你可以在这个位置上做很久很久,而且看起来表现不错,但它不是你最有火焰、最有动力的地方。
所以,去年第四季度,我开始和 Daniela 讨论这件事。我说,公司已经长大了。我们确实把通常需要五年完成的成长过程压缩跑完了。虽然实际也就两年左右。
Alex Heath:是的,我觉得你们增长得还算不错。
Mike Krieger:是的,增长还可以。团队规模、产品组合都扩张得很快。于是我说,我觉得自己想去做一家新公司。
Daniela 问我:这是因为你想离开 Anthropic,还是因为你想调整自己在公司里做的事情?我说,我很喜欢这家公司。这里的人非常棒,我也很喜欢这项技术、使命等等。
刚好那时候,我们也在重新启动 Labs。因为 Labs v1 太成功了,所有项目都毕业了,最后一个人也没留下。于是 Labs 其实就被暂时收起来、放在一边了。
所以我们决定重新启动 Labs,而我也回到 builder 的角色。所有在工作内外见到我的人都会说:「Mike,你看起来太开心了。」
Alex Heath:你的一些同事今天早些时候也跟我说了。他们说,Mike 现在状态太好了,过得特别开心。
Mike Krieger:是的。当然,我仍然是自己最严厉的批评者。所以我每天都会想:我怎么才能做得更好?我们能做什么?我们能构建什么?我们到底在验证什么?
所以这并不是一件轻松的事。但它确实更符合真正驱动我的那些东西。
Alex Heath:我们不用在这个问题上停留太久,但我确实很着迷于科技公司内部做这种「登月式」「从 0 到 1」的实验室。Alphabet 可能是最典型的例子,但类似尝试在科技史上其实很多。有些成功了,有些没有。
Anthropic 的 Labs v1,至少从产品结果来看,显然是成功的。
Mike Krieger:是的。
目标:找下一个 Claude Code
Alex Heath:我想这也会给你现在带来很大压力。因为你会想:好,Claude Code 已经在那里了,我必须做出一个能与它相比的东西。
Mike Krieger:是的。很有意思的是,我们内部有一个类似使命宣言的说法:我们要找到下一个 Claude Code。
在 Labs v2 启动时,这个标准已经很高了。但从那以后,Claude Code 又继续增长,所以这个门槛变得更高了。
我认为有几件事很重要。对我来说,有创业经历很有帮助,因为你永远不可能完全复制那种感觉:两三个人对抗整个世界,手里只有一定数量的钱。如果我们不能做出一个可行的东西,就必须关掉公司,把钱还给投资人。
Alex Heath:这就像你和 Kevin 当年那样。
Mike Krieger:完全一样。我记得那种生死攸关的问题每天都压在我身上:如果这件事做不成会怎样?我还能继续拥有这种独立性吗?我还能继续做自己真正关心的事情吗?
这种感觉在大公司内部很难人为制造出来,除非你设计一些非常复杂的结构。我也见过那种做法。在启动 Labs v2 之前,我研究了很多公司内部实验室的案例。有些公司会让团队获得他们创造出来的东西的一部分股权,或者设计其他类似激励机制。
Alex Heath:对,就是各种「补丁式」的安排。
两周试错一轮项目
Mike Krieger:是的,它们都是在试图修补这种感觉。
但我们发现,真正有效的方式其实不完全是激励机制。因为 Anthropic 本身吸引了很多非常有主动性、有野心,同时又有使命感的人。我们更需要警惕的,不是大家有没有动力把项目做好,而是如何避免这里变成一个舒适的地方,让一些「还可以」的想法被拖上好几个月。
所以我们的做法是缩短周期。Labs v1 基本是四到六周一次评审,一个项目会获得支持,然后团队大概有六周时间去证明一些东西。
现在我们采用两周 sprint。每两周,每个项目都要面向整个 Labs 领导团队汇报。这不是那种「杀戮委员会」式的会议,通常都是比较理性的讨论,除非某个项目真的严重偏航。
但我们会非常认真地追问每个项目一个问题:过去两周你学到了什么?以及:我们学到的东西够多了吗?
有时候,一个项目已经完成了它该完成的事情。你会说,这个项目很棒,它已经证明了该证明的东西,我们其实不需要再多花两周。
现在变化太快了,而且借助这些模型,构建速度也非常快。所以,让一个项目多拖四周的机会成本其实很高。
我认为这是 Labs v2 做得最好的一点:我们把飞轮转得更快了。至少每两周,我们都会衡量一次自己的学习速度,即便暂时还不能衡量外部影响。
Alex Heath:Labs 里的大多数人,都是前创始人吗?
Mike Krieger:很多人确实是前创始人。
Alex Heath:这是你们筛选人的标准吗?
Mike Krieger:我们在 Labs 里大概有两类角色。我们把所有项目都叫做 bets,因为它们本质上都是高风险、高波动的下注。然后是 bet leads,也就是项目负责人。
如果你是那个精神意义上的直接负责人,也就是 DRI(Directly Responsible Individual),这类人几乎都是创始人背景。
但 Labs 里也有其他成员。他们可能不是创始人,而是非常能动手的 builder。比如有人曾经是一家创业公司的早期员工,经历过从 0 到 1 的过程;或者就是非常喜欢构建东西的人。
我们有一位加入 Labs 的同事,她之前在上一家创业公司很早期就加入了,后来又很早加入 Labs。她具备那种「我可以覆盖整个技术栈,哪里需要我就去哪里」的能力。
我认为这种能力和创始人背景一样重要。你不能只有纯创始人,你还需要那种互补的「创始团队气质」。
未来的公司形式:小团队+AI
Alex Heath:我的联合主持人 Ellis 今天来不了,但他给我发了一些问题让我问你。其中一个问题是:你们在 Labs 里组建的这个「创始人超级团队」,是不是一种新的公司组织模式?尤其是在 AI 时代。还是说,这只是 Anthropic 这样公司的特殊情况?
Mike Krieger:这是一个很好的问题。
我认为未来会出现更多这样的团队:一个小团队,配合模型一起工作。模型并不完美,所以你仍然需要有判断力、有品味、有方向感的创始人型人才。
比如昨天我就花了大概两个小时,和团队讨论我正在做的一个 Labs 项目。在那个项目里,我们讨论的是产品中的 multiplayer,也就是多人协作形态,应该长什么样。
那两个小时非常有价值,也非常「人类」。我们就是在一个房间里不断碰撞、推敲。然后接下来大概 12 个小时,我让 Claude 异步地去处理这些想法。
但关键是,你需要有人有判断力:哪些问题必须一开始就充分讨论?哪些事情应该直接去实现?因为如果你不明确指定,模型会替你做出很多决定。
所以,我认为创始人型人才仍然扮演着非常重要的角色。但一旦你把结构搭对了,就可以做很多事情。
我最近做了一个小复盘,回顾 Labs 过去几个月做了什么。其实也才四个月,但有些项目是一月构思出来,二月就进入测试,三月就结束;也有一些项目是二月构思的,现在已经变成 Claude Design。
所以已经发生了很多事情,速度非常非常快。
我认为,未来会有更多公司转向这种模式:更小的团队,给他们自主权,让一个真正有责任感的人来推动项目,而且一开始不要配太多人。
这是我们在 Labs v2 里学到的很重要一点:不要一上来就给一个项目配五个人。应该先从两三个人开始,更像一家创业公司。
Alex Heath:接下来就是我最喜欢的部分了:我会尽量从你这里套出更多关于这些项目的信息。
今年 3 月我们见面的时候,你跟我说,你在研究让 Claude 长时间运行,也就是所谓 long-horizon problem,让它处理更长周期的任务。当时你在负责这个项目。你现在还在负责它吗?
Mike Krieger:没有了。这个项目很典型:我们其实已经把它先放到一边了,但它的学习成果后来进入了今天发布的 Managed Agent 里的 Outcomes。
这个项目的核心想法是,让 Claude 基于 rubric,也就是评估标准,去执行一个面向最终结果或目标的任务,而不是只响应一个单独的 prompt。这和我们之前在 Labs 里探索的方向,在精神上是非常一致的。
我当时也在梳理这个项目后来延伸到了哪里。今天早上的发布里,有两个主题其实就是从这个 Labs 项目直接派生出来的。
一个是 Outcomes。另一个是在 Boris 的演示里,你看到 Claude Code 会通过截图来验证自己的工作,测试自己做出的东西。
这也是我们当时重点推进的方向之一。因为 Claude 看着自己写的代码说「我觉得没问题」,是一回事;它真正去完整地探索和验证,又是另一回事。
在我负责的那个项目里,我们甚至研究过让 Claude 录下自己完成工作的全过程,然后自己回看视频,判断:「哦,这个动画是坏的。」有些问题只靠截图验证是发现不了的。
所以,是的,3 月时我们聊到的那个项目,当时还在开发中。现在我们已经把它放到一边了。它内部仍然可以跑,我们有时候还会用它做一些演示。但它最主要的价值,是成为了上游灵感和能力验证的来源。
Alex Heath:另一个项目,你当时说是让 Claude 自己选择自己的形态。比如它会自我判断:下一段对话,与其用命令行界面,不如变成一个网站。
Mike Krieger:对。
Alex Heath:那就是 Claude Design 吗?还是别的东西?
Mike Krieger:它和 Claude Design 在精神上有很多一致的地方,但不是同一个东西。
我们现在正在追问的问题是:Claude Design 本质上是一种「agent + canvas」的形态。你可以想象,有很多这样的组合。
即便是在 Claude Design 里,我也用它做过很多事情。比如写技术规格文档。现在我最喜欢的写技术文档方式,其实就是用 Claude Design。因为你可以让它把信息流可视化:信息是怎么流动的?还能怎么流动?然后你可以直接看着它演化。
这可能是我第二喜欢的使用场景。第一是做 slides,我现在经常用 Claude Design 做幻灯片。但你完全可以想象,canvas 里还可以承载其他格式。所以这是 Labs 正在探索的一个方向:像 Claude Design 这样,但面向更多类型、更多应用场景。
我觉得这非常令人兴奋。
Alex Heath:所以它本质上是更泛化的生产力软件吗?这是核心想法吗?
Mike Krieger:我觉得这是一个可以继续拉出来深入探索的主题:一种生产力软件,而且最好是可以高度个性化、适配你的生产力软件。我认为这是一个很有意思的趋势。
Alex Heath:你现在还在思考 AI 里的哪些空白领域?
Mike Krieger:随着模型不断进步,我觉得它们在生命科学这类领域成为有用伙伴的能力,会非常有意思。
我最近看到越来越多这样的例子。比如 X 上有一个很棒的 thread,有人自己在家做了全基因组测序。后来他甚至把这件事专业化了,现在可以上门帮你做。
我对这个很感兴趣,因为我是那种很喜欢「自我认知」的人,想弄清楚这些东西到底怎么做。
一些真正了解这个领域的人告诉我,几个月前的模型和现在像 Opus 4.7 这样的模型之间,已经有很大差距。现在的模型在解析遗传数据、从中发现推论,或者读取你的化验结果方面,真的开始有用了。
以前可能只是「哦,很可爱,它说出了一个医生看了之后也会说的话」,或者只是重复一些我们根据经验规则已经知道的东西。但现在它真的开始有价值。
所以,个性化医疗是我很感兴趣的一个空白领域。我觉得我们已经站在一个临界点上。这里还有很多所谓 overhang,也就是现在技术上已经可能做到、但产品和应用还没有充分释放出来的空间。
Alex Heath:现在确实有很多类似创业公司冒出来,比如 Superhuman、Superpower、Ro,还有 Function Health,都在做这类事情。
Mike Krieger:对,完全是这样。今年 1 月我们做 Claude for Healthcare 的早期探索时,其中一个合作方就是 Function。你可以把自己的化验结果导入 Claude,然后做进一步分析。
我这周还开始用一个叫 Subco 的补剂服务。你把自己吃的所有补剂都输入进去,它会知道这些补剂之间怎么相互作用,然后给你建议,比如:你其实不用吃这八种,可以减到四种。
下一步它们还没有做,但我可以想象有人会做:结合你最近一次化验结果,或者结合你的遗传数据,它可以判断你是不是对某种补剂有超强反应。
所以,这整个领域非常有意思。这还只是偏「优化」的一侧。如果再去想那些今天医疗服务覆盖不足的领域,比如很多人没有本地优质医疗资源,那么 AI 也许可以在某种程度上补足这些缺口。
所以这里有很多非常有意思的空白空间。
Mike Krieger:另一个领域也很有意思。大概一年前,我参加过一个消费者 AI 会议,是 Forerunner 组织的。当时我在台上和一些创始人讨论:除了聊天、无尽的助手之外,消费者 AI 的 breakout case,也就是真正破圈的应用,会是什么?
到现在我还没有真正看到它。也许健康算一个,但它又不完全符合我刚才描述的那类消费者应用。AI 驱动的约会产品可能有点机会,但里面天然带着一点让人不舒服的感觉。
Alex Heath:所以不会看到 Claude 做一个约会服务?
Mike Krieger:我觉得我们不会做 Claude Dating Service。但也许某个基于 Claude API 的客户会做类似产品。我不认为我们会在内部做这个。
不过,我仍然觉得这里有一个有意思的空白问题:AI 是否真的能帮助我们更好地理解自己、理解世界、理解社区,并且让人与人之间更连接,而不是更疏远?
举个例子,我最近开始对公民参与很感兴趣:如何把具有代表性的人群组织起来,进行公共议题辩论。我不是这方面专家,但我开始对这个问题感兴趣。
在这种场景下,AI 的作用不是替人做决策,而是帮助找到具有代表性的群体。也就是说,把人保留在过程中,但确保我们听到的是正确的声音。
Alex Heath:我很好奇,你现在身上还有那种「社交媒体产品」的本能吗?
Mike Krieger:现在可能没那么强了。不过,如果说这个方向里还有什么比较有意思的想法,我觉得 Sora 曾经探索过一个点挺有意思:你可以描述自己想要的算法,然后系统为你生成出来。
Alex Heath:这个方向现在到处都在出现。Threads 里有,X 在某种程度上也有。我觉得这会变成一个标准能力。
Mike Krieger:Spotify 也有。我自己就在 Spotify 里用过。我会做一些很「邪门」的播放列表。比如我女儿和我没法就听什么达成一致,我们就让 Spotify 生成一个播放列表,取我们两个人喜好的交集。最后结果可能是 Pavement 加《冰雪奇缘》的音乐。非常好。
Alex Heath:我喜欢这个。很有意思。
Mike Krieger:Spotify 的 AI DJ 确实挺有想法的。但我觉得,这是一种 AI 正在帮助我们个性化自己的方式。
我最近还在想另一个点。我不确定它是不是一个适合 Labs 的项目,但也许有人应该去做:AI 能不能成为一种有用的过滤器,把外部世界里的噪音筛掉?
我最近开始用 Dispatch 和 Co-work,原因也是这个。否则我就是一个无可救药的新闻瘾患者。我会不停地查看每一个新闻网站,读很多东西。这当然有价值,但有时候我也会想:我是不是一直在重复阅读同样的故事?
所以,我现在有一个类似每天早报的东西,放在我之前的工作流里。它会整理我平时会看的那些信息源。很多时候我还是会点进去看原文,但它至少能帮我判断趋势是什么,让我不需要每天早上第一件事就打开十二个网站。
Alex Heath:只要你还在读 The Verge 的 Sources newsletter,Mike,你就可以继续做综合整理。
Mike Krieger:当然,那个一定会直接进我的收件箱。
Alex Heath:我之前好像在 X 上看到过一个泄露信息,不知道真假,说你们在考虑做一些更主动的东西。也许叫 Orbit 之类的?可能会更主动地把你