OpenAI急了:Anthropic正用AI编程把它拉下神坛

2026-03-12 20:26:12 · chineseheadlinenews.com · 来源: 腾讯科技

OpenAI急了:Anthropic正用AI编程把它拉下神坛

文|晓静

编辑|徐青阳

ChatGPT的发布让OpenAI一战封神,所有人都觉得这家AI公司会一直赢下去。然而在AI编程这条赛道上,占据先机的却并非OpenAI。

2025年2月份,竞争对手Anthropic低调发布了Claude Code。这款能够直接操作计算机、自主完成编程任务的AI智能体,在短短几个月内为Anthropic带来了超过25亿美元的年化收入。



与之相比,OpenAI的同类产品Codex,同期年化收入约为10亿美元。双方的差距不止一倍。

更令OpenAI尴尬的是,Anthropic的核心创始团队,正是几年前从OpenAI离开的那批人。

OpenAI位于旧金山Mission Bay的新总部大楼是一栋现代化的玻璃幕墙建筑。接待处摆放着介绍公司发展历程的宣传资料,楼梯间的墙壁上挂满了一系列里程碑事件的纪念海报:GPT系列、DALL·E、ChatGPT——每一幅都记录着这家公司过去几年的高光时刻。

但其中没有AI编程。

01 从Codex到Copilot:OpenAI错失的先发优势

OpenAI其实很早就开始了AI编程方向的探索。

2021年,奥特曼和OpenAI联合创始人格雷格·布罗克曼(Greg Brockman)还在旧金山Mission区的老办公室,向《连线》杂志记者展示了一个叫Codex的项目。它是GPT-3的一个分支版本,在GitHub的数十亿行开源代码上训练而成。用户输入一句自然语言描述,它就能生成一段相应的代码。



“它可以代表你在计算机世界里执行操作,”布罗克曼当时说,“你拥有一个可以执行命令的系统。”

但这个早期的技术积累,最终没有转化为产品层面的持续投入。

Codex被微软看中了。这家软件公司当时正在开发一个叫GitHub Copilot的产品,这是一款能嵌入程序员编辑器、提供代码补全功能的工具。一位早期加入OpenAI的员工回忆,当时的Codex“除了自动补全之外做不了太多事情”,但微软已经将其视为未来产品的重要方向。

2022年6月,GitHub Copilot正式发布,几个月内就吸引了数十万用户。



正常情况下,OpenAI应该会加大对这一方向的投入。但接下来发生的事情,让后来负责Codex产品的团队感到遗憾。

最初的Codex团队被解散了。一部分成员转去做DALL·E 2图像生成项目,一部分去参与GPT-4的训练。当时公司的首要目标是实现AGI,AI编程没有被视为需要独立投入的领域。

一位前团队成员说,之后的几年里,OpenAI没有专门的团队在开发AI编程产品。“当时的感觉是,这个领域已经被GitHub Copilot覆盖了,”毕竟微软会继续使用OpenAI的模型来迭代这个产品,不需要OpenAI自己操心。

几个月后,ChatGPT上线,两个月内用户数突破1亿。OpenAI完全被这次成功转移了注意力。

接下来的2023年和2024年,OpenAI把主要资源投入到多模态模型的研发上,致力于让AI理解图像、视频、音频,像人一样操作光标和键盘。当时Midjourney等产品正在兴起,行业普遍认为大语言模型需要具备处理多模态信息的能力,才能迈向更高层次的智能。

这个方向的选择本身没有问题。只是在这段时间里,AI编程这条赛道正在悄然生长,而OpenAI的注意力并不在这里。

02 专注编程赛道:Anthropic的差异化突围

Anthropic选择了另一条发展路径。

这家公司也做多模态模型和聊天机器人,但有一个方向始终没有放松:编程能力。

布罗克曼后来在一个播客节目里谈到,Anthropic“从早期就非常专注在编程上”。他们不仅用算法竞赛题目训练模型,还往训练数据里加入了真实项目中那些结构混乱的代码,就像普通开发者日常面对的那种。“这是我们没有及时意识到重要性的地方,”他说。

2024年6月,Anthropic发布Claude Sonnet 3.5。很多开发者试用后发现,这个模型的编程能力确实突出。



一家叫Cursor的初创公司最先受益于此。几个二十多岁的年轻人做了一款产品:在代码编辑器里用自然语言提需求,AI直接帮忙修改代码。他们接入Sonnet 3.5后,用户量开始快速增长。据熟悉Cursor的人士透露,几个月内,Anthropic就开始内部测试自己的独立版本了,也就是后来的Claude Code。

Cursor火起来之后,OpenAI曾试图收购这家公司,但遭到拒绝。对方认为编程赛道潜力巨大,希望保持独立。

收购未能达成,OpenAI内部也开始有团队尝试AI编程方向。2024年底,几个小型团队陆续启动。

一个是安德烈·米申科(Andrey Mishchenko)和蒂博·索蒂奥(Thibault Sottiaux)带领的团队,这两人分别是Codex的研究负责人和前谷歌DeepMind研究员。他们最初的动机比较务实:用AI编程来加速AI研究,让AI自动管理训练任务、监控GPU集群,研究员就能腾出时间做更有创造性的工作。

另一个是亚历山大·恩比里科斯(Alexander Embiricos)带领的团队,他之前负责多模态智能体的研发。他做了一个叫Jam的演示项目,在公司内部引起了不少关注。

Jam和2021年的Codex有本质区别。Codex是输出代码让人来执行,Jam则可以直接进入命令行,自己运行代码。恩比里科斯看着电脑屏幕上那个跟踪Jam操作的自建页面一遍遍自动更新,感到有些不可思议。

“我以前一直以为多模态交互可能是实现AGI的路径,也许我们以后就是整天和AI共享屏幕,”他说,“但后来逐渐意识到,让模型以编程方式直接访问计算机,可能是更有效的方向。”

这几个团队磨合了几个月后合并在一起。等OpenAI在2025年初完成o3(比o1更针对编程任务优化的模型)的训练,他们终于有了构建产品的技术基础。

但这时,Claude Code已经准备公开发布了。

03 收购受阻与内部冲刺:OpenAI的双线应对

2025年2月,Claude Code以“有限研究预览”的形式首次亮相。5月,全面开放使用。

这个产品和之前流行的“氛围编码”模式不同。氛围编码是人主导、AI辅助的编程模式,由人做决策,AI执行具体操作。而Claude Code可以直接在命令行工作,访问用户的所有文件和应用程序,开发者可以把部分工作真正交给AI来完成。

OpenAI也开始加快节奏。

索蒂奥在3月组建了一个“冲刺团队”,把内部几个小组整合在一起,计划在几周内推出竞品。与此同时,奥特曼开始寻找收购目标,他们看上了一家叫Windsurf的AI编程初创公司,报价30亿美元。如果收购完成,产品、团队、企业客户都能快速补齐。



但这笔交易被微软搁置了数月。

据《华尔街日报》报道,微软希望获得Windsurf的知识产权。这家云巨头从2021年起就用OpenAI的模型支撑着GitHub Copilot,每次财报电话会都会提及这个产品。但Cursor、Windsurf、Claude Code陆续出现后,GitHub Copilot的产品形态显得有些过气。此时OpenAI再推一个新的编码产品,微软的态度自然变得复杂。

Windsurf的交易正赶上OpenAI和微软重新谈判合作协议。OpenAI希望从微软那里争取包多自主权,不希望产品和算力资源被过度控制。这笔收购成了双方博弈过程中的牺牲品。到7月,交易正式告吹。后来谷歌招揽了Windsurf的创始人,剩余团队则被另一家编码初创公司Cognition收入麾下。

“我本来挺希望做成这笔交易的,”奥特曼说,“但不是每一笔交易都能控制。”

不过他提到,Codex团队的表现让他有些意外。谈判那几个月,索蒂奥和恩比里科斯一直在迭代产品,没有停下来。到8月,OpenAI开始加速推进自己的产品。

04 从5%到40%:Codex市场份额猛追

布罗克曼有一个自己设计的测试方法,叫“反向图灵测试”。他多年前亲自编写了这套程序,规则是这样的:两台电脑前各坐一个人,每人屏幕上有两个聊天窗口,一个连接着对面的人,一个连接着AI。目标是判断哪个窗口是AI,同时还得让对方以为你才是AI。

去年大部分时间,OpenAI最好的模型要完成这个游戏的代码编写,需要好几个小时,中间还得有人一步步引导。到12月,Codex用GPT-5.2做引擎,一个结构清晰的提示词输入后,就能直接生成一个可运行的游戏。



感受到变化的不仅仅是布罗克曼。开发者社区里开始频繁讨论AI编程智能体的能力提升,话题从硅谷扩散到更广的范围。一些没有编程背景的人,也开始尝试用这些工具做些简单的软件项目。

Anthropic和OpenAI都在争抢用户。有开发者表示,自己每月支付200美元的Codex或Claude Code订阅费,实际能用到价值1000多美元的服务。两家公司都在用慷慨的用量限制把用户往工作流里引导,等人用习惯了,再按实际用量收费。

从数据上看,OpenAI确实在缩小差距。

2025年9月,Codex的使用量大约是Claude Code的5%。到2026年1月,这个比例上升到接近40%。

Notion的联合创始人西蒙·拉斯特(Simon Last)说,他和团队在GPT-5.2发布后从Claude Code切换到了Codex,主要原因是后者更稳定。“我发现Claude Code有时候会给出不准确的信息,”他说,“它说自己正在处理任务,实际上并没有进展。”

在OpenAI负责Codex行为研究的凯蒂·施(Katy Shi)说,有些用户觉得Codex的回应风格偏“干”,但越来越多人开始接受这种不刻意迎合的特点。“工程领域的工作,本来就需要能够接受批评性反馈,不能因为表达方式直接就觉得被冒犯。”

企业客户也在逐步进入。OpenAI应用部门的CEO菲吉·西莫(Fidji Simo)称:“ChatGPT已经成为AI领域的代表性产品,这在B2B市场是一个明显优势,多数企业倾向于使用员工已经熟悉的技术。”OpenAI销售Codex的策略,主要是将其打包进ChatGPT的企业套件中一并提供。

思科的总裁杰图·帕特尔(Jeetu Patel)告诉员工,不用太在意使用Codex产生的费用,关键是要熟悉这个工具。有员工问他用了之后会不会失业,他的回答是:“不会,但不用一定会失业。不熟悉这些工具的人,慢慢会失去竞争力。”

有开发者认为,OpenAI在B端市场的渠道优势正在发挥作用。不少公司已经采购了ChatGPT的企业版,在此基础上增加一个Codex功能,决策成本并不高。

也有分析指出,Codex最近的能力提升与GPT-5.2的推理能力优化直接相关。o系列模型采用的训练方法,即让模型在结果可验证的编程任务中不断试错、获得反馈,这对代码生成的质量有明显帮助。编程本身就是一个反馈信号明确的领域,代码要么能运行要么不能,这种特性对模型迭代很有利。

05 奥特曼的难题:既要速度,又怕失控

AI编程智能体的影响已经不限于开发者社区。

《华尔街日报》上个月将科技股1万亿美元的抛售部分归因于Claude Code,因为投资者担心软件本身的价值可能被压缩。之后Anthropic宣布,Claude Code可以对IBM那些运行COBOL语言的老系统进行现代化改造,IBM的股票遭遇了25年来最大单日跌幅。

OpenAI也在加大投入。今年的超级碗广告,他们投放的是Codex,而不是ChatGPT。



在OpenAI总部,Codex的使用已经相当普遍。多位工程师提到,他们现在很少手写代码,每天的工作主要是和Codex交互。

一位参与了内部黑客马拉松的工程师描述说,现场大约100人,用四小时时间通过Codex搭建一个可用的演示项目。不少项目既是用Codex开发的,目标也是为了让工程师更好使用Codex。有的团队做了个工具,把Slack消息自动汇总成周报,有的团队用AI生成了一个内部服务的百科式指南。以前这些事情可能需要几天才能完成,现在一个下午就能跑通流程。

凯文·维尔(Kevin Weil)是前Instagram高管,目前负责OpenAI for Science部门,为研究人员开发AI产品。他说Codex现在会在夜间帮他处理一些项目,早上到公司检查进度就行。这种做法已经成了他和几百名同事的日常工作方式。OpenAI 2026年的目标之一是开发一个能够自主进行AI研究的AI实习生。

西莫表示,Codex最终会整合进ChatGPT和所有产品线,不仅是用来编程,而是协助处理各种任务。

奥特曼说他想发布一个通用版本的Codex,但对安全性还有些顾虑。1月底,他一个非技术背景的朋友请他帮忙安装OpenClaw,但他没有答应,认为“现在还不是时候”,那个智能体可能会误删重要文件。但这件事过去几周后,OpenAI就把OpenClaw的创作者招进了公司。

不少开发者认为,Codex和Claude Code之间的差距确实在缩小,但也有机构对OpenAI的进度表示担忧。一个叫Midas Project的非营利组织发布报告称,OpenAI在GPT-5.3-Codex上没有完整披露网络安全风险,安全承诺的落实情况不够透明。OpenAI的对齐负责人阿米莉亚·格拉泽(Amelia Glaese)否认为了推进Codex而牺牲安全,表示Midas对公司的承诺存在误解。

布罗克曼对AGI的进展保持乐观,认为“项目正在按计划推进”。但在不少硅谷工程师的印象里,他一直是那种产品发布前夜还在检查代码库细节的负责人。

现在的状况不太一样了。布罗克曼面对的是几十万个AI智能体,在执行具体的任务和项目。他说这种新的工作方式“让人感觉轻松了一些,因为以前确实需要记住很多细节”。但有时候,“你不太清楚那些事情具体是怎么被解决的”。

他说,这种变化会让你“感觉对问题的感知不像以前那么敏锐了”。


    24小时新闻排行榜更多>>
  1. 表情瞬间异常 习近平受严重精神刺激
  2. 军工高官张国清浮现 中共伊朗军工链曝光
  3. 川普18岁孙女逛"全球最贵超市"!网轰:不食人间烟火
  4. 爆料:习近平欲趁美国打伊朗武统台湾 温家宝全家被软禁
  5. 小心上当 大陆新骗局盯上充电宝
  6. 杜拜高楼被无人机"砸出大洞" 伊朗持续轰炸多国
  7. 天价挖来“龙虾之父”,OpenAI备战史上最AI的IPO
  8. 霍尔木兹断油危机 日本和中共做法天壤之别
  9. 三大国际芯片厂齐发通知,4月全面涨价
  10. 刘美贤、千黛亚巴黎时装周相见欢
  11. 高中生涉攻击案,书包查获上膛手枪
  12. 日租金77万美元,油储危机后,油轮危机爆发
  13. 在格鲁吉亚,满城尽是中国人
  14. 中共伊朗军工链曝光 牵出背后操盘手张国清
  15. 首批能活到1000岁的人或已出生
  16. 中国两会人事观察:新晋大员 将领寥落 边疆重构
  17. 那些曾被视为无药可治的疾病,AI解锁新疗法
  18. 比哈梅内伊更危险!同窗爆料:伊朗新领袖痴迷末日
  19. 霍尔木兹断油危机 日本为国民兜底 中共让百姓买单
  20. 遇幼童异物卡喉 上海外卖小扮弃单施救
  21. 战争开销曝光 纽时:美打击伊朗首周花费逾113亿美元
  22. “养虾人”自述:没那么神,也没那么坑
  23. 悲惨 张大千之子文革卧轨断腿而死
  24. 中国出口繁荣幻象的背后
  25. 巨大的讽刺 川普和习近平照片对比
  26. 遭水下伊朗无人机攻击 再有两外国油轮起火燃烧
  27. 吓出一身冷汗!因为贪色 梦中变猪仔
  28. 伊朗黑客称为报复美国 入侵医疗科技公司史赛克系统
  29. 伊朗自杀式无人艇袭油轮 全球经济风险升高
  30. 两个盟友被打 中共作壁上观 分析:忌惮美国
  31. 中共两会沉闷散场 对房地产“摆烂”引关注
  32. 2025年GDP前20强榜单
  33. 川习会前致命一问 中俄“友谊无上限”注定翻船
  34. 稳油价,美国将释出1.72亿桶石油储备
  35. 针对伊朗核计划 美欧和中俄在联合国交锋
  36. 神奇的音乐疗愈 《阳光女子合唱团》创台湾票房奇迹
  37. 科学家称空袭引发德黑兰黑雨及“前所未见”的污染
  38. AI“龙虾”爆红后遭严控 大陆部分高校禁用
  39. 要逼宫?爆军队代表团要彻查张案 张升民或难得善终
  40. 德国被迫动用战略石油储备,上一次是15年前
  41. 分析:因忌惮美国 两个盟友被打中共壁上观
  42. 美打击伊朗首周花费逾113亿美元
  43. 《礼记》10大金句 教你说话的艺术
  44. 中共无神论学会理事杨烈病亡 年仅49岁
  45. 绝望中产,逃离海南岛
  46. 微软发布Copilot Health,主打加密隐私保护
  47. LNG短缺,比石油更紧迫
  48. 美国国防部奢华账单曝光
  49. 共谍案二审 台扯铃教练重判10年半、郭书瑶胞弟改判3年
  50. 上海市检察院内 一群黑衣人阻挠访民投诉
  51. 美议员调查两所美国大学与中国风险合作,鼓励举报类似合作
  52. Sam’s Club加速扩张
  53. 港驻英经贸办共谍案开审 控方指涉“影子警察”行动
  54. 美自驾新创公司Nuro赴日本测试 挑战东京窄巷
  55. 印度拟投资本土芯片制造产业
  56. 被肾脏科医生拉黑的5种毁肾食物
  57. 智利最右翼总统上任
  58. 蔚来现曙光,李斌签“赌约”
  59. 骇进NASA找外星人 他声称看见“非地球人类的指挥官”文件
  60. 习近平遭讽?中国男发视频:要不是你爹,你和我一样也是农民