OpenAI致力打造自主“AI研究员”

2026-03-29 17:25:14 · chineseheadlinenews.com · 来源: 科技日报

在人工智能(AI)竞逐日益白热化的今天,OpenAI再次抛出了一个震撼业界的宏大蓝图。近日,OpenAI首席科学家雅各布·帕乔基在接受《麻省理工科技评论》独家专访时透露,他们正瞄准一个前所未有的科研目标:在2028年前,打造一个能够自主解决复杂问题的“AI研究员”。

“AI研究员”是一套全自动的多智能体研究系统,能够独立完成从数学、物理到生物、化学,乃至政策分析的各类科研任务。它能够像人一样,以连贯的方式持续工作,完成一系列科研任务,并产生可供分析的新结果。图片由AI生成

这是一套全自动的多智能体研究系统,能够独立完成从数学、物理到生物、化学,乃至政策分析的各类科研任务。OpenAI表示,实现“AI研究员”计划是该公司未来几年的方向。今年9月,第一阶段目标将率先落地,届时,OpenAI将先行推出“自主AI研究实习生”。

这一计划标志着OpenAI在推动AI技术应用方面的新尝试,同时也是其在面对Anthropic、“深度思维”等竞争对手时的重要战略部署。

“我们正接近这样一个阶段:我们的模型能够像人一样,以连贯的方式无限期地工作。”帕乔基表示,“当然,仍然需要有人负责并设定目标。但我认为,我们将最终达到这样的境界:在数据中心里拥有一个完整的研究实验室。”

从Codex开始“进化”

OpenAI并非在空中楼阁上构筑梦想。今年1月,OpenAI发布了Codex,这是一款能即时生成代码、执行复杂计算任务的智能体应用。它能分析文档、生成图表、整理邮件和社交媒体摘要等。时至今日,Codex已经成为其内部员工的标配,辅助开发代码并解决问题。帕乔基表示,可以把Codex看作是“AI研究员”的雏形。未来,Codex将实现颠覆性革新。

作为OpenAI首席科学家和公司长期研究目标的制定者,帕乔基已经观察到,在技术演进上,模型的“长程工作能力”正随着参数规模和逻辑深度的增加而呈线性提升。

从GPT-3到GPT-4,模型在无干预情况下处理复杂问题的时长实现了质的飞跃。而2024年推出的“推理模型”技术,通过引入“思维链”训练,让AI学会了像人类一样步步为营、遇错回溯。目前,OpenAI正在利用数学和编程竞赛的难题对模型进行“魔鬼训练”,旨在提升其处理超长文本和拆解多重子任务的能力,最终能够解决现实世界的科研难题。

帕乔基认为,自动化科研的关键在于系统能够长期运行,减少人工干预。帕乔基解释说:“我们的目标是开发一个研究实习生系统,可以把本来需要几天的人力任务交给它完成。”通过训练模型逐步解决问题、回溯错误,推理模型能够在较长时间内保持连贯工作。

艾伦人工智能研究所的研究科学家道格·唐尼表示,自动化科研是令人兴奋的探索。“想象一下,明天早上我们回到实验室,智能体已经完成了一系列科研工作,并产生可供分析的新结果,这将极大加速科研进程。”

AI科研能力进入验证阶段

OpenAI目前更专注于与现实世界相关的研究。据介绍,研究人员已经利用驱动Codex的GPT-5模型,发现了多个未解数学问题的解决方案,并在生物、化学和物理学的若干难题中取得了进展。

这种生产力的飞跃,甚至改变了那些最“硬核”程序员的职业习惯。帕乔基坦言,由于对代码精准度有着近乎苛刻的追求,他一年前甚至拒绝使用最基础的自动补全功能,更倾向于在Vim编辑器(一款深受资深程序员喜爱的文本编辑器)中手动输入每一个字符。但随着模型能力的迭代,他的看法发生了根本性改变。他发现,尽管复杂的架构设计仍需由人主导,但在实验验证阶段,AI可以在一个周末内完成他以前需要一周才能编写完的代码。

针对OpenAI乐观的预期,学术界仍有不同声音。艾伦人工智能研究所的研究员指出,在去年的测试中,当任务需要多个复杂的逻辑步骤耦合时,现有模型极易因为每一个微小错误的累积,导致最终结果崩溃。对此,OpenAI正在不断迭代模型,例如近期发布的GPT-5.4版本,旨在进一步增强逻辑稳定性和任务处理的连贯性。OpenAI希望通过这种不断地迭代,证明“AI研究员”在真正深度介入现实世界的科研之前,是具备科学意义上的可靠性的。

需共同应对“集中化力量”的挑战

然而,当科研的“方向盘”逐渐移交给算法,安全与伦理的围栏必须同步加固。帕乔基指出,一个能运行整个研究计划的强大AI,可能会伴随一些尚未解决的重大问题,例如系统失控、遭受黑客攻击,或者可能仅仅是误解了自身的指令。为了应对这些挑战,OpenAI正在推广“思维链监控”技术,即训练模型在“草稿本”中记录工作笔记,以便研究人员实时审计其行为是否符合预期。

帕乔基认为,在能够完全信任这些系统之前,必须设置严格的限制,例如将极强大的模型部署在与外界隔绝的“沙箱”中。他还提醒道,“想象一下,一个数据中心能完成过去需要大型组织才能完成的科研工作,而现在可能只需几个人”。这种能力集中、影响力巨大的系统将对社会和政策带来新挑战。

面对这种力量的崛起,帕乔基预测,即使到2028年,AI系统仍不会在所有方面都像人类一样聪明,但这并不妨碍它产生巨大的变革作用。这需要社会、政策制定者和科研机构共同参与监管,而非仅靠OpenAI一家公司。


    24小时新闻排行榜更多>>
  1. 北京有人开铲车冲撞人群 官方封杀消息
  2. 温家宝现身中科院 马兴瑞大秘落马 两天内三件事砍向习
  3. xAI联合创始人跑光了:只剩马斯克
  4. 政治局会议暴隐忧 习或亲手将地方官员逼成反对力量
  5. 超悍!也门“胡塞武装”无惧以色列 西方炸10年没倒
  6. 金主爱"想接班还太早"!金正恩神秘长子传闻再起
  7. 伊朗袭美军基地 E-3预警机损毁 专家:影响大
  8. 美驱魔神父4年暴增650%,甚至惊动教宗
  9. 伊朗“地下导弹城”曝光 美以空袭打不穿 钻地弹失效?
  10. 曾轰动全球,2年就倒下了
  11. 美军F-18低空遭导弹贴身爆炸
  12. 华邮:美军战斧导弹库存告急 智库:补充或需数年
  13. 共和党掀创纪录“退休潮”
  14. 80年自由通行终结,加边境路突封闭
  15. 战火升温!美2500名陆战队就位恐打地面战
  16. 中国机场遭拘 爆她是六本木“红牌女公关”最重恐判死
  17. 深圳一天2起砍人传闻:学生死伤疯传却全网“消失”
  18. 伊朗炸美军基地,E-3预警机恐报废
  19. “周末情侣”,为啥愈发普遍?
  20. 美预警机遭“腰斩”全毁:全球只剩15架 无法再生产
  21. 洛杉矶上千人包围政府大楼
  22. 霍启刚身家百亿,却为12岁儿子操碎心
  23. 美伊开战意外赢家!这国“24天吞1整年转运量” 
  24. 万斯暗示 战争即将落幕 油价上涨仅为“暂时现象”
  25. 全球最怕恶梦成真!也门叛军恐“改变战局”
  26. 南通第一所985大学启动建设
  27. 广州列车停电被困隧道3小时
  28. 我发现,中老年比年轻人更容易出轨
  29. 空军基地出现UFO 造成10枚导弹系统失灵
  30. 全球化反转?危机揭示:依赖即武器 硬产业如此重要
  31. 中东两家大型铝厂遭袭
  32. 张雪峰这5个问题,该解开了
  33. 泽连斯基:100%确信俄正向伊朗提供中东美军情报
  34. 金融时报:伊朗战争将巩固中国的超级大国地位
  35. 伊朗最高层性向传闻引爆舆论 川普:很多人在说这事
  36. 内蒙再现“落日彩虹” 绝美异象透天机与朝代更迭
  37. 宽度仅63公分 秘鲁房屋挑战世界最窄房子
  38. 刺杀前女友,恐怖情人被起底
  39. 美媒:陷入绝境 身受重创的伊朗 会研发核弹吗?
  40. 不自然的超自然 那些生活中异常的声音与光
  41. 我与母亲逃离了朝鲜,如今害怕她会被中国遣返
  42. 来袭导弹全击落 林肯号航母完美防御的秘密
  43. 伊朗也意外 “卡住世界咽喉”策略竟如此奏效
  44. 川普认了“最想夺伊朗石油”,点名占领哈尔克岛
  45. OpenClaw疯了!调戏我老婆 还反锁全屋智能家居
  46. 这组漫画让20万人沉默
  47. 河北秦皇岛惊现罕见“带状”海市蜃楼
  48. 重磅,任仲平来了
  49. 川普:想要石油,不排除占岛
  50. TSA发薪恢复仍缺人,ICE或继续驻守全美机场
  51. 美以袭击伊朗码头致5死
  52. 中美俄三国卫星数量对比
  53. 耶路撒冷棕枝主日弥撒受阻
  54. 教授课堂误播AV!学生起哄 飞奔关视频后续更尴尬
  55. 中国军演传意外!坦克误射烟雾弹 命中看台官员
  56. 马斯克母亲访问清华并演讲:不设限的人生
  57. 美军E-3预警机在袭击中受损
  58. 以军承认击杀记者 认定其为真主党武装特工
  59. 中东两大铝厂遇袭,恐影响全球供应链
  60. 中共紧盯涉台信息 疑窃取北约等机密情报