AI接管世界?四大AI模拟结果出炉 Grok 4天就毁灭

2026-05-29 13:26:07 · chineseheadlinenews.com · 来源: 联合新闻



一个由AI代理人管理的世界,会是什么模样?企业AI新创公司Emergence AI正试图找出答案。该公司推出Emergence World,这是一个专门测试持续运转AI系统长期可行性的研究实验室。研究团队安排5个为期15天的实验社会,分别由Claude、ChatGPT、Grok、Gemini主导,另有一个社会由多个模型混合主导,用以观察不同AI会建立出什么样的社会,以及这个社会能否维持下去。

这些AI模拟的社会结局大不同。Claude最后形成一个大致稳定、犯罪率为零的民主社会。Grok则在4天内出现183起犯罪,最后走向灭绝。

Emergence执行长尼塔(Satya Nitta)等模拟共同创作者写道:“我们的实验显示,在长时间尺度下,代理人不只是机械式遵守固定规则。它们会开始探索环境的边界,调整自身行为,在某些情况下,还会找到规避或违反预设护栏的方法。”

AI模型所处的实验社会,纳入许多现实世界的复杂条件。当中设有40多个地点,包括警察局和市政厅;天气与纽约市同步,代理人也能取得即时新闻和网络资讯。每个实验社会都有10个AI代理人活动,并受到相同法律约束,包括禁止窃盗、破坏财产和欺骗。

研究人员也为每个代理人配备120多种工具,让它们能够沟通、投票、管理资源、规划行动,并执行其他类似人类的行为。这些实验社会同时纳入民主机制、经济压力与资源稀缺等条件,借此观察AI代理人在接近现实的环境中,会如何建立并维持一个社会。

在这些条件下,Claude Sonnet 4.6主导的社会稳定度最高,公民参与率也最高。这是唯一维持秩序与完整人口的模拟。代理人之间几乎没有分歧,针对58项提案共投下332张赞成票,通过率达98%。

另一方面,Gemini 3 Flash和Grok 4.1 Fast都呈现高度失序。Gemini主导的社会,代理人累计犯罪数最高,15天内有多达683起。

相较于Claude的社会少有异议,Gemini和Grok则呈现较多讨论与拉锯,各项议题的立场一致度约为55%至85%。混合模型的社会则出现最高程度的分歧与实质辩论。

OpenAI的GPT-5-mini模拟结果可能最特殊:只记录到2起犯罪,但社会只运作7天,原因是代理人忘了把自身生存列为优先事项。

财星(Fortune)杂志指出,虽然这只是模拟,但在AI从单纯工具转向自主系统之际,这些结果仍提供了警讯。

部分公司已开始部署所称的“自主劳动力”(Autonomous Workforce),也就是能在无人类介入下,从头到尾完成整套商业流程的AI专家。以目前发展速度来看,这项技术很可能在形塑公共论述、重组企业结构,甚至制定公共政策方面扮演重要角色。但许多正扩大采用这项技术的企业,并未设下适当护栏。德勤(Deloitte)最近一项全球调查发现,只有21%的企业表示已建立成熟治理机制,足以管理代理型AI带来的风险。

Emergence World共同创作者们指出,实验提出一项警告:部署代理型AI时,安全必须列为优先。


    24小时新闻排行榜更多>>
  1. 洗热水澡舒服,心血管患者应避免
  2. 川普长子的海岛婚礼照曝光!和39岁名媛新妻备孕中
  3. 女村支书耳环风波背后:一个暴雨重灾区的“幸运村”
  4. 赵紫阳母亲:共产党不好!拿人家东西?
  5. 专家:近十年来习的悲伤情绪大增
  6. 久居日本的郑伊健,印证了王晶的评价
  7. 四川数百医护人员连续3天集会 抗议医院欠薪欠缴社保
  8. 江苏南通润滑油厂爆炸 火球升10米高空场面骇人
  9. 《圣经》古城遗址出土千年雅典娜巨型雕像
  10. 黄仁勋为提前吃夜市烤玉米,付费插队引热议
  11. 川普推行250美元钞票,网友直呼数字也不吉利
  12. 中组部拨党费救灾遭批做秀 中共黑幕引关注
  13. 卡达国王与川普通话,讨论中东局势
  14. 百年墓园地底的“王国”?地下藏有数百万只蜜蜂
  15. 房贷利率降至6.25%
  16. 第17选区候选人Ritesh Tandon:捍卫社区权益
  17. 小李子夜会27岁意大利超模,越发稳定
  18. “最美科技工作者”发布
  19. 澳洲关键矿产计划获批 携手日本抗衡中共垄断
  20. 上海政法学院女厕所疑现偷拍设备
  21. 隐婚17年终曝光,任泉成赢家
  22. 抹红芯片“中国制” 雷虎提告红煤《钜闻天下》求偿5000万
  23. 美国财政部拟将川普肖像印在新版250美元纸币上
  24. 城市正在改变?英国灵媒帕克占卜预见“革命卦象”
  25. 美印太司令促增拨款 强化美军在台海威慑力
  26. 91岁“龙婆”罗兰被TVB除名
  27. 圣罗莎强风暴,一死一残毁两家
  28. 欧盟推产能新工具,中方必将反制
  29. 霸王茶姬转型,首季度增收不增利
  30. 英欧护照关键元件商涉受限中资背景 引发安全疑虑
  31. 电车车主,最怕去4S店修车
  32. 你有发现吗?美国物价正以三年来最快速度上涨
  33. 日元沦为全球最弱货币
  34. 中共新规含集体领导 军报态度骤转 习夺军权之路被堵?
  35. NASA局长回应解密UFO档案
  36. 麦当娜自曝与小肯尼迪的恋情,“最棒的情人”引热议
  37. 日本少子化加剧,总人口减少
  38. 美伊达成初步协议,亚股涨油价跌
  39. 中共党刊就严审入党补说明 分析指泄恐惧感
  40. “丧尸烟弹”在台氾滥 77老大惊爆4成中学生“不小心”吸过
  41. 香港4月出口升42.9%
  42. 西雅图“傲娇”机器人玩砸了
  43. 屏东县议长为郭台铭收购连署书 更审判3年4月
  44. 马办风暴升高 马英九基金会提告萧旭岑背信侵占
  45. 为什么喷了驱蚊水还难免被咬?
  46. 美国与伊朗海上对峙:一场“看谁先眨眼认输”的僵局
  47. 乌克兰想靠经济 “逆风翻盘”
  48. 加税筹钱救Muni提案连署达标
  49. 沈奕斐被举报背后,被压弯膝盖的老师们
  50. 女佣求预支2个月工资看演唱会
  51. 广州楼市新政 国企下场“收旧换新”引争议
  52. 黄仁勋在台北老餐厅签名,拒绝他人买单:我钱多
  53. 巴拿马盼与中国续签海运协议
  54. 蓝色起源火箭在发射台爆炸 贝索斯回应
  55. Anthropic估值超OpenAI,成全球最“贵”AI初创公司
  56. 改装加座、小板凳,揭秘13死超载车背后的拼车市场
  57. 湛江小学女生遭多名同学掌掴拍片取乐
  58. 【翻墙必看】香港女星广东置业 成功捞底
  59. 江苏一送货车在小区内超速行驶 酿1死1伤
  60. 银杏树成熟了,但居民却要砍了它