Mythos 5为何让美政府担心到需要介入?
2026-06-29 14:25:40 · chineseheadlinenews.com · 来源: 上报
创新与治理的两难
2026 年 6 月 13 日,Anthropic 表示,美国政府基于国家安全与出口管制要求,限制部分外国使用者存取Mythos 5等高阶模型。

当AI模型开始提供某些原本需要专业人士才能掌握的能力时,受到挑战的便不只是产业本身,而是各种建立信任的制度。(法新社)
这个Mythos 5 AI 模型究竟具备了什么能力,让美国政府认为需要介入?
6 月 2 日,Anthropic 公开 Mythos Preview 的最新安全评估。根据 Anthropic公开资料,Mythos Preview已协助发现数千个高严重性漏洞,涵盖主要作业系统、浏览器与开源软件专案。其评估报告甚至提到,模型曾写出可串接多个漏洞的浏览器exploit,并能取得 Linux系统的本地提权exploit。在资安领域,这代表模型同时具备“发现弱点”与“利用弱点”的能力。
英国 AI Security Institute 随即于 6 月 6 日公布 Mythos Preview的独立评估。报告指出,Mythos Preview在多步骤资安任务中的表现明显提升,已能利用安全防护薄弱的系统,并提醒未来可能出现更多具备类似能力的模型。
这里让人不安的事实是:同一个模型,一方面被 Anthropic用于保护关键软件与基础设施,另一方面又被政府视为需要限制存取的国安风险。创造与治理的两难,并不是抽象推论,而是已经出现在 Mythos5 的存取争议之中。
这个争议在探讨的是,当模型开始提供某些原本需要专业人士才能掌握的能力时,受到挑战的便不只是产业本身,而是各种建立信任的制度。
因为不同制度真正想验证的对象并不相同。有些制度希望确认受评者是否具备特定能力;有些制度重视观点是否具有价值;有些制度关心成果是否有效;有些制度重视系统是否可靠;有些制度则关心决策权限与责任归属是否清楚。
因此,同样是 AI 参与工作,不同制度所面对的挑战也完全不同。
能力验证
不论是博士学位、医生执照、飞行员执照、技师考试或会计师考试,这类制度本质上都在回答同一个问题:受评者是否具备完成特定工作的能力。因此,制度通常会透过论文、实作测验、临床训练或专业考试等方式间接验证能力。
在这类制度中,成果之所以重要,并不是因为成果本身,而是因为成果被视为受评者具备相关能力的证明。
论文之于博士学位,正如飞行测验之于飞行员执照。制度真正要确认的,是完成作品所需的核心能力,是否由受评者掌握。
因此,当 AI 开始参与研究、设计、分析与问题解决之后,制度面临的核心问题便是:哪些能力可以交由 AI协助?哪些能力必须由人亲自掌握?
如果一名医学生利用 AI完成文献整理与病例分析,制度真正想确认的,究竟是他是否能取得答案,还是他是否具备独立诊断与判断风险的能力?
如果一名工程师大量依赖 AI 完成设计工作,制度真正想验证的,又是设计成果本身,还是工程师是否理解设计背后的原理与限制?
因此,在能力验证型制度中,AI 本身未必构成风险。真正的制度风险在于,当 AI完全取代制度原本想验证的核心能力时,制度便可能无法再透过成果确认能力是否由受评者掌握。

Anthropic 表示,美国政府基于国家安全与出口管制要求,限制部分外国使用者存取Mythos 5 等高阶模型。(法新社)
观点验证
有些制度或社会活动所重视的,并不是专业能力,而是新的观察是否被提出、重要经验是否被看见,以及有价值的主张是否能够进入公共讨论。
一位长期投入长照服务的人,希望分享第一线照护经验,但文笔不佳;一位身障者,希望让更多人理解生活中的限制与困境;或一位投入公益工作的倡议者,希望把多年观察整理成文章。在这些情况下,AI可以协助整理架构、修饰文字与改善表达。
人们通常不会优先追问文字是否逐字由本人完成,而更关心文章是否提出值得讨论的观察、经验与观点。因为在这类情境中,真正重要的往往不是表达本身,而是表达背后的内容。
AI 可以协助写作,但无法取代长期照护现场的观察;AI 可以协助组织文字,但无法取代身障者的生活经验;AI可以协助形成论述,但无法取代多年累积的实务参与。
因此,在观点验证型制度中,被验证的核心并不是写作能力,而是观点是否建立在真实观察之上、是否具有讨论价值,以及是否经得起公共检验。
近年许多大学与研究机构对生成式 AI 的讨论,也开始从“能不能使用AI”逐渐转向“如何确认学生是否具备提出问题、判断证据、辨识假设与形成观点的能力”。
因为当 AI 能够协助完成摘要、整理文献与形成论证架构时,真正需要被评量的,可能已不再是文字产出能力,而是形成观点的能力。
成果验证
在商业研发与工程领域,制度往往更关心成果是否成立。例如药物研发、新产品开发、工程设计、商业创新或火箭研制。
在这些领域中,人们最终关心的往往不是研究过程由谁完成,也不是某项能力是否完全由人掌握,而是成果是否真的有效。
一种药物能否治疗疾病;一项技术能否解决问题;一枚火箭能否成功升空;一家企业能否创造价值。
从这个角度来看,Mythos 5的争议其实具有双重意义。一方面,各界关注它是否具备发现高风险漏洞的能力;但另一方面,对软件开发者、企业与基础设施营运者而言,更重要的问题往往是:模型所发现的漏洞是否真实存在,以及是否能够被有效修补。
一个不存在的漏洞,即使由世界顶尖专家提出,也没有价值;一个真实存在的漏洞,即使由 AI 发现,也必须被处理。
因此,在成果验证型制度中,被验证的核心并不是能力来源,而是成果是否成立。
事实上,资安领域长期以来便存在类似逻辑。企业之所以投入漏洞奖励计划(Bug BountyProgram),并不是因为特别在意漏洞由谁发现,而是因为漏洞一旦被证实存在,就代表系统需要修补。制度真正关心的,是漏洞是否真实,而非发现者的身分。
因此,在成果验证型制度中,AI的出现未必削弱制度功能,反而可能提高问题发现速度、缩短研发周期,并提升成果产出效率。制度真正需要确认的,始终是成果是否有效。
系统验证
当系统必须长期运作于复杂且不断变动的环境中,单次成功已不足以构成证明。
航空运输、核能设施、金融交易系统、医疗照护系统、半导体制造与电力系统,都属于高度依赖可靠性的系统。
在这些场景里,最重要的往往不是某个人是否优秀,也不是单一成果是否成功,而是整体系统是否能够持续、稳定且安全地运作。
一位优秀飞行员,无法保证航空系统可靠,一位优秀工程师,也无法单独保证核能系统安全。真正被验证的,是整体系统在面对异常、错误与不确定性时,是否仍能维持可接受的风险水准。
这也是为什么航空产业重视备援设计、核能产业重视防呆机制、半导体产业重视品质管理与追溯系统。
制度验证的对象,从来不是个人,而是系统。因此,当 AI开始导入工厂、医院、金融机构与关键基础设施时,制度真正需要回答的问题便不再是AI 是否聪明,而是 AI 是否能够被纳入既有控制机制、责任架构与风险管理体系之中。
在系统验证型制度里,AI 的价值不取决于它能完成多少工作,而取决于它是否能在不降低系统可靠性的前提下参与工作。
治理验证
当工作涉及多个参与者、多重决策与跨组织协作时,即使具备能力、成果成立、系统可靠,问题也未必因此消失。因为此时制度需要回答的,已不再是能力问题、成果问题或系统问题,而是治理问题。
谁提出判断?谁验证判断?谁核准执行?谁承担责任?
在企业里,重大投资决策通常需要经过提案、审查与核准程序;在医疗体系中,特定治疗方案可能需要跨科会诊;在航空、核能与半导体产业,重大异常处置往往涉及多层级审核与责任归属。
这些制度存在的目的,并不是因为参与者缺乏能力。相反地,正是因为不同参与者都可能具备能力、提出合理判断,甚至拿出可行方案,制度才需要进一步确认:谁有权做出最终决定,以及谁应对决定结果负责。
因此,治理验证所关注的,并不是能力是否由特定参与者掌握,也不只是成果是否有效,而是决策权是否被正当授予、责任是否被清楚界定,以及制度是否知道由谁承担后果。
从这个角度来看,2026 年6月 G7 讨论 Trusted Partners机制,以及美国政府要求限制部分高阶模型存取权限,所面对的其实已经不是单纯的技术问题,而正是因为Mythos 5争议的特殊之处,不是能力争议,而是能力授权争议:能力已经强到必须讨论谁可以取得这些能力。
谁有资格取得这些能力?谁有权使用这些能力?又应由谁对能力造成的结果负责?这些问题,本质上都属于治理问题。
AI 非战之罪:创新与治理 不是二选一
事实上,同一种能力既能被用来保护世界,也能被用来攻击世界;既能推动创造,也会要求新的治理,这并不表示创造与治理必然冲突。
2025 年,荷兰莱顿大学进行一项实验,一名学生刻意以 ChatGPT 与 Claude作为主要论文指导工具完成研究。值得注意的是,校方讨论的焦点并不是 AI 能不能写论文,而是当 AI已经能够参与知识生产之后,大学应如何重新设计评量与指导制度。
换句话说,莱顿大学并没有把“使用 AI”直接等同于制度风险。相反地,校方开始重新思考:在 AI已经成为知识工作一部分的情况下,大学究竟希望透过论文制度验证什么。
这项实验揭露了一个重要事实:制度风险未必来自 AI 本身,而更可能来自制度目的与验证机制之间的不一致。
只有先厘清制度原本想验证的对象,才可能进一步判断 AI 的参与究竟是在协助制度运作,还是在破坏制度存在的基础。
随着火星聚落构想逐渐从科幻走向工程,国际研究已不再只关注如何抵达火星,也开始讨论火星聚落应该如何治理。从共享资源管理、技术标准建立,到跨聚落协调与权限配置,治理问题已经成为火星计划的一部分。
只有当一件事情开始变得可能,人们才需要讨论如何管理它。Mythos 5 所揭露的,正是同样的讯号。
如果模型没有能力发现漏洞,美国政府不会介入;如果模型无法影响关键基础设施,G7 不会讨论 TrustedPartners;如果火星聚落仍停留在科幻小说里,研究者也不会开始讨论治理架构。
治理问题之所以出现,不是因为创新失败。恰恰相反,正是因为创新迈向成功。