斯坦福登Nature:AI凭空造出前所未有蛋白质
2026-05-03 01:25:33 · chineseheadlinenews.com · 来源: 新智元
AI创造生命的一大步!斯坦福团队用AI造出从零写出16种噬菌体,内含地球前所未有的蛋白,Anthropic CEO预警:6到12个月,傻子也能造超级病毒。

迈向AI创造生命的重要一步!
正值深夜,斯坦福那间被精密仪器塞满的实验室,屏幕前的研究员没有像往常那样去操作移液管,而是屏住呼吸,按下了一个决定性的回车键。
几小时后,湿实验室的培养皿里,原本如地毯般均匀铺开的大肠杆菌群落中,突然浮现出一块又一块触目惊心的空白区。
显微镜下,这是一场微观世界的屠杀:细菌的细胞壁被刺穿,生命物质如熔岩般流出,成片成片的菌落倒下,仿佛被一台看不见的、凶猛的收割机扫过。

AI生成的解释性图像
放在过去,这没什么稀奇。噬菌体——一种专门吃细菌的病毒——干这种事干了几十亿年了。
但这一次,完全不一样。
这片培养皿里的“杀手”,不是来自任何沼泽、泥土、海洋或污水池——它从未在地球上活过哪怕一秒钟。它的“祖籍”不在大自然,而在硅片之间。
它是被一个叫Evo的AI模型从零开始,一行行代码“敲”出来的全套基因组。

人类把这段AI写出来的DNA合成出来,塞进大肠杆菌里,然后,它就活了,还杀得比真病毒更凶、更快、更狠。
斯坦福大学和Arc Institute的科学家们使用AI大模型,成功创造了世界上首批“AI设计”的噬菌体。
这些并非自然界病毒的简单变种,而是拥有全新蛋白质结构的合成生命形式。
研究人员合成了302个AI设计的基因组,把它们扔进大肠杆菌培养液,结果有16个直接“原地起飞”,成了能感染、能复制、能裂解细菌的真实病毒。
去年,预印本发布时,那周的头条都被GPT占据了,以至于没多少人注意到这一突破。

预印本地址:https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1
那时,MIT科技评论形容那个夜晚是“AI is here”的觉醒时刻——

这代表了“首个完整基因组的生成式设计”。
纽约大学朗格尼医学中心的生物学家Jef Boeke表示,这同时也是向着AI设计的生命形式迈出的“令人印象深刻的第一步”。
而最让生物安全圈瑟瑟发抖的细节藏在论文最后:其中一个AI设计的噬菌体,它装DNA的“包装盒”蛋白——
这玩意儿,地球已知所有生物里都查不到亲戚。

曼彻斯特大学的基因组工程师Patrick Yizhi Cai描述了这类技术的潜在影响:
这些AI模型就像是合成基因组学领域的“ChatGPT时刻”。你可以开始编写自然界从未存在过的东西。

当ChatGPT遇见DNA
要理解这件事,得先认识主角——一个叫Evo的“幽灵”。
简单粗暴的类比:Evo就是DNA版的ChatGPT。
ChatGPT读的是人类几千年来留下的小说、博客、论文、贴吧水帖,学会了怎么“接龙”出像人话的句子。
Evo读的呢?
是270万个原核生物和噬菌体的基因组(Evo 1),以及横跨生命之树的9.3万亿核苷酸数据(Evo 2)——这是迄今最大的开源生物AI模型。

Evo 2是SOTA的DNA语言模型,专为长上下文建模与设计而打造。Evo 2采用 StripedHyena 2架构,能以单核苷酸分辨率对DNA序列进行建模,上下文长度可达100万个碱基对。Evo 2使用Savanna平台进行预训练,并在OpenGenome2数据集上以自回归方式进行训练,该数据集包含来自生命所有领域的8.8万亿个token。
它学的不是“今天天气怎么样”,而是“A后面接什么碱基,这个生物才能活下去”
在它眼里,DNA序列(A、T、C、G)不再是神秘的生命天书,而是一套可以预测、可以接龙、甚至可以“文学创作”的底层代码。

在不依赖特定任务微调的情况下,Evo 2能够准确预测遗传变异对功能的影响——从非编码致病突变到具有临床意义的BRCA1基因变异
它读取基因组的方式,就像Claude读取代码一样,但Evo 2开源了!

论文地址:https://www.nature.com/articles/s41586-026-10176-5
开放权重:https://huggingface.co/collections/arcinstitute/evo
开源项目:https://github.com/arcinstitute/evo2
研究团队选的目标对象——ΦX174噬菌体,本身就是个传奇。
1977年,英国生物学家Fred Sanger第一次完整测序的就是它。

2003年,Craig Venter团队第一次从头化学合成的也是它。

它只有大约5400个碱基,编码11个基因——足够简单,但又五脏俱全,具备病毒该有的全部基本功能。

斯坦福Brian Hie教授的团队,选了一个最经典的对象,做了一件最不经典的事。整个流程像三幕剧——
第一幕——AI开脑洞。
Evo模型经过精细微调,被研究者“喂”进ΦX174的特定序列作为提示词,然后让它自由发挥,生成变体。

不是编辑,不是微调,而是从头开始合成完整基因组。
这些“候选作品”五花八门:有的基因被截断,有的基因顺序被打乱,有的甚至加了完全没见过的新基因。
其中很多组合,人类生物学家这辈子都不可能想出来。
第二幕——电脑筛选。
研究团队从几千个候选中挑出302个最有希望的,把它们的DNA真的化学合成出来。
这一步耗钱耗力,但必须做——光在电脑里“看着像”是没用的,得让真实的分子说话。
第三幕——见真章。
把合成出来的DNA混进大肠杆菌培养液里。然后,等。
结果出来了:302个候选,16个是活的。
这16个不仅能感染大肠杆菌、能复制、能炸开宿主细胞膜跑去感染下一个细菌——它们里面好几个,杀菌速度比天然的ΦX174还快。
你品品这数据:
??天然ΦX174:6小时内扩增1.3到4倍;
??AI设计的Evo-Φ69:6小时内扩增16到65倍。

人造的,比自然的还猛。
最后一击来自冷冻电镜。
研究人员对着其中一个AI生成的噬菌体一看——愣住了。
它装DNA的衣壳蛋白,在已知生命的进化树上找不到任何亲戚。这个分子结构,跟地球上任何已知物种里的任何蛋白都对不上。

AI找到了生命未曾找到的解决方案。
它就这么被AI在算力的虚空里凭空“想”出来了,而且它还真的能用。
研究团队把所有AI设计的噬菌体和原版ΦX174扔进同一个培养皿,让它们玩“大逃杀”。
他们将生成的噬菌体混合,并将其用于三种已对ΦX174产生抗性的大肠杆菌菌株。
这种混合“鸡尾酒”迅速击溃了抵抗力。

这种成功没人预料到,AI设计的噬菌体首次尝试就成功克服了现实世界中的细菌耐药性。
后抗生素时代,AI点燃新希望
把这一点划重点:AI已经不是在“补全”生命了,它在算力的虚空里漫游,走完了一条自然界需要亿万年随机突变才能跑通的进化小径——并且发明出了生命的全新零部件。
这是一道分水岭。
这就涉及到这项技术真正可能造福人类的应用方向——噬菌体疗法。
这是一个被冷落了几十年、最近又被重新点燃的医学方向。
我们都知道,抗生素滥用导致细菌耐药性越来越强,世卫组织反复警告“后抗生素时代”可能到来——一个小伤口就要人命的年代。
噬菌体是细菌的天敌,本应该是绝佳武器,但最大的问题是:细菌进化得太快,我们手里的天然噬菌体库不够用。
而Evo这种AI,等于给人类开了一个无穷无尽的噬菌体设计工厂。
细菌进化出抗性?没事,我们让AI再生成1万种新噬菌体,总有一种克得了你。

Arc Institute的官方博客里写得很清楚:他们的目标是把噬菌体疗法从“碰运气”变成“系统化生产”。
