人类基因密码被谷歌AI破解

2026-01-30 15:25:09 · chineseheadlinenews.com · 来源: 智东西

1月29日凌晨,2024年诺贝尔化学奖得主、谷歌DeepMind CEO Demis Hassabis带领团队研发的AI基因组模型----AlphaGenome,登上了顶级期刊Nature(自然)最新一期封面。这是继AlphaFold之后,DeepMind又一项重磅生命科学研究登上Nature。

AlphaGenome旨在解决生物学中一个长期未解的难题:人类基因组中约98%的非编码区域虽然不直接产生蛋白质,却调控着基因的开启、剪接与表达,其变异常常与疾病风险密切相关,但难以用传统手段解析。

为此,DeepMind研究团队构建了一个全新AI架构,可输入百万碱基长度的DNA序列,并以单碱基分辨率,预测RNA表达量、剪接结构、染色质可及性、转录因子结合位点乃至三维结构等近6000项调控特征。

该项目论文题为《Advancing regulatory variant effect prediction with AlphaGenome(借助AlphaGenome技术提升调控变异的效应预测能力)》,也是首次有AI模型实现了对人类基因调控“从序列到功能”的统一建模。

过去40亿年积淀的生命遗传密码,如今正被AI工具以“统一建模”的方式重新解码。

DeepMind在2025年6月曾通过博客预告此项目,彼时AlphaGenome已向科研界开放预览API,重点在于构建一个更具解释力和泛化能力的DNA序列模型,作为一种“通用型变异解读引擎”投入研究使用。

此次正式发表在Nature的版本中,DeepMind团队不仅完成了全模态性能评估,更在多个疾病变异机制中展示了AlphaGenome的推理能力,包括如何准确预测TAL1致癌突变的激活机制,全面验证了AlphaGenome在剪接、表达、染色质状态等关键通路上的预测能力。

研究者认为,这一模型将为罕见病致因定位、新型治疗靶点发掘、以及合成生物学设计等方向提供强有力的通用工具。

论文链接:https://www.nature.com/articles/s41586-025-10014-0

百万级DNA输入和碱基级预测

突破“长序列”与“高分辨率”难题

AlphaGenome的核心创新之一,是首次将输入DNA序列长度提升至100万碱基(1Mb),同时在输出层保持了碱基级别的预测精度。

这打破了以往模型在“长序列”与“高分辨率”之间的权衡。例如,以往的SpliceAI等模型虽然具备高分辨率,但受限于只能处理1万碱基以内的短序列,难以捕捉远距离调控。

而Enformer等模型虽能处理20万至50万碱基的长序列,却需牺牲精度,用128bp等为单位分箱预测,无法精准描摹剪接位点、增强子与启动子的细粒度结构。

在训练流程上,AlphaGenome采取了“预训练+蒸馏”的两阶段架构,通过多个TPU并行处理、序列平行化、U-Net结构和Transformer结合,既保留了细节,又扩大了上下文范围。

AlphaGenome模型架构、训练方案和综合评估性能

在跨24项基因组轨迹任务中,AlphaGenome在22项上超越当前最佳模型;在26项变异效应预测中,有25项达到或超过当前SOTA模型的表现。

研究团队基因组轨道上的预测性能进行了逐项评估

统一预测机制

变异影响“一键总览”

与传统模型需要分别针对不同任务(如剪接、表达、染色质结构)训练不同网络不同,AlphaGenome是第一个可在单次推理中同时输出11类模态(modality)预测结果的统一模型。

它支持从一段DNA序列中,直接推断出RNA表达水平、剪接位点及使用情况、染色质可达性、转录因子结合位点、组蛋白修饰模式、三维接触图谱等调控特征,且适用于人类与小鼠细胞在数千种不同细胞或组织类型中的表现。

这种“多模态联合”结构为突变解析带来了全新视角。

研究人员可以对任意一个DNA变异,通过模型快速预测它在多个调控层级的影响,并比较参考与突变版本的差异,进而推断该变异是否会导致表达上调、剪接改变,或染色质状态变化。

论文中特别展示了模型如何成功预测致癌突变激活TAL1基因的路径机制,验证了其在非编码区变异解释中的实际价值。

AlphaGenome对T-ALL中TAL1致癌突变的多模态预测示例

剪接预测能力升级

有望推动罕见病研究

RNA剪接异常是诸多罕见病(如脊髓性肌萎缩症、囊性纤维化)的致病谤源,但传统AI模型往往只能识别剪接位点本身,而难以全面解析剪接使用率及剪接连接模式(splice junction)。

AlphaGenome首次在模型中引入了剪接连接点的直接预测能力(splice junction modeling),结合位点预测与使用率分析,构建出更完整的剪接调控图谱。

在GTEx等数据集中,该模型成功预测多个已知致病突变对剪接的影响,在ClinVar和MPRA等数据集上亦取得当前最优的评估成绩,在7个剪接效应任务中,AlphaGenome在6个上表现最佳。

AlphaGenome在剪接变异效应预测任务中达到SOTA水平

这项能力对于理解非编码变异如何引发病理剪接、用于新型诊断方法开发具有重要推动作用。

结语:继AlphaFold之后

DeepMind用AI再解“生命之书”

AlphaGenome的出现不仅为DNA序列建模设立了一个全新技术基线,也为生命科学研究者打开了一扇观察遗传调控全貌的新窗口。

其覆盖广泛模态、支持长序列输入、具备单碱基预测精度的能力,使其在解码基因调控代码、理解变异影响路径、指导合成DNA设计等领域具备广泛前景,下一代疾病机制研究、罕见病诊断及合成生物学提供了通用工具基础。

随着模型向学术界开放,AlphaGenome或将成为“基因版AlphaFold”的有力继任者


    24小时新闻排行榜更多>>
  1. 张又侠致习近平公开信 网评翻车
  2. 传张又侠、刘振立被暗杀身亡 红二代大骂习“坏了规矩”
  3. 新美联储主席为何是他?
  4. 中国政客遭入室盗窃,损失约700万欧元
  5. 【翻墙必看】中共军方高层出现根本性分歧
  6. 中共军报谈反腐避提张又侠 军队动向异常
  7. 内幕:张又侠落马当日 军方启动临战状态
  8. 陈伟义投案 曾是习心腹蔡奇主政台州时旧部
  9. 张又侠落马后,中共政治局要求维护“党中央领导”
  10. 中国对英30天免签,阿斯利康在华投千亿
  11. 美国人预期寿命:创历史新高
  12. 分析:巴拿马运河判决对中共是外交挫败
  13. 沙利文:张又侠与众不同 谈到中国实际对抗美国的意愿
  14. 旧金山“泛海中心”原址将建摩天楼
  15. 中国转为零工经济国 民众挣扎求生存
  16. 中英达成11项核心成果,英国人可免签入华
  17. 巴拿马法院宣布李嘉诚合同违法 美拿回港口控制权
  18. 英首相:中国同意解除对英议员的制裁
  19. 证监会最新发声
  20. 上海访民顾国平进京上访遭行政处罚
  21. 中共内部人士惊曝:2025年1400万人惨遭活摘器官
  22. 巴拿马最高法院裁定长和营运港口合约违宪
  23. 英相游故宫无高层陪同无清场 英媒对比川普待遇
  24. 中生技公司“嘉必优”成为奶粉下架焦点
  25. 各国忙谈双边协议 “去中化”转向“分散美国风险”
  26. 爆张又侠官宣当日 军方启动“临战状态”习低估后果 陷入了危险
  27. 中共应急管理部长王祥喜缺席会议 传被调查
  28. 张雨绮彻底完蛋?
  29. 委内瑞拉签署新法 告别石油国有化时代
  30. 南京竹桥清晨的离奇命案
  31. 被骗走3.5亿,光大银行起诉一连串友商
  32. 1.8亿理财资金仅剩44万 大连银行称嫌犯失踪挨批
  33. 字母哥交易倒计时,勇士成最热下家
  34. 绕开欧盟27国一致同意,德国邀五国打造“多速欧洲”
  35. 英国首相检阅仪仗队“尴尬一幕曝光”李强急出手扶他
  36. 外媒争相追问张又侠事件 中共对内封杀消息
  37. 铠侠高管:AI数据中心正处于存储饥渴期
  38. 大陆网红周媛培训课程引发批评 被立案调查
  39. 一封误发“死亡日历”,引爆亚马逊16000人大裁员
  40. 前FIFA主席拍案:球迷别去美国看世界杯!枪口对准平民
  41. 为中国创业项目窃取AI技术,前谷歌工程师被定罪
  42. Clawdbot没有商业价值,但给“鸡肋”的AI PC上了一课
  43. 诈骗11亿余元,缅北徐发启案宣判
  44. 移民团体状告ICE:拘留中心不人道
  45. 美专家:张又侠倒台引发党内对习领导力质疑
  46. 欧洲天然气价格狂飙38%
  47. “杰我睿”暴雷:有人“存”1000克黄金无法拿回
  48. 大陆知名手办工厂遭故意纵火 部分产品被烧毁
  49. 两党妥协暂时避免政府停摆
  50. 中国经济低迷 中年人失业备受煎熬
  51. 川普签令,施压加州加速野火重建
  52. 张又侠当年是怎么扶习上马再送一程的?
  53. 一念之仁,亦可嘉也
  54. 前CNN主播莱蒙因卷入明州教堂冲击案而被捕
  55. 日韩防长会晤 同意提升两国防务合作
  56. 亚裔女冒充医生丰臀,致人濒死被捕
  57. 精神残障女硕士“被收留”案:男方不予起诉引发众怒
  58. 从非欧几何视角解释和改造Transformer
  59. 批老A抹黑女留学生,浙江宣传被骂
  60. 张又侠又一老领导去世 传其所送花圈遭拆