绘制演化图谱,解析生命复杂性
2026-05-13 01:25:10 · chineseheadlinenews.com · 来源: 中国科学报
生命从单细胞到多细胞的跃迁,堪称一次根本性的“系统升级”。无数细胞如何精密分工、协同运作,构建出复杂的生命体,其遗传信息时空有序展开的物理结构基础是什么?这一生命科学领域的核心谜题,如今从基因组三维结构的演化研究中,找到了关键线索。
为解开这一谜题,西安交通大学智能网络与网络安全教育部重点实验室教授叶凯团队耗时多年,对跨越38亿年演化历程、涵盖1025个物种(包括细菌、真菌、植物和动物)的三维基因组数据展开系统分析。
近日,团队为上千物种绘制出基因组高阶结构的完整演化全景图,并首次从“系统构架”的视角,揭示了基因组三维高阶结构的演化规律,为生命复杂性涌现找到了物理基础。研究论文发表在《细胞》上。

基因组高阶结构演化总结图。受访者供图
破解未解之谜
“结构决定功能”是生物学的基本准则,但基因组的三维结构本身如何演化,以支撑生命从简单到复杂的系统跃迁,长期以来始终是未解之谜。
为回答“何种基因组‘构架’支撑了多细胞生命的涌现”这一核心命题,研究团队面临着巨大挑战,那便是如何从海量、异质的跨物种数据中,提炼出具有普适性的演化规律。
为此,团队自主研发了一套融合自动化科学与人工智能的原创研究方法。通过这套方法,团队首次明确定义并量化了两类核心的基因组高阶“构架”,为解读生命复杂性提供了清晰抓手。
一类是“全局折叠”,即染色体在细胞核内的整体空间排布,如同建筑的承重结构,是维持基因组系统稳定的骨架。研究发现,这种“构架”的强弱与生物复杂性无关,却普遍存在于整个生命界。值得注意的是,植物界普遍强化了这一稳定构架,这或许是植物为应对固着生存(无法移动)所面临的复杂环境压力,进化出的适应性策略。
另一类是“棋盘格局”,反映了活跃与抑制的基因组区域在三维空间中的分隔程度,如同城市的功能区规划,承担着基因功能精准分区的作用。研究揭示了一个关键规律:“棋盘格局”的强度与生物复杂性呈显著正相关。这意味着,生命体越复杂,其基因组三维组织就越趋向于精细的“分区化管理”。
叶凯在接受《中国科学报》采访时,用一个生动的比喻解释了这两类“构架”的作用:“基因组高阶构架就像是生命体内管理基因的‘公司架构’。单细胞生物好比一个初创小团队,所有员工挤在一起办公,沟通直接但分工模糊,能处理的业务(生命活动)相对简单;而复杂的多细胞生物,就像拥有成千上万员工、需处理各类复杂业务的大型集团,必须建立精细的‘公司架构’。”
他进一步解释,“棋盘格局”就相当于把公司不同部门物理分隔在不同楼层或园区,这种“分区化管理”能让活跃的基因和沉默的基因在空间上互不干扰,从而实现细胞的高度专业化。正是这套从“混在一起”到“分区管理”的三维构架升级,支撑了生命从简单到复杂的伟大跃迁。
生命演化共通法则
在此基础上,团队进一步分析揭示了动植物演化路线的根本差异:动物在演化中,弱化了“全局折叠”的刚性约束,从而为“棋盘格局”这一实现精细调控的“软件构架”腾出发展空间,以支撑高度分化的细胞类型和复杂的生命行为;而植物则倾向于加固“全局折叠”这一“硬件骨架”,其适应性更多依赖于基因组的其他调控方式,例如线性基因簇。
这一发现从系统架构层面,清晰揭示了动植物在相似复杂性层面上,演化出的截然不同的内部调控策略。更令人惊喜的是,这一跨越亿万年的演化规律,在人类胚胎早期发育过程中找到了微观呼应。
研究显示,人类胚胎早期发育同样经历了一个从强“全局折叠”向强“棋盘格局”的构架转换,且这一转换恰与细胞从全能性向多能性、再向特异功能分化的关键时期同步。这表明,“从稳定骨架到动态分区”的构架转换,可能是生命系统在不同时间尺度(亿年演化与数天发育)上,实现从同质化、可塑状态向异质化、特异化状态转变的共通法则。
开启研究新范式
这项研究的突破,不仅在于揭示了驱动生命复杂性演化的三维基因组法则,更在于构建了一种前沿的交叉学科研究范式——将生命体视为一个动态的、自组织的复杂系统,运用系统建模、信号处理和人工智能等方法,对其核心“构架”进行逆向解析。“这为理解生命的设计逻辑提供了全新的视角和工具。”叶凯表示。
然而,研究的推进并非一帆风顺。团队最初面对公开数据库时,可谓喜忧参半:一方面,免费数据库为研究提供了基础数据支撑;另一方面,现有数据质量不高、覆盖面有限,且1000多个物种横跨动物、植物、微生物,物种间特征差异巨大,如何找到它们之间的相关性,一度让团队陷入困境。
在反复尝试无果后,叶凯提出了全新思路:不再执着于寻找具体的关联特征,而是通过发展融合自动化科学与人工智能的原创方法,即“序列图像化”思想和数学底层模型,构建一套定量标准,如同设计一把专属“尺子”,来度量不同复杂度物种之间的差异。
针对演化数据中的噪声与异质性,团队联合西安交通大学数学与统计学院教授孟德宇团队,构建了以稀疏表示与双层优化算法为核心的数学底层模型。该模型能将每个物种看似杂乱的三维基因组图谱,“拆解”并“重构”为少数几个本质“构架模板”的线性组合,如同一套高精度的“降噪”与“特征提取”系统,从纷繁复杂的数据中稳健提炼出真实的演化信号。

叶凯(右二)团队在实验室。受访者供图
回忆起研究中的关键瞬间,叶凯仍难掩激动:“当时我和论文第一作者车一卓博士正在电脑前,当看到1000多个物种的演化数据呈现出阶梯状分布时,我们都很兴奋——这意味着我们找到了解读生命演化的一把‘钥匙’,能够帮助我们理解整个演化过程中的基本规律。”
始终保持科研信心
研究成果的发表,同样经历了一番波折。由于团队的数据分析方式打破了生物学研究常规,先后投稿《自然》《科学》,均被编辑退回。“虽然感到受挫,但我们始终坚信,编辑未能充分理解我们的研究思路。”叶凯说,随后团队转投《细胞》,很快收到了编辑的回复,审稿人的评价给予了他们极大鼓励。
其中一位审稿人表示,这项分析极具价值,因为公众对基因组区室的形成机制了解有限,且这类问题难以通过实验方法破解;而研究中纳入的人脑和鼠小脑数据,更清晰地展现了跨物种以及胚胎发育过程中“棋盘格局”的差异程度。
谈及本次合作,孟德宇告诉《中国科学报》,他与叶凯团队的合作已持续多年。2018年起,由于两个实验室距离较近,交流日益频繁,尽管分属不同学科,但双方理念契合,都希望在生命科学与人工智能的交叉领域做出突破。
“叶凯老师擅长捕捉前沿课题,这次合作中,他提出了‘序列图像化’的核心思想,并主导了生物学分析;我们团队则针对数据噪声与异质性,构建了关键的数学底层模型。”孟德宇说,正是这种互补协作,共同形成了“知识-数据双驱动”的研究范式。
在叶凯看来,科研之路难免遇到挫折,保持信心至关重要。“无论遇到什么困难,都要对自己所做的事情有信心。起初的不尽如人意,在团队的不断调整和讨论中,总会逐渐找到突破方向。”他强调,两个团队之间的相互信任与支撑,也是研究能够顺利推进的关键。
“我们现在只是观察到了基因组演化的阶梯状现象,但究竟是什么序列引起了结构的改变,还有待我们进一步深入研究、揭开谜底。”对于未来,叶凯和团队有着清晰的目标。