地球生物祖先靠氢气为生!
阿斯加德古菌中海姆达尔古菌外真核生物的深层起源
本研究是华东师范大学团队的工作。
Deep origin of eukaryotes outside Heimdallarchaeia within Asgardarchaeota. Nature. 2025 May 7.
摘要
对阿斯加德古菌的形态学、生理学和基因组学的研究,为了解真核生物的进化历史提供了有价值的见解[1,2,3]。先前的一项研究表明,真核生物嵌套在海姆达尔古菌中[4],但其在阿斯加德古菌中的准确系统发育位置仍然存在争议[4,5]。这一争议使得理解早期真核生物祖先的代谢特征和时间尺度变得复杂。在这里,我们生成了223个之前未被记录的阿斯加德古菌宏基因组组装的近乎完整的基因组。我们在属水平或更高水平上鉴定出16个新的谱系,这极大地扩展了已知的阿斯加德古菌的系统发育多样性。通过对这个扩展的基因组数据集进行复杂的系统发育基因组分析(涉及多个标记集),我们推断真核生物在所有采样的海姆达尔古菌多样化之前就已经进化,而非与海姆达尔古菌中的霍达古菌目分支在一起。真核生物位置的这种差异可能是由于之前未被充分认识的尼奥德古菌目基因组的嵌合性质,我们发现其由阿斯加德古菌和TACK古菌(阿斯加德古菌的姐妹门类)的序列组成。通过祖先重建和分子定年,我们推断最后一个阿斯加德古菌和真核生物的共同祖先出现在大氧化事件之前,并且可能是一种依赖氢气的厌氧产乙酸菌。我们的发现支持真核生物起源的氢气假说,该假说认为真核生物起源于消耗氢气的古菌宿主与产生氢气的原线粒体的融合。
真核细胞的起源长期以来一直是个谜[6]。阿斯加德古菌比其他古菌含有更多编码真核生物特征蛋白(ESP)的基因,被认为是真核生物最接近的亲属[4,5,7,8,9]。第一个被分离和培养的阿斯加德古菌(“Candidatus Prometheoarchaeum (Ca. P.) syntrophicum” MK-D1,属于洛基古菌门)显示,这种古菌具有长的分支突起,并且能够通过互营方式降解氨基酸[1]。这些形态和代谢特征为真核生物起源的过程提供了新的见解。例如,人们认为细胞突起可能介导细胞间的相互作用,导致吞噬其伙伴细胞并逐渐形成线粒体。随后,第二个阿斯加德古菌(“Candidatus Lokiarchaeum (Ca. L.) ossiferum”)最近被富集,冷冻电镜断层扫描和免疫染色显示存在类似肌动蛋白的细胞骨架丝以及Lokiactin的表达[2]。据推断,Lokiactin可能作为阿斯加德古菌细胞的支架,并在维持细胞形态、细胞分裂和分子运输中发挥作用,类似于真核细胞中的肌动蛋白丝[10,11]。这些结果和假设暗示真核生物的核谱系从古菌中进化而来。
尽管在阿斯加德古菌的纯培养或富集物中已经鉴定出一些类似真核生物的特征,但由于菌株数量有限,推断早期真核生物祖先的确切系统发育位置、时间尺度和代谢特征仍然具有挑战性。相比之下,基于大量古菌基因组数据的系统发育基因组分析可以弥补这些不足[12]。通过使用超树法和合并法,对古菌和真核生物中超过3000个基因家族进行分析,海姆达尔古菌门被认为是真核生物最接近的亲属[13]。然而,该研究仅使用了六个阿斯加德古菌基因组,未能代表目前扩展的阿斯加德古菌的多样性。最近,两项研究基于对阿斯加德古菌的扩展基因组采样,得出了关于真核生物与阿斯加德古菌之间关系的不一致结果。一项研究表明,真核生物更有可能从阿斯加德古菌中分支出来,作为海姆达尔古菌门 - 悟空古菌分支的姐妹群,或者是古菌中更深层次的分支[5],而另一项研究则提出真核生物在海姆达尔古菌门中作为霍达古菌目的姐妹谱系分支[4]。前者仅使用了29个串联标记来推断系统发育,而后者使用非核糖体蛋白作为标记,并广泛排除比对中的位点。真核生物与古菌之间的确切关系仍有待进一步阐明。
在这里,我们展示了223个新的阿斯加德古菌基因组,包括鉴定出的16个额外的目、科或属水平的谱系,这些谱系是从中国沿海湿地的14个位点生成的宏基因组样本中获得的,这显著扩展了阿斯加德古菌的多样性。通过利用复杂的系统发育基因组方法(包括对序列比对进行重新编码、在最大似然法(ML)和贝叶斯推断中使用复杂的位点异质进化模型以及减少速率异质性)分析扩展的阿斯加德古菌基因组采样,我们有力地将真核生物置于阿斯加德古菌中,作为海姆达尔古菌的姐妹分支。通过应用祖先重建和分子定年,描绘了最后一个阿斯加德古菌和真核生物共同祖先(LAECA)的时间尺度和代谢特征,发现其与先前的研究有显著差异[1,4]。
阿斯加德古菌多样性的扩展
阿斯加德古菌基因组多样性的增加有助于解决真核生物与阿斯加德古菌之间的进化关系[4,5,7]。为此,我们从中国的盐沼和红树林湿地收集了40个沉积物样本,并进行了宏基因组测序(补充表1和补充图1a)。在对支架进行从头组装和分箱后,我们重建了11878个宏基因组组装的基因组(MAGs)(补充图1b)。在这些MAGs中,223个属于阿斯加德古菌,完整性大于70%,污染率小于10%(补充表2和补充图1c)。这些MAGs与395个公开可用的高质量基因组相结合。通过使用dRep[14]在物种水平上选择代表(平均核苷酸同一性(ANI)至少为95%),我们最终获得了一组411个阿斯加德古菌基因组,其中136个来自本研究(补充表2)。其中,两个来自培养的阿斯加德古菌(Ca. P. syntrophicum和Ca. L. ossiferum),其余基因组是从环境样本中回收的MAGs(图1)。这些基因组的平均完整性为85.3%,平均污染率为3.6%。
图1:在GTDB r207中对53个串联古菌标记(GTDB.ar53)的系统发育基因组分析。
使用IQ-TREE在LG + C60 + F + G + PMSF模型下推断的最大似然树,基于一组579个古菌分类群(411个阿斯加德古菌、51个DPANN古菌、47个广古菌和70个TACK古菌代表)。树中仅显示阿斯加德古菌谱系。两个培养的阿斯加德古菌菌株用红星突出显示。本研究中新鉴定的基因组在最外环中用彩色条表示。自展支持值至少为95%用黑点表示。比例尺表示每个位点的平均预期替换数。
