人类肠道亚基因组已被挖掘,以编制更全面的肠道噬菌体基因组列表。然而,用于构建这些数据库的亚基因组数量有限(<700)(来自IMG/VR的GVD和肠道噬菌体部分)及其预测的片段大小(平均大小<15 kb,而通常在人类肠道中发现的平均尾状病毒噬菌体基因组为∼50 kb),表明大多数肠道噬菌体多样性仍然存在没有特征和不完整的。
为了使基因组解析的宏基因组学能够应用于人类群体的肠道噬菌体研究,需要一个较长且完整的参考噬菌体基因组的综合资源。基于此惠康信托桑格研究所Trevor D. Lawley教授带领团队使用高通量基因组测序来研究与健康和疾病相关的宿主生物内部和内部的微生物群落。该项工作以“Massive expansion of human gut bacteriophage diversity”为题于2021年2月18日在线发表在Cell杂志上。
研究方法及结论
宏基因组组装和病毒序列预测、人体基因组去污染、序列聚类、GPD预测的质量控制
1、建立最完整的人肠道噬菌体序列数据库(GPD)
该研究团队分析了28060个公共人类肠道亚基因组和2898个从人类肠道培养的细菌分离物基因组。筛选了4500多万个组装的重叠感染。共有13429(9.4%)个病毒基因组被分为完整,27,999(19.6%)为高质量,101,381(70.99%)作为基因组片段(<90%完整)。
2、肠道噬菌体的宿主分配和宿主范围
相比之下,每个分离物的病毒多样性在幽门螺杆菌、乳酸菌、乳酸杆菌H、乳酸杆菌、肠球菌D中最低。可视化的范围非常广泛的VCs(即,那些不限于一个单一的属)揭示了大规模的连通性之间的系统发育不同的细菌物种,细菌适应和进化。
3、肠道噬菌体的全球系统分布
北美、欧洲和亚洲噬菌体组与非洲和南美样本的明显分离。就国家而言,来自非洲和南美洲的样本主要来自秘鲁、坦桑尼亚和马达加斯加。具体来说,秘鲁和坦桑尼亚的样本来自狩猎采集社区,而马达加斯加的样本来自非西方生活方式的农村社区。大洋洲是一个特例,因为这两个群体的样本比例相似。然而,当该研究团队按国家分层时,该研究团队发现所有斐济样本都与农村群体聚集在一起,而澳大利亚样本则与城市化群体隔离。斐济的样本来自农村农业社区。
4、全球肠道噬菌体分支及其宿主菌
该研究团队表明,除了12个cras-like-VCs之外,还存在一组至少280个全球分布的VCs。这组成员的功能特性将被证明有助于阐明是什么使得肠道噬菌体在人类中广泛存在。
5、Gubaphage是肠道中一个非常普遍的分支
G1.1感染类杆菌caccae和类杆菌xylanisolvens B,G1.3感染类杆菌B vulgatus,G2感染副杆菌merdae和副杆菌distasonis。对Gubaphage分支分布的分析显示,除南美洲外,其存在于所有大陆,尤其是在欧洲,它的流行率接近40%,而非洲的流行率最低(3%)。
小结
本研究主要向大家展示了以下重要内容:
1)数据库包含来自28060个亚基因组的142809个非冗余肠道噬菌体基因组;
2)宿主分配揭示了噬菌体多样性和肠道细菌分离物的宿主范围;
3)流行病学分析揭示了全球分布的280个病毒群;
4)Gubaphage是一个感染类杆菌目的分支。