基于元基因組測序的微生物組功能分析和比較在疾病診斷、生態(tài)監(jiān)控、生物安全等領(lǐng)域具有廣闊應(yīng)用價值,但是高昂的成本限制了其更廣泛應(yīng)用。日前,青島能源所單細胞中心開發(fā)了微生物組功能校正算法Meta-Apo(Metagenomic Apochromat),為大規(guī)模的菌群功能比較提供了一種保證分析精度的同時可大幅降低實驗和計算成本的解決方案。
目前,微生物組功能的分析和比較,主要基于基因組序列進行代謝重建。路線之一是鳥槍法元基因組測序(Whole Metagenome Sequencing;WMS),然而其高昂的測序成本(~1000~2000元/樣本)和冗雜的分析過程阻礙了該方法的大規(guī)模應(yīng)用。另一方面,通過擴增子測序(~200元/樣本),利用16S rRNA等進化標記基因和其參照基因組之間的關(guān)聯(lián),亦能推斷微生物組的功能。該方法雖然大幅降低了成本,但16S rRNA基因片段經(jīng)常帶有擴增偏好性,而且與全基因組序列的關(guān)聯(lián)并非完全可靠,因此,該方法的功能重建結(jié)果經(jīng)常會出現(xiàn)較大的偏差。
為了解決以上問題,單細胞中心生物信息研究組提出了Meta-Apo算法,通過挖掘WMS數(shù)據(jù)和16S rRNA擴增子數(shù)據(jù)之間的同構(gòu)關(guān)系,利用少量WMS和16S rRNA數(shù)據(jù)對(即同一個菌群樣本分別進行WMS測序和16S rRNA擴增子測序)進行訓練,來實現(xiàn)對大規(guī)模16S rRNA擴增子測序樣本的菌群功能校正(圖1)。研究結(jié)果顯示,Meta-Apo利用僅僅15例樣本的數(shù)據(jù)對進行訓練,進而基于16S rRNA擴增子對5,000例人體腸道菌群樣本進行功能預測和校正,其結(jié)果與同批樣本基于WMS推斷的菌群功能基本一致,而總測序成本僅為后者的20%左右。因此,針對大規(guī)模菌群樣本的功能重建這一目的,將全部樣本用16S rRNA擴增子策略,同時用WMS策略測定其中的一小部分樣本,將能在保證分析精度的前提下、大幅降低實驗和計算成本。因此,Meta-Apo算法和相應(yīng)的測序策略為大規(guī)模菌群功能分析項目的設(shè)計提供了一個重要的工具。
該項工作由單細胞中心與青島大學計算機科學技術(shù)學院合作完成,該論文第一作者是生物信息研究組荊功超助理研究員,通訊作者是蘇曉泉教授,并獲得了國家自然科學基金、山東省自然科學基金、中國博士后科學基金的支持。
圖1 Meta-Apo算法能校正基于16S基因擴增子推斷的菌群功能
原文鏈接:
Gongchao Jing, Yufeng Zhang, Wenzhi Cui, Lu Liu, Jian Xu, Xiaoquan Su*. Meta-Apo improves accuracy of 16S-amplicon-based prediction of microbiome function. BMC Genomics 22, 9 (2021). https://doi.org/10.1186/s12864-020-07307-1