元基因組是當(dāng)前微生物組大數(shù)據(jù)最主要的存在形式之一。由于元基因組數(shù)據(jù)的復(fù)雜性、異質(zhì)性以及指數(shù)級增長的體量,從中深度且快速發(fā)掘微生物群落結(jié)構(gòu)和功能上的變化規(guī)律,一直是業(yè)界的一個重要技術(shù)瓶頸。近日,青島能源所單細(xì)胞研究中心發(fā)表了元基因組高性能計算分析軟件Parallel-META 3,能夠深入、全面、快速地將數(shù)量龐大的未知微生物組進(jìn)行結(jié)構(gòu)與功能解析,從而剖析疾病或生態(tài)災(zāi)害下微生物組的變化規(guī)律(圖1)。
微生物組(又稱“菌群”)在地球生態(tài)圈中無所不在,而一個微生物組元基因組的數(shù)據(jù)量可以是一個人類基因組的成百上千倍。因此,針對海量元基因組數(shù)據(jù)的深度且快速解析對于微生物組研究至關(guān)重要。但是,目前國際上已有的元基因組分析軟件在計算精度和運算速度上已經(jīng)無法滿足當(dāng)前微生物組技術(shù)的發(fā)展需求,而且其繁瑣的安裝和操作步驟也給國內(nèi)外廣大用戶帶來了困擾。因此,Parallel-META 3應(yīng)運而生,其16S rRNA/18S rRNA片段提取、拷貝數(shù)修正、功能基因預(yù)測、多樣性分析、生物標(biāo)記篩選、共生網(wǎng)絡(luò)分析等先進(jìn)分析技術(shù)使其在準(zhǔn)確性和全面性上具有顯著優(yōu)勢,而且其全自動分析的設(shè)計理念大大簡化了用戶的安裝和使用難度。與此同時,得益于全局并行化計算技術(shù),Parallel-META 3在運算速度和數(shù)據(jù)吞吐量等性能方面有顯著提高,真正實現(xiàn)了海量數(shù)據(jù)分析的“立等可取”。下一步Parallel-META 3將拓展到微生物基因的功能解析與進(jìn)化分析,實現(xiàn)微生物組代謝網(wǎng)絡(luò)的重建和比較,從而支撐微生物組大數(shù)據(jù)搜索引擎MSE(http://mse.single-cell.cn)服務(wù)業(yè)界的努力。
該研究日前發(fā)表于Scientific Reports,并獲得了軟件著作權(quán)(登記號:2016SR053280)。它是蘇曉泉副研究員帶領(lǐng)的單細(xì)胞中心生物信息團(tuán)隊完成的,獲得了科技部863、國家自然科學(xué)基金、山東省自然科學(xué)基金領(lǐng)軍人才前瞻性研究專題等的前期支持。
圖1、Parallel-META 3工作流程
文章鏈接:Jing, et al., Parallel-META 3: Comprehensive taxonomical and functional analysis platform for efficient comparison of microbial communities, Scientific Reports, 7:40371, DOI:10.1038/srep40371, http://www.nature.com/articles/srep40371
軟件下載:http://bioinfo.single-cell.cn/parallel-meta.html