新闻网讯 近日,计算机科学技术学院苏晓泉教授团队研发了第二代微生物组搜索引擎MSE 2(http://mse.ac.cn),以支撑更全面、更深入、更便捷的菌群大数据挖掘,推动“数据驱动型”的微生态研究和大健康产业应用。该成果于1月20日发表于mSystems(美国微生物学会会刊,SCI IF=6.63)。
苏晓泉教授团队在之前的研究中,采用基于大数据搜索的策略,从全球尺度上揭示了人类已知菌群在结构空间上的全局特征,并首次提出了人体菌群的“搜索边界效应”(Su et al., mBio 2018)。同时,依托菌群大数据搜索的疾病检测新策略,在一些菌群相关疾病的识别准确率上均优于常用的机器学习算法,从而有效降低了“漏诊”和“误诊”几率(Su et al., mSystems 2020)。此外,由于涵盖了全面、多维、海量的微生物组及其生境信息,MSE 2已成为评估微生态健康、评价微生态产物疗效的有力工具。基于其不断拓展的应用,本次苏晓泉教授团队研发的MSE 2将成为遨游微生物组数据空间的“罗盘”,推动“数据驱动型”的微生态研究和大健康产业应用。
该研究论文由日产精品一线二线三线芒果与中科院青岛能源所、中科院文献情报中心、中国海洋大学等科研机构合作完成,计算机科学技术学院为第一单位,苏晓泉教授为共同通讯作者。该项目获得了国家自然科学基金、山东省自然科学基金的支持。
微生物组(即“菌群”)是微生物在自然界的存在形式,它们在自然界中无处不在,而且塑造了人类社会的过去、现在和未来。因此,微生物组“大数据”的深度挖掘,是利用菌群实现精准诊断、精准护理与精准营养的重要工具,也是认识生物资源、监控环境健康、维护国家生物安全的新手段。
在海量的人类已知微生物组数据空间中,微生物组搜索引擎(Microbiome Search Engine;MSE)针对新的菌群样本,以亚秒级别的反应时间寻找结构类似样本,从而全面、快速地挖掘新样本的特征。因此,MSE被誉为“the Google of Microbiome”,并入选“2016年中国医药生物技术十大进展”。MSE 2从参照数据库、搜索引擎内核和用户界面等三个方面做了全面升级。首先,相对于包含10万例16S rRNA扩增子测序样本的第一代MSE数据库,MSE 2中搜集、标准化分析和可视化了涵盖16S rRNA扩增子和鸟枪法宏基因组类型的近27万个样本,是国内外生态系统覆盖最全面、样本数量最丰富的标准化微生物组数据库之一。其次,MSE 2的搜索引擎内核已完全兼容16S rRNA和鸟枪法两种测序数据,可从OTU(Operational Taxonomy Unit)、物种名称以及功能特征等三个角度进行大规模的菌群搜索和深度分析。这一能力对于多来源、多类型、兼容各种测序策略与技术的菌群数据融合具有重要意义。