解读新英格兰mNGS脑膜炎多中心研究之技
2021-9-4 来源:本站原创 浏览次数:次京东运营求职招聘微信群 http://liangssw.com/bozhu/12746.html
导读
6月13日,美国加州大学CharlesChiu团队使用SUPRI+平台进行脑膜炎临床应用多中心研究,研究成果在新英格兰医学杂志发表。微远基因在年4月推出IDseq?,引领病原宏基因组学进入2.0时代。本文对SUPRI+与IDseq?从测序数据量、数据库、判读规则和检测周期等方面进行对比。
1
测序平台与数据量
SUPRI+与IDseq?技术参数对比如下:
技术参数
SUPRI+
IDseq?
测序平台
IlluminaHiSeq
IlluminaNextSeq
测序数据量
5M-10M
15~20M
测序读长
SE
SE75
检测周期
96小时
24小时
微远生物信息团队对IDseq?测序数据量进行了建模评估,得到了如下图的评估结果。从图中可以看出,随着测速数据量的提升,检测到3条特异性目标微生物序列的概率迅速上升,而在25M左右时,数据量对目标菌种检出概率的影响趋于饱和。当测序数据量为20M时,检测到3条目标菌种特异性序列的概率可以达到98%。
测序数据量与目标菌种的检出关系图
2
参考基因组与比对算法
CharlesChiu团队开发了SUPRI+分析流程,将去除人源宿主的数据与GenBank核酸序列数据库(NT)进行比对,具体流程如下:
IDseq?的开发过程涉及如下两个方面的优化:
1)对物种不同的菌株基因组进行鉴定,剔除了错误分类的菌株,去除冗余后得到了包含丰富的菌株信息的高质量基因组。
2)对组装质量进行了评估和污染判断,过滤掉了低质量Contigs和污染序列,从源头上保证了数据库的高可信度。
IDseq?数据库包含了种“大而全”的科研级别微生物数据库,更近一步开发了包含种的临床可报级别数据库(CRP,ClinicalReportablePathogens),该数据库的基因组信息与临床数据更加深入完整,可避免临床主要病原体的错报和漏报。
3
判读规则
在报告阈值方面,SUPRI+与IDseq?报告阈值有相同之处,如病毒的阈值定为3条,需要参考阴性对照等。IDseq?进一步通过构建人体微生态数据库、试剂工程菌数据库以及设置针对不同菌群的基线,能够实现较为明确的区分检测样本中的疑似致病菌、人体微生态菌群和试剂工程菌,通过智能算法呈现样本中的微生物,最终给出较为明确的检测判读结果。
4
RNA病毒检测能力
在多中心研究的例样本中,SUPRI+检出了4例肠道病毒,而中国-年的脑脊液多中心研究未涵盖RNA病毒。IDseq?优化提升了宏转录组流程,显著提升了RNA病毒的检测能力。目前IDseq?检出RNA病毒占比32%,以甲型流感病毒H1N1、人类冠状病毒、人类副流感病毒、人呼吸道合胞病毒为主。在脑脊液样本中检出了埃可病毒11型、埃可病毒30型,柯萨奇病毒B5型等肠道病毒。
5
检测周期(TAT)
SUPRI+样本检测周期为96小时,检测周期较长可能对该多中心的临床干预效果造成一定影响。目前IDseq?的检测周期被提速至24小时,协助临床快速诊断。
结语
国内病原宏基因组学研发和临床应用进展迅速,与国际同步,在临床大样本与特殊案例方面具备了领先优势。未来关于方法学评估的研究将会持续进行,进一步细分到不同的感染领域,以大样本和大数据为基础,对病原宏基因组学方法进行持续优化与规范,推进感染精准医学。
参考文献
[1]WilsonM.R.,etal..Clinicalmetagenomicnextgenerationsequencingfordiagnosisofinfectiousmeningitisandencephalitis.NEnglJMed.
[2]Fan,S.,etal.().MetagenomicNext-generationSequencingofCerebrospinalFluidfortheDiagnosisofCentralNervousSystemInfections:AMulticentreProspectiveStudy.bioRxiv,.