新闻资讯

Matthias Mann团队发表DIA大队列标志物筛选新策略

2020-06-10
中科新生命
2415

DIA(Data-Independent Acquisition,数据非依赖性采集)技术可无偏向性采集质谱扫描范围内的所有信号,实现真正的信息全息扫描。是大队列样本生物标志物研究的优选方法之一,具有以下特点:

(1) 全息扫描:数据随机缺失值减少数倍;

(2) 高重现性、稳定性:鉴定重复率提升近40%,定量精密度提升近1倍;

(3) 高准确度:定量能力接近金标准MRM技术;

(4) 可追溯性:可实现回溯性分析以及多批数据整合分析。


阿尔茨海默病(Alzheimer’s disease, AD)是老龄人口中发病率最高的疾病之一,且随着老龄化社会进程加剧,发病人数增长迅速。然而该疾病在潜伏期及发病初期临床症状并不明显,因此难以及早干预和及早治疗。DIA蛋白质组学技术的发展,为早期诊断阿尔兹海默症提供了有力的武器,也是科研研究热点之一。

image.png

2020年6月著名蛋白质组学领军人物德国马普生物化学研究所所长Matthias Mann教授在Molecular Systems Biology(IF 9.8)杂志上发表题目为 《Proteome profiling in cerebrospinal fluid reveals novel biomarkers of Alzheimer’s disease》的研究成果,介绍了一种标志物筛选的新策略-矩阵策略,利用DIA全息扫描蛋白质组学技术进行脑脊液(简称CSF)深度蛋白质组学分析,寻找阿尔兹海默病的疾病的新型诊断标志物。

相较于传统标志物筛选策略技术路线先筛选后验证的经典方法,本研究主要特点是采用平行策略,即采用不同地域(瑞士、柏林、马格德堡)来源的三个独立队列共197例人群的脑脊液样本,同时进行制备和大规模蛋白质组学分析,然后通过三个队列蛋白质组的整合和独立对比,寻找一致的差异表达蛋白,同时完成标志物的筛选与验证。最终发现40种蛋白特征分子可以有效诊断阿尔兹海默病疾病,并通过机器学习的方法对该疾病进行类别划分。

实验材料:人脑脊液

实验分组:分为瑞士、柏林、马格德堡三个队列,每队列分别包括非阿尔兹海默病组(简称non-AD 组)及阿尔兹海默病组(简称AD 组)

主要技术路线如下:

image.png

主要结果:

1. 三个队列蛋白质组学数据质量评估

利用Q Exactive HF-X Orbitrap mass高分辨质谱平台,对197例脑脊液样本进行DIA模式数据采集,首先对鉴定结果从蛋白鉴定水平和定量波动(CV)两方面进行质量评价。每个样本平均检测蛋白为检测到1233个, 约50%的样本能够重复检测到的蛋白达到1288个,占总蛋白的87%。通过定量变异波动分析发现,约1000种蛋白的定量波动性低于20%。以上结果表明实验具有高度重复性和定量稳定性。

image.png

2. 三个队列差异表达蛋白一致性分析

对瑞士、柏林、马格德堡三个队列的蛋白质组学结果分别进行统计及差异比较,以考察不同来源队列差异蛋白的一致性。在瑞士队列和马格德堡队列的结果比对中,一共占89% (172/194 proteins) 的差异蛋白具有相同的上下调趋势;在瑞士队列和柏林队列的结果比对中,95% (70/74) 的差异蛋白具有相同的上下调趋势(图3左)。在柏林和马格德堡队列的比较当中,93% (64/69)的差异蛋白具有相同的上下调趋势。且更加一致的是检测到的差异蛋白变化最剧烈的均是tau蛋白并且富集到的显著功能均为神经元与突触相关。结果表明三个队列虽有地域差异,但是AD与非AD病人差异表达的蛋白大多数一致性较好。

image.png

3. AD 组与non-AD组的区分效果

对三个队列所有组学数据集进行无监督聚类分析,评价是否可以有效区分AD组与non-AD组。结果展示,蛋白质结果可以很好地将两组分开,而与是否来源于某个区域无关(图4左)。后续作者选择在不同队列中表达趋势一致的40个蛋白特征分子作为重点进行分析,进一步将临床指标进行对应,发现与t-tau蛋白浓度以及临床评分MMSE score(mini-mental state examination)值均有较好的相关性。

image.png

4. 机器学习对AD进行再分类

利用机器学习的方法对26个核心蛋白对AD再分类,发现用其中14个蛋白的强度可以对AD状态进行有效分类,并通过常见的集成学习方法进行验证,ROC曲线显示具有较好的检测灵敏性和特异性。并通过交叉验证模型,其中88个AD病人中有72可以被有效识别,109个non-AD病人中有95个可以别有效识别,灵敏性和特异性分别达到82%和87%。

总结:

本文分享了一种标志物筛选的新思路——矩阵策略法。通过设计多个独立队列,实现筛选和验证平行进行,一步到位,避免不同实验方法引入的差异影响。在本研究中,采用DIA全息扫描蛋白质组学技术,实现大队列高通量检测,同时保证技术和数据的高重复性和高稳定性。在筛选到的标志物中,进一步结合临床数据以及机器学习等方法综合进行标志物评价,再次验证标志物的可靠性。

image.png