新闻资讯

Nat Med | 一滴血,提前10年锁定“渐冻症”!血浆蛋白组助力构建早期诊断模型,准确率达98.3%!

2025-09-22
中科新生命
13

肌萎缩侧索硬化症(ALS)俗称“渐冻症”,是一种罕见的致命性神经系统疾病,其特征是运动神经元退化,导致患者肌肉无力、萎缩和瘫痪,最终引发呼吸衰竭危及生命。尽管目前可依赖神经影像学和临床评估进行辅助判断,但尚无明确的诊断标志物能够区分ALS和相似疾病。

2025年8月19日,美国国家卫生研究院(NIH)国家老龄化研究所(NIA)研究团队在Nature medicine上面发表题为“A plasma proteomics-based candidate biomarker panel predictive of amyotrophic lateral sclerosis”的文章,通过两种蛋白质检测平台(Somascan和Olink技术)全面的分析了ALS 患者的数据,并结合机器学习在血浆中确定了一种独特的分子特征,可以有效地将 ALS 病例与健康个体和其他神经系统疾病区分开来。

 

 

 

 研究设计

样本来源:ALS患者(n = 231)、健康对照(n = 214)、其他神经系统疾病患者(如帕金森病、路易体痴呆等,n = 170)、脑脊液(CSF)样本(ALS:n = 14 、 对照n = 89)

样本分组:发现队列(Discovery Cohort):80% 样本(ALS n = 183 vs 对照n = 309)、复制队列(Replication Cohort):20% 样本(ALS n = 48 vs 对照n = 75)、外部验证集:包括NIH保留样本和UK Biobank数据。

 

 

 技术方法

SomaScan P7K、Olink Explore 3072、全基因组测序

 

 

 技术路线

步骤1:血浆蛋白组学确定ALS显著相关的血浆蛋白;

步骤2:C9orf72基因对ALS蛋白质丰度变化的影响;

步骤3:血浆中差异丰度蛋白与脑脊液的比较;

步骤4:机器学习揭示与 ALS 相关的独特血浆蛋白特征。

图1 研究工作流程

 

 

 研究结果

1. 全蛋白质组关联分析揭示了与 ALS 相关的血浆蛋白

在发现队列中,研究团队通过全蛋白质组关联分析,并结合患者的遗传特征和临床数据,发现了33种血浆蛋白在ALS中丰度显著改变。除去神经丝轻链(NEFL)和LIF(白血病抑制因子)已知的疾病相关蛋白之外,其余31种蛋白质此前并没有明确地与ALS关联。进一步通过ELISA和SomaScan P7K蛋白质组数据集的额外验证以及验证队列(48例ALS病例,75例对照)分析了上述鉴定的蛋白质丰度差异的一致性。

图2 与对照组相比, ALS 的患者血浆蛋白差异

 

2. C9orf72 ALS患者血浆生物标志物比较

已知C9orf72扩增是ALS常见的一种遗传因素,研究团队通过分析C9orf72型ALS患者的血浆蛋白数据,发现与非携带者相比,ALS C9orf72携带者中有8种蛋白显著上调。与对照组相比,这些蛋白质也升高,表明其变化与C9orf72重复扩增相关。此外,在有症状C9orf72携带者中升高的特定蛋白(包括EIF2S2、HPCAL1等)在无症状携带者中无明显变化,表明其可能具有作为表型转化的生物标志物的潜力。

随后,研究人员对33种血浆蛋白进行功能通路分析发现其与骨骼肌、神经元通路有较强的关联,强调了参与“骨骼肌发育和退化”、“能量代谢”等细胞通路的重要性。

图3 基于差异丰度血浆蛋白的ALS通路分析

 

3. 血浆与脑脊液(CSF)中差异丰度蛋白质比较

为进一步研究血浆中差异丰度的蛋白质在脑脊液 (CSF) 中是否受到类似的影响,通过Somascan P7k的技术对14 例 ALS 病例和 89 名健康对照的CSF样本进行检测,发现HSPB6、MEGF10、NEFL、RNASE3和TPM3在ALS患者脑脊液中显著增加,而其他蛋白在ALS患者脑脊液中无显著差异。

图4 C9orf72扩增ALS患者血浆蛋白丰度差异

 

4. 遗传因素对蛋白质丰度的影响

通过大型ALS全基因组关联研究(GWAS)和双样本孟德尔随机化分析,发现所观察到的ALS患者蛋白质丰度差异并非由遗传变异直接驱动.

 

5. 机器学习模型结果

研究团队评估了10种监督机器学习算法,对183例ALS病例和309例对照样本数据进行训练。经比较分析,发现随机森林算法生成了性能最佳的模型,并确定了20个特征(包括17种蛋白质、性别、采集样本时的年龄和血浆采集管)可区分ALS病例与健康个体和其他神经系统疾病患者。

进一步确定NEFL是否会影响随机森林模型的准确性,发现排除NEFL后模型性能虽有下降,但仍有较好表现,表明模型并非仅依赖NEFL。最后通过独立的外部样本集验证机器学习模型。

 

图5 基于血浆蛋白诊断ALS的监督机器学习

 

6. 症状出现时间估算

研究团队利用在ALS症状出现之前采集血浆样本的个体(从血浆采样到症状出现的平均持续时间= 6.4年)的数据来检测该模型在预估症状发作时间的性能。结果显示,ALS风险评分与症状发作时间之间存在显著关联,ALS风险评分随着患者接近症状发作而逐渐增加。值得注意的是,ALS风险评分的增加并不是由于年龄的增加,因为患有其他神经系统疾病的个体、健康个体甚至是接受诊断后的ALS患者都没有表现出相同的趋势。

进一步研究了哪些蛋白质在前驱期可能会发生改变,分析发现在无症状个体和ALS患者中,该模型的10种蛋白质分别与症状出现的时间相关,阳性系数最高的蛋白为NEFL,其次为CSRP3。

图6 监督机器学习得出的ALS风险评分回归分析预测无症状患者ALS发病年龄

 

 

结论

总之,该研究通过对 ALS 患者血浆样本的蛋白质组学分析发现了一套独特的蛋白标志物,并通过机器学习分析构建诊断模型,该模型不仅能有效区分ALS患者与健康人群,还能够预测个体何时可能出现症状。该研究为ALS的早期诊断、疾病监测和临床试验提供了有力的工具和新的生物学见解。

 

 

中科优品推荐

【中科新生命】深耕组学研究21年,具备行业领先的各类蛋白质检测平台及成熟项目经验。推出SomaScan P7K/P11K,该产品基于Somascan平台,同时实现蛋白检测的深、稳、准三位一体,适用于大规模的蛋白质组分析,尤其是血液蛋白质组,突破血液蛋白组深度极限,为血液蛋白标志物的临床转化创造新的机遇,欢迎感兴趣的老师前来咨询。

滑动图片查看更多>>>

 

 

 

关于中科新生命

 

 

上海中科新生命生物科技有限公司(APTBIO)创立于 2004 年,由原中国科学院上海生命科学研究院蛋白质组研究中心孵化而来,是国内质谱多组学应用领域的开拓者。公司以 “AI + 质谱多组学” 双核驱动创新,构建智能化组学生态。拥有自主知识产权的质谱检测平台与 AI 大数据分析系统,聚焦科技服务、生物医药及大健康消费三大领域,为全球科研机构、医院、药企提供从基础研究到临床转化的一站式解决方案。融合多组学技术与人工智能,围绕生物标志物发掘、药物靶点筛选及个性化诊疗等方向,构建具有国际竞争力的组学数据库与算法模型,推动转化医学进程,加速创新药物研发,成为推动生命科学数字化升级的核心引领者。