新闻资讯

Nat Metab | 继Cell封面后再拿下Nature子刊!复旦大学郁金泰团队绘制首张“代谢组-表型组”全景图谱!

2025-12-08
中科新生命
11

代谢物是基因、环境与行为相互作用的直接产物,能够动态反映个体的生理状态和疾病进程。相比其他血液生物标志物(如蛋白质、基因表达),代谢物更接近表型,对疾病状态的反映更为敏感和全面,因此,理解代谢物如何与表型相互作用,可有助于理解疾病的生物学机制,发现早期诊断和预测的生物标志物,识别潜在的治疗靶点。然而以往代谢组学研究多为横断面或小样本,缺乏大规模、前瞻性、多表型的系统性分析。

2025年9月19日,复旦大学郁金泰、程炜、冯建峰团队在继年初血浆蛋白组学图谱刊登于Cell(IF42.5)杂志封面后,在Nature Metabolism(IF20.8)在线发表题为“Mapping the plasma metabolome to human health and disease in 274,241 adults”的文章,构建了全球首个全面的人类代谢组-表型组关联图谱

 

 

 

研究设计

研究纳入了来自英国生物银行(UK Biobank)的274,241名参与者的NMR代谢数据

 

 

技术方法

代谢组

 

 

技术路线

步骤1:数据准备与队列划分;

步骤2:代谢物-表型”关联图谱构建;

步骤3:动态变化分析与预测模型构建;

步骤4:孟德尔随机化推断代谢物与疾病之间潜在的因果关系。

图1 研究概要

图2 研究设计

 

 

研究结果

1. 种群特征和表型

研究纳入了来自英国生物样本库的274,241名参与者。参与者在采集血样时的中位年龄为58.0岁,其中54.0%为女性,95.1%为白人血统,中位随访时间为14.9年。

研究采用的表型包括两大类别:疾病和性状。疾病根据ICD-10代码定义,并分为流行性疾病(血液采集前诊断,n=527)和新发性疾病(血液采集后诊断,n=859)。性状则包括健康相关性状(n=991)和影像性状(n=2,151)。

参与者被分为三个队列:推导队列(148974 名白人,2020-2022 年代谢数据)、验证队列 1(111826 名白人,2019-2020 年代谢数据)及验证队列 2(13441 名非白人)。

图3 代谢物-疾病关联图谱分析结果

 

2. 代谢物-疾病关联图谱

分别针对流行病和突发疾病,对代谢物与疾病之间的关系进行了横断面(逻辑回归)和前瞻性(Cox比例风险回归)分析。发现低密度脂蛋白中胆固醇与总脂质比例(L-LDL-C%)是与众多疾病强关联的代谢物。亚组分析显示,近一半的关联在性别和年龄组中具有独特性,例如,某些高密度脂蛋白相关代谢物对女性的肝脏疾病具有保护作用,但在男性中却与风险增加相关。表明代谢物与疾病的关系在性别和年龄间存在显著异质性。

图4 代谢物-疾病关联分析结果图谱

 

3. 代谢物和性状关联分析

进一步分析代谢物与性状之间的关系,发现代谢物与健康相关性状之间存在62,887个显著关联,主要集中在饮食偏好和体格测量方面。在影像性状中,发现了10,752个显著关联,主要与心脏和主动脉功能相关。

图5 代谢物-性状关联分析结果图谱

图6 代谢物和成像性状关联分析

 

4. 代谢物和表型之间的关联

此外,计算了代谢物在不同疾病和性状组的类别分布。结果显示,脂蛋白和脂质是与疾病和性状最常相关的代谢物类别。脂肪酸和代谢比率分别位列第二和第三大最常关联的类别。随后作者分别在白人和非白人血统群体中对识别的关联进行了验证。

图7 代谢物-成像性状关联及疾病共享关联的综合图谱

 

5. 不同时间点的代谢物变化评估描绘疾病进展

通过嵌套病例对照设计,研究进一步描绘了疾病诊断前15年内的代谢物变化轨迹。在前瞻性分析发现的显著关联中,57.5%的代谢物在疾病诊断前十年以上就已开始发生变化。通过聚类分析,将疾病根据其发病前的代谢轨迹分为44个集群。例如,集群1(包含代谢和心血管疾病)的代谢物在15年前就表现出持续异常,而集群27(包含血液恶性肿瘤)的代谢物在诊断前5-10年才开始出现显著变化。

图8 不同时间点代谢物变化的评估可以描述疾病和衰老

 

6. 分析代谢物随年龄的变化模式

年龄作为衡量人类健康的首要指标,研究分析了在40至70岁间代谢物的变化,并将其聚类为6种代谢物簇。利用DE-SWAN方法,发现血浆代谢组在衰老过程中存在两个显著的“波动”高峰,分别出现在46岁和64岁左右。不同聚类中的代谢物在这两个年龄点呈现出不同的变化趋势,表明衰老是一个动态的、非线性的过程。

图9 代表性代谢物在中老年阶段的变异模式

 

7. 构建机器学习模型用于疾病诊断与预测

研究利用机器学习构建了代谢风险评分(MetRS),MetRS 在 81 种新发疾病 和 94 种已有疾病中表现出优秀的鉴别能力(AUC > 0.8),尤其在内分泌代谢疾病(如2型糖尿病AUC=0.863)和心血管疾病中表现突出。关键代谢物如肌酐、GlycA和白蛋白具有广泛的预测价值。并且MetRS与人口学信息结合后,在超过60%的疾病中提供了显著的附加预测价值。

图10 基于机器学习的MetRS促进疾病预测

 

8. 通过遗传学方法推断因果关系与共享遗传结构

为推断因果关系,研究进行了孟德尔随机化和共定位分析。孟德尔随机化分析确定了454对具有潜在因果关系的代谢物-疾病关联,其中402对存在共享的遗传决定因素(共定位)。白蛋白是与最多疾病(15种)存在因果联系的代谢物。rs11591147(PCSK9基因) 是介导多种心血管代谢疾病与代谢物关联的核心位点。此外,研究还识别出反向因果关系,表明部分疾病(如溃疡性结肠炎、慢性肾病)也可能影响代谢物水平。

图11 孟德尔随机化揭示了各类疾病中的候选因果代谢物

 

 

小结

该研究通过整合流行病学、机器学习和遗传学方法,创建了迄今最全面的人类代谢组-表型组图谱,强调了代谢物作为疾病早期预测价值,验证了机器学习模型在疾病鉴别中的效用,并通过遗传学方法推断了潜在的因果关系。同时,文章也指出了研究的局限性,包括人群血统相对单一、NMR技术覆盖的代谢物范围有限,以及孟德尔随机化分析中多效性等固有挑战。总而言之,这项开放获取的人类代谢组-表型组图谱提供了一个前所未有的全景视角,将有力推动精准医学的发展。

 

 

参考文献

[1]You J, Cui XH, Chen YL, et al. Mapping the plasma metabolome to human health and disease in 274,241 adults. Nat Metab. 2025;7(11):2366-2384. 

 

 

中科优品推荐

【中科新生命】非靶代谢组——队列精准版:顶刊思路,去伪存真,生物学视角加速标志物发现,严格的队列4D质控保障。

滑动图片查看更多>>>

 

 

 

关于中科新生命

 

 

上海中科新生命生物科技有限公司(APTBIO)创立于 2004 年,由原中国科学院上海生命科学研究院蛋白质组研究中心孵化而来,是国内质谱多组学应用领域的开拓者。公司以 “AI + 质谱多组学” 双核驱动创新,构建智能化组学生态。拥有自主知识产权的质谱检测平台与 AI 大数据分析系统,聚焦科技服务、生物医药及大健康消费三大领域,为全球科研机构、医院、药企提供从基础研究到临床转化的一站式解决方案。融合多组学技术与人工智能,围绕生物标志物发掘、药物靶点筛选及个性化诊疗等方向,构建具有国际竞争力的组学数据库与算法模型,推动转化医学进程,加速创新药物研发,成为推动生命科学数字化升级的核心引领者。