技术服务

技术服务

Research Areas

研究领域

蛋白基因组学Proteogenomics

合作交流

Proteogenomics是近两年来肿瘤精准治疗领域的热点方向。2016年美国癌症登月计划(Cancer Moonshot 2020)让精准医学正式落地。同年,美国VA、DoD、NCI三部门联合宣布将建立第一个同时进行基因信息和蛋白信息表征的医学系统,把基因组和蛋白质组作为常规检测手段,对癌症病人进行个性化蛋白基因组(Proteogenomics)表征,为更精准的用药提供指导。

blob.png

在学术界,早在2013年,《Nature》上发表的一篇关于子宫内膜癌的多组学研究,就开启了学术界采用蛋白基因组模式开展肿瘤精准分型、精准治疗研究的热潮。随后《Nature》、《Cell》等顶级期刊上陆续发表了colon and rectal cancer、breast cancer、Ovarian Cancer等肿瘤的大队列Proteogenomics研究

◆◆ 什么是Proteogenomics?

Proteogenomics是一种多组学分析体系,简单来说就是将基因组、转录组、蛋白组,以及翻译后修饰组(肿瘤研究主要关注磷酸化修饰组)的大数据整合起来,从多分子层面的大数据重新定义疾病的分型、挖掘潜在的治疗靶点,最终在蛋白水平上发现与验证肿瘤相关基因突变、表达变化及关键分子调控机制,以进行更精准的用药指导和药物开发。


◆◆ 为什么要进行Proteogenomics?

(1) 从生命规律上来说:在“基因>RNA>蛋白”的中心法则中,每一个节点上都存在着后调控,如转录调控、翻译调控、翻译后调控。包括Proteogenomics在内的大量的研究数据表明,基因与转录层面的结果,与蛋白质的表达结果并不完全一致。尤其是,蛋白质还存在及其复杂的翻译后修饰调控(如磷酸化、乙酰化、泛素化修饰等),对于蛋白的功能极其重要。而蛋白质是真正的功能分子,是生命活动的实际执行者,而且大部分的疾病标志物、药物治疗靶点都是蛋白质。所以,蛋白质代表着疾病诊断、治疗的最准确指标和真正方向。

(2) 从技术上来说:虽然蛋白质具有最重要的诊断和治疗意义,但是蛋白质的大规模组学在技术层面还存在很多技术瓶颈。其中关键问题是,目前的蛋白质组分析技术还无法实现对复杂样本进行从头测序,因此无法对肿瘤发生、发展过程中产生的大量突变、剪切、融合蛋白进行足够高覆盖度地表征。而测序技术目前已经能够实现高广度和高深度地覆盖这些信息。所以,需要基因组和转录组先把这些重要信息测序出来,然后翻译为氨基酸序列,以此作为蛋白质组的数据库,才能实现蛋白质组分析的足够覆盖,更加有效地实现个性化、精准的诊疗应用。


◆◆ 目前的Proteogenomics研究成果告诉我们什么?

(1) 肿瘤样本的测序结果中鉴定到大量SNP、可变剪切等基因变异,只有极少数被检测到在蛋白层面表达(如乳腺癌的数据显示,只有4.1%和0.28%的SNP和可变剪切表达成蛋白)。主要因为,基因转录、翻译过程中存在各种调控机制,以及蛋白的翻译后调控过程(如泛素化);也包括因为目前的蛋白质组技术的灵敏度还无法达到测序技术的水平。


blob.png



(Nature, 2016,534:55)


(2) 表达水平上:基因拷贝数与转录相关性较高,而与蛋白和磷酸化水平的相关性较低(乳腺癌的数据显示:Significant positive correlations (cis) were observed for 64% of all CNA–mRNA, 31% of all CNA–protein, and 20% of all CNA–phosphoprotein pairs)。

blob.png


(3) 不同层面的分子分型,具有一定的差异:如果利用特定的指标进行分型(如乳腺癌的PAM50),则mRNA、蛋白水平数据的分型结果较为一致。但利用mRNA、蛋白以及蛋白磷酸化组学得到的整个数据集,来进行进行重新分型,则不同数据层面呈现出不一样的分型模式。上图为乳腺癌分型,下图为卵巢癌分型:

blob.png


(Nature, 2016,534:55)


(4) 对于特定的蛋白和基因而言,可能存在蛋白水平测定结果与基因水平测定结果不一致的情况,导致其中一种检测忽视了潜在的有意义的指标或靶点。“overexpressed proteomic events not evident in the genomic level in both PDX and human samples, including outlier protein expression of EGFR, and outlier phosphosite expressions of ARAF, BRAF, HSP90AB1, PTPN11 and TOP2A highlighting potential new treatment opportunities in breast cancer.”(Nature, 2016,534:55)

(5) 预后判断的意义:从已发表的卵巢癌的Proteogenomics数据来看,与病人生存期的相关性:磷酸化修饰>蛋白>转录>基因。这个结果我们也很容易理解和想象得到。

blob.png

(Cell,2016,166:755)


上述的结果,无一例外地提示我们,基因、转录、蛋白水平上存在的不一致的情况。蛋白质组水平上的研究对于精准医疗的探索和应用具有重大意义。


产品推荐

修饰表达谱分析(PTM大规模shotgun定性分析)

了解更多 

非靶向代谢组学 (Untargeted Metabolomics)

了解更多 

脂质组学 (Lipidomics)

了解更多 

相关研究

合作交流

请填写您的需求表格,我们会安排专业的工作人员与您联系!

*

*

*

*

*