新闻资讯

肿瘤分子分型 | Cell:揭秘东亚地区非吸烟人群肺腺癌的早期分子特征

2021-03-25
中科新生命
1672

编者按

肿瘤分子分型:通过NGS、蛋白质组等组学技术,对肿瘤进行分子谱的系统描绘,并根据分子特征谱,进行肿瘤的精准分类及精准诊疗研究。

分子分型已成为国家精准医疗战略的重点研究投入方向;也备受CNS顶刊杂志青睐。

为了帮助广大临床研究者了解肿瘤分子分型及诊疗研究的重大前沿进展,我们收集整理了近几年来发表于Cell、Nature、Cancer Cell等顶刊上的,基于蛋白质组及蛋白基因组的肿瘤分子分型相关研究论文。

【肿瘤分子分型专辑】为大家精细解读重磅研究与进展。

【癌种】:肝癌

【细分癌种】:HBV感染肝细胞癌(HBV-HCC)【地域】:中国大陆

【通讯单位】:复旦大学附属中山医院

【发表时间】:2019年

【涉及组学】:全外显子、转录组、蛋白组、磷酸化修饰蛋白组

【文献出处】:

DOI:https://doi.org/10.1016/j.cell.2019.10.038


主要成果

1. 东亚地区第一个非吸烟肺腺癌的深层蛋白质组学景观2. 确定了年龄、性别相关的内源性和环境致癌物诱变过程3. 蛋白质组信息分类可在早期阶段区分出临床特征4. 蛋白质网络确定肿瘤发生的重要特征、生物标志物和用药靶点

疾病背景

【流行病学】:肺癌是全球最常见的恶性肿瘤和癌症死亡的主要原因,其发病主要归因于直接的烟草暴露。然而在全球,从未吸烟者的发病率仍然是一个严重的健康问题,尤其是在东亚女性当中。在英国大约10%-15%的肺癌患者会出现在从不吸烟的人群中;但在东亚,非吸烟人群中肺癌的发病比例会增加(尤其是女性)。在台湾人群中,从不吸烟患者占主导地位(53%),特别是女性(93%)。此外,早期发病是东亚肺腺癌(Luad)的明显特征,特别是在从不吸烟者中。全球约有20%的I期患者在手术切除后仍复发。【主要驱动基因】:EGFR

研究设计

【主要样本】:LUAD病人经手术切除的癌 VS 癌旁组织

【样本状态】:新鲜冰冻

【样本数量】:103 paired

【治疗干预】:手术前未经放化疗等干预

【主要研究路线与内容】:

1. 单组学分析:组别: 癌 VS 癌旁,42% 男性、58%女性, 83%非吸烟者WES:基因拷贝数、基因突变; 与TCGA队列比较TMT蛋白组 & MRM靶向蛋白组:蛋白鉴定与定量数量;蛋白组与mRNA相关性分析TMT磷酸化蛋白组:修饰蛋白、修饰肽段鉴定与定量数量

2. 整合分析:



主要研究结果

一、多种学检测结果的统计

二、基因突变情况

1. 大多数肺癌肿瘤有EGFR突变(85%),其次是TP53突变(33%)和RBM10(20%)突变。与TCGA不同,C> T转化是台湾(以下简称TW)人群中最常见的。

2.值得注意的是,RBM10和EGFR-L858R突变在女性中较频繁,而KRAS和APC则经常在男性中突变。 KRAS和ATM是吸烟历史患者的显著突变。RBM10突变在老年女性中更为普遍。与其他队列比较,EGFR和RBM10以及两个细胞周期相关基因(CDC27和RB1)在本队列中具有更高的突变频率,而TP53、KRAS和KEAP1的突变在其他研究中的更为普遍。

结论

鉴定了东亚人群非吸烟肺腺癌患者的主要突变基因及其特征,与先前的研究(主要包括吸烟者)存在显着差异。在不吸烟的人群中,排名最高的基因的突变频率也明显不同,这表明TW和TCGA LUAD人群之间的驱动因素显著不相同。

三、肿瘤的转录、蛋白、磷酸化的分子表达特征,及肿瘤发展过程中的动态演进

1. 转录-蛋白相关性分析:

(1)整体样本水平上:主成分分析(PCA)显示,在RNA和蛋白质水平,肿瘤和正常组织均清晰分离;与正常组织相比,肿瘤的变异更大;

(2)表达相关性分析表明:mRNA与蛋白在样本维度的Spearman相关性中值为0.31,基因表达维度的Spearman相关性中值为0.14;仅22%的蛋白质显示与同源RNA的显着正相关;

(3)通路功能方面:蛋白与mRNA具有一定的通路相关性,但在基础细胞功能方面的相关性较低;DNA复制、糖酵解、谷胱甘肽代谢和免疫相关途径在转录水平上调;而DNA修复、蛋白质加工和运输途径以及细胞粘附相关途径的下调,在蛋白质水平上更为明显。

2.NSCLC相关通路的蛋白-磷酸化调控分析:大多数蛋白质及其磷酸化位点受到差异调控,一些蛋白的表达水平下调,但磷酸化修饰水平却上调。Raf/MEK/ERK轴上的磷酸化位点在患者间表现出很高的变异性,这表明MAPK通路的调节因患者而异。

3.  肿瘤进展的分子动态为了研究肿瘤进展的动态过程,按照将患者分为三个不同的分期组:IA期、IB期和RII期,并使用方差分析在蛋白质和RNA水平进行差异表达分析 ,并采用k-均值聚类进一步将差异表达的蛋白质和RNA分成两个簇 。对阶段性上调或下调的簇进行GO功能富集分析发现:在细胞间通讯、信号和质膜中起作用的蛋白质,如整合素、G蛋白偶联受体、离子通道、获得性免疫和抗原递呈,在进展过程中呈现总体负调控趋势;糖酵解、DNA复制、应激反应以及蛋白质加工周转和运输过程中的蛋白质在后期上调;另外DNA复制和修复过程的上调以及纤毛组装基因的丢失在RNA水平上最为突出。

结论

细胞向更晚期癌症阶段的转化的特征是:复制过程中RNA到蛋白质的整体活化,以及参与质膜信号传导和通讯的蛋白质组学成分的负调控。 此外,蛋白质组学和RNA特征代表了肿瘤发展过程中发生的生物过程重塑特点,多组学整合对于识别肿瘤进展过程中分子稳态失调非常重要性。

四、LUAD的蛋白基因组分析:基因突变与mRNA/蛋白/磷酸化的表达关联:

1.  在蛋白水平上的突变:鉴定到319个蛋白的337个突变的肽段。(1)其中驱动基因15个,包括:TP53BP1D358E、RNF213E1272Q、D1331G和KRASG12C等;(2)RBM10的截短突变对RNA和蛋白质水平有负调控作用,而KRAS,LABM1和PIK3CA错义突变仅与蛋白表达增加相关;

2.EGFR突变与MAPK活性变化:(1)EGFR 的突变 (L858R and Del19)对蛋白表达水平的作用不一,但与蛋白磷酸化增加有关。EGFRpY1197与MAP2K2-pT394、MAPK3-pT198/pT202表达一致,进而与pMAPK1及其他下游信号通路相关磷酸化蛋白水平有关;(2)即使在EGFR野生型中,也存在一定程度的MAPK活性。(3)在EGFR野生型病例中,KRAS突变者表现出高MAPK活性。(4)在肿瘤转移期,MAPK表现出低活性。

3. TP53突变: TP53基因座是eQTL和pQTL热点区域。(1)TP53突变与细胞周期基因有强正相关,其中包括来自微染色体维持复合物(MCM)和TOP2A的6个亚基,提示TP53-TOP2A可能具有协同致死效应;(2)TP53突变与KIT致癌基因负相关;(3)TP53与参与DNA缩合和重组的蛋白质和DNA损伤蛋白的较高磷酸化呈正相关。

结论

进一步揭示了基因组特征如何协调LUAD中的蛋白质组和磷酸蛋白质组。研究结果显示MAPK级联内的蛋白质磷酸化协同作用由EGFR和KRAS突变正调控,并且与肿瘤分期和TP53突变负相关。TP53突变与细胞周期基因、参与DNA拓扑调控和DNA损伤反应的磷酸蛋白呈正相关,这与已知的合成致死相互作用是一致的。这些发现可能为后续相关研究及药物干预策略提供依据。

五、内外致突变因素对突变谱及蛋白水平的影响:

1. 突变特征分析:NMF(非负矩阵)法分析突变的三核苷酸序列基序的频率,确认了5个突变谱,并采用余弦相似性分析揭示内源性和外源性诱变剂在突变中的作用。

(1)与TW队列最匹配的突变特征是:5-甲基胞嘧啶的脱氨、APOBEC胞嘧啶脱氨酶、烟草诱变剂暴露,以及二苯并[a,j]吖啶(DBAC);此外还映射到烷基化剂二甲基肼(DMH),模拟太阳辐射(SSR)以及1,8-二硝基芘(1,8-DNP)诱变的特征;

(2)TCGA队列的三个突变谱匹配到了APOBEC和烟草COSMIC特征,以及二苯并蒽(DBA)、DMH和SSR的特征

(3)与TCGA队列相比,亚硝胺和硝基多环芳烃的特征仅在TW LUAD中显著,这与亚洲地区这两类致癌物的高暴露的流行病学证据一致。

2. APOBEC特征性突变分析C>T转换的高比例与APOBEC突变特征有关,因此该研究重点关注了APOBEC特征性突变,并根据富集度评分将队列分为:高APOBEC突变特征组与低APOBEC突变特征组。

(1)44%的患者有较高的APOBEC突变特征,且女性(57%)高于男性(25%);

(2)高APOBEC突变特征和野生型 EGFR的女性患者比低APOBEC突变标签和EGFR激活突变的女性患者更年轻,平均年龄分别为52.9岁和66.3岁。具体而言:高APOBEC突变标签主要集中在74%的年轻女性(<60岁)和所有没有EGFR突变的女性中,而在男性患者中没有观察到类似的趋势;

(3)TCGA队列的生存分析表明,在所有患者、所有女性和没有EGFR激活突变的女性中,低APOBEC突变标签与总生存期延长有关。

(4)高APOBEC突变标签与接受联合免疫治疗(PD-1和CTLA-4)的晚期NSCLC队列的无进展生存期略有延长有关。同时与WT患者相比,EGFR或ALK突变患者的反应较差,这表明EGFR-WT患者是更好的免疫治疗对象。

3. APOBEC特征性突变在蛋白水平与磷酸化水平的传递

(1)蛋白质水平突变:在至少30%的患者中发现了APOBEC突变有关的APOBEC3家族的6个成员,且在女性患者中上调的更为显著,其中APOBEC3F和APOBEC3G的性别差异最显著(p<0.05);

(2)通路相关分析:在高APOBEC突变标签的女性患者的肿瘤中,参与DNA修复和复制的蛋白更为丰富,且这些蛋白的相对log2T/N值与APOBEC3成员呈正相关,特别是与3B、3D、3F和3G;

(3)激酶相关分析:激酶富集分析确定AurB、CK2、CDK1和CDK2是高APOBEC突变标签女性患者组中最高激活的激酶,为具有高APOBEC突变标签的女性患者提供了可行的干预候选方案。

4. 内外环境因素与肿瘤新抗原负荷

(1)  比较APOBEC和致癌样特征,富含烷化剂样特征的肿瘤显示出更多的新抗原,这种肿瘤被称为热肿瘤,具有更多可能被T细胞识别的新抗原,并且更易于进行免疫治疗;

(2)  来自吸烟史患者的肿瘤中,分别与PAH,Nitro-PAH和烷基化剂匹配的IV,III和I突变谱的百分比更高。

(3)  具有突变谱II(辐射样)和V(亚硝胺样)的肿瘤与APOBEC突变标签正相关。

(4)  具有未定义特征的“混合组”(占所有患者的25.8%)由没有APOBEC突变标签的不吸烟者组成,而该组中95%的患者具有EGFR激活突变。

(5)  在女性患者中,年龄较大的组(p = 0.0176)以及具有EGFR激活突变的女性(p = 0.0032)中突变谱III(Nitro-PAHs特征)的分布过高。

5. 受环境因素诱变的染色体区域分布

致癌物相关突变特征富集的染色体区域与TP53、ERBB2、MYC和APC等致癌基因或肿瘤抑制基因区域重叠:EGFR(Chr.7p)区域富集Nitro-PAHs和亚硝胺样先关突变特征,TP53(Chr.17p)和RB1(Chr.13q)的区域富含硝基PAHs相关突变特征,而KRAS(Chr.12q)区域则富含PAHs和烷基化剂相关突变特征。

6. 致癌标志物富集对细胞功能的影响

(1)具有PAH或nitro-PAHs相关突变特征的肿瘤显示与化学致癌物的新陈代谢和解毒相关的途径显著丰富,包括AHR和细胞色素P450途径,已知这两种途径有助于多环芳烃的致癌作用;

(2)nitro-PAHs和亚硝胺类肿瘤主要受DNA修复、ERBB/MAPK通路和TLR/RIG-1 T细胞信号的控制,这些信号可能与肿瘤的启动、细胞增殖、上皮细胞-间充质转化(EMT)恶性进展和早期癌变中的免疫调节有关;

结论

在该不吸烟的队列中,发现了5个与内源性诱变剂和环境因子相似的突变图谱,它们具有不同的年龄和性别相关属性,这在TCGA队列中没有观察到。


C>T转换的高比例与APOBEC突变特征有关,这种突变特征在年轻女性或EGFR-WT患者中显著富集,提示APOBEC突变可能是导致女性LUAD早期发病的关键因素;高APOBEC突变标签女性患者的APOBEC酶和DNA修复途径的蛋白质和磷酸化丰度增加,突显了靶向治疗的机会。与TCGA队列相比,亚硝胺和硝基多环芳烃的特征仅在TW LUAD中显著。除了与APOBEC信号正相关外,亚硝胺标签在IB期、EGFR突变、女性、老年和不吸烟者中显著丰富;Nitro-PAHs标签在男性、高龄和非吸烟者中较高,与APOBEC签名呈负相关;混合组与APOBEC签名呈负相关,而与EGFR突变、女性、老年和不吸烟者呈正相关,表明不同的突变过程以年龄、性别和EGFR突变相关的方式导致不吸烟的东亚患者的LUAD。

六、分子分型分析:

1. 蛋白组学方法将肺癌样本分成三个亚型:亚型1是由最多样本组成的群体,特征为:晚期肿瘤(≥II)、内脏胸膜侵袭肿瘤、TP53突变肿瘤以及最高突变负荷的肿瘤;亚型2由少数早期患者(主要是IA和IB)组成,没有EGFR-L858R突变;亚型3是早期(IA期)阶段的代表,且大部分缺乏TP53突变。

2. 亚型1细分:在亚型1中许多早期肿瘤与晚期肿瘤聚集在一起,因此进一步细分IA期“晚期样”,IB期“晚期样”。与IA期肿瘤相比,有吸烟史和略高突变负荷的IA期“晚期样”肿瘤患者更多,同时几乎所有内脏胸膜侵袭肿瘤的IB期患者为IB期“晚期样”组,以及所有患有双重EGFR-L858R/TP53突变肿瘤的IB期患者都被发现属于“晚期样”肿瘤;

3.亚型的EGFR-L858R特征与生存期:IA期的患者在L858R和Del19 EGFR突变组之间的总体存活率没有差异;但在IB期,EGFR-L858R患者的总存活率明显低于EGFR-DEL19患者。说明蛋白质组的分型能够将EGFR-L858R进行病程的细分。

4. 亚型相关的潜在标志物与药靶:利用差异表达蛋白,定义了一组能够区分早期阶段、早期晚期样及晚期阶段的标志物。并利用标志物及药靶相关数据库进行了进一步的注释。

结论

蛋白质组分型揭示了同一阶段肿瘤的分子异质性,区分了明确的临床早期患者的侵袭性临床特征。蛋白质组学亚型在很大程度上概括了病理分期,在此基础上进一步发现两个主要的EGFR激活突变L858R和Del19与IB期患者预后有关,在IB期进行EGFR突变检测可能有助于患者分层,以区分高危IB期患者,以便进行更密切的随访和可能的辅助治疗。总之,基于蛋白质组学的分类可以将早期NSCLC患者分为与临床结果相关的群体,比临床分期和基因组驱动突变水平获得更多信息。

七、基于蛋白质网络特征,识别蛋白质组亚型的候选生物标记物和药物靶标:

1. 蛋白质网络构建:蛋白组数据进行加权相关网络分析(WGCNA),构建了3,014 nodes和44,665 edges的蛋白网络。mRNA水平的整体相关性较低。叠加在网络上的每种蛋白质组学亚型的相对蛋白质丰富突出了功能上的差异。

2. 亚型的网络特征:亚型1在蛋白酶体、细胞周期和内质网的相关功能显著增加;亚型2具有较高的过氧化物酶体、细胞连接、粘附、信号转导、氨酰基-tRNA生物合成、RAPP复合物和染色质修饰网络富集;亚型3中较高水平的标签包括:细胞因子介导的信号网络、纤毛、细胞粘附和细胞外基质组织、细胞连接和内吞作用;

3. 药靶与标志物:利用已知抑制剂数据库对网络中的靶蛋白进行注释,鉴定出肿瘤微环境相关的一组基质金属蛋白酶(MMP2、MMP11、MMP12和MMP14)作为候选标志物以及药物作用靶点,其中MMP7、MMP11和MMP12在亚型1的晚期和“晚期样”类中表达上调最显著。在对另一组有生存数据的117名早期患者的肿瘤进行了MMPs免疫组织化学染色,证明MMP11和MMP7的强阳性表达与总体生存率差显著相关,提示其潜在的预后价值。

结论

蛋白质网络的构建,不仅提供了决定每个分子亚型的生物学特性的整体视图,而且使潜在药物靶点和生物标志物的选择更加合理。这个整合的网络揭示了多种且不同丰度的免疫细胞类型在肿瘤样本中共存;基质金属蛋白酶(MMPs)在肺癌进展中起着重要作用,尤其是MMP11,可作为潜在的肺癌早期诊断标志物和药物作用靶标。

总结

东亚肺癌的特点是不吸烟者比例高,发病早,且以EGFR突变为主。为了阐明这类人群上截然不同疾病的分子表型,该研究对台湾地区收集的前瞻性队列进行了深入而全面的蛋白质基因组学研究,该队列代表早期的、以女性为主的非吸烟肺腺癌。综合基因组、蛋白质组和磷酸化蛋白质组分析描绘了不同人群的分子属性和肿瘤进展的标志。突变特征分析揭示了与年龄、性别相关的突变机制,其特征是APOBEC突变特征在年轻女性中的高流行率以及环境致癌物样突变特征在老年女性中的过度表达。蛋白质组学信息分类区分了早期EGFR突变患者的临床特征。此外,蛋白质网络分析揭示了支持临床疾病演进的细胞重构过程,并为患者分层和治疗干预提供了候选生物标记物。这种多组学分子特征可能有助于制定早期不吸烟肺腺癌的治疗策略。