【Nature Methods】讲座精华回顾 | TMTpro揭开药物靶点筛选及激酶功能研究新篇章
药物靶点筛选的标记蛋白质组学解决方案、磷酸化修饰的激酶功能研究、大队列研究标记定量的批次效应难题。这些问题是不是正在困扰着您呢?本期回顾给您一一解答,并附上各位老师关注的热点问题及专家解答。
4月20日晚,Nature Methods 论文第一作者(美国哈佛大学医学院李嘉铭博士)为大家带来关于新一代标签技术TMTpro的精彩讲座,主要围绕标记定量蛋白质组学的前沿技术发展以及TMTpro的技术原理及应用案例展开,并分享发表于Cell Reports酵母磷酸化与蛋白组学的研究成果。讲座中提及在蛋白质组学研究中经常遇到的问题,如多次标记的批次效应问题,磷酸化蛋白质与蛋白质组学背景问题,激酶与磷酸酶和底物等功能调节关系,新一代TMTpro串联标签技术的应用前景等。
Part1 标记标签技术背景及进展介绍
讲座第一部分介绍了TMT的背景以及新型标记定量技术路线(SL-TMT)的实验过程。TMT标记定量相对于传统shotgun 策略开展大规模组学,有三大优点,1.一次性处理的样本通量提高;2. 标记定量的方法缺失值少;3.通过标记方式定量灵敏性和准确性大大提高。这对于即将开展蛋白质组学纠结选择label free或者标记定量的老师们可以参考下哦。
图1 TMT标记定量的优势
新型的标记定量的技术路线SL-TMT,可实现蛋白样本酶解后直接标记,优化前处理步骤,并进行三级碎裂的方式减少共洗脱等现象带来的干扰,提高定量准确性。其中有个细节小编注意到,在肽段标记完成以后,要做label check,确保标记效率较高且组间较为平行,这个细节是标记定量可靠的基础和前提。
图2 SL-TMT标记定量流程
Part2 酵母大规模蛋白及磷酸化组学研究
第二部分,李博士分享了2019年发表在《Cell Reports》上的题目为”Investigation of Proteomic and Phosphoproteomic Responses to Signaling Network Perturbations Reveals Functional Pathway Organizations in Yeast”的研究成果。以酵母为研究对象,对110种激酶和磷酸酶敲除前后的酵母进行大规模蛋白质组学和磷酸化组学分析,共进行了28组TMT标记, 通过定量以及生信方法分析激酶和磷酸化酶的功能调控。文献结果小编总结为三个关键问题:大队列标记定量的批次效应问题,磷酸化与蛋白质组学背景问题,激酶与磷酸酶功能研究问题。采用大规模队列标记定量组需要注意批次效应的考察,通过总峰面积归一法,搭桥比值化和截尾平均数中心化等处理来进行校正,消除批次效应。
图3 批次效应考察
在磷酸化与蛋白质组学背景问题方面,约有50%的磷酸化存在因蛋白背景变化而引起磷酸化变化的情况。这一点提示到对磷酸化感兴趣的老师们,想做磷酸化组学实验,可以同步做一个蛋白质组学。可以考量一下磷酸化的变化是否由于蛋白本身的背景变化引起。小编要预告下,中科新生命即将推出蛋白组学和磷酸化组学联合分析,为大家提供更加丰富的分析内容。
图4 磷酸化组学与蛋白组学背景分析
但话又说回来,虽然蛋白质层面会对磷酸化变化有一定的背景影响,但蛋白质组学检测也不仅仅作为背景存在,做简单的扣除后就抛弃了,这就大错特错了,蛋白质组学结果也反映了蛋白层面的功能变化,建议同步分析,而不是做简单舍弃。李博士在文章也提到,后续功能分析也是从磷酸化和蛋白质组学两个水平进行,只是考量磷酸化变化程度的时候额外考虑蛋白背景。并且作者也介绍了本文中激酶或者底物分析方法,根据敲除前后的表达量趋势来推测。比如下图C中就是敲除某激酶或磷酸酶后差异蛋白变化的趋势来推测可能和激酶或者磷酸化的关系。
图5 蛋白与磷酸化调控网络分析
在激酶与磷酸化功能研究方面,作者运用到多种分析手段,包括基因功能分析,基因相关性网络分析和分子协同网络分析。基因功能分析首先根据激酶或者磷酸酶敲除后的磷酸化位点的表达趋势,进行底物关系推测。然后借助差异表达磷酸化位点的功能或参与典型通路等特征来推测所关注的激酶调控功能。基因相关性网络分析主要通过相关性系数,寻找与之相关性较强的分子,进而发现所参与的相关或相似的信号通路。另外可进行分子协同网络分析,进而根据某蛋白相互作用网络中连接紧密的蛋白功能来推测该激酶或者蛋白的功能。
图6 蛋白与磷酸化相关性分析
图7 蛋白分子网络预测未知蛋白功能
图8 激酶与磷酸酶相关功能研究
Part3 新一代TMTpro技术及应用案例
讲座的最后,着重介绍了近期发表的Nature Methods的关于新一代标记技术TMTpro的背景原理,测试效果比对以及应用案例。
图9 TMT标记系统发展
首先对TMTpro标记肽段稳定性、仪器条件差别、蛋白鉴定深度及定量稳定性进行一一测试比对,结论是未发现明显差别。
确定TMTpro方法效果可靠性,作者用新一代的标记技术进行实际应用。
案例一是采用8种细胞系,实验设计是采用mTOR抑制剂Torin1进行处理,一次性标记在同一个TMTpro中,通过24 fractions的分级鉴定,进行处理前后大规模蛋白及磷酸化组学变化研究,鉴定到9000多种蛋白质和7000多个磷酸化位点。通过高通量TMTpro发现在较短时间内实现了蛋白及磷酸化的深度覆盖,发现了未曾报道过的变化蛋白。充分体现了TMTpro的实验设计的通量灵活性及蛋白鉴定深度。
图10 TMTpro应用案例1实验设计
图11 TMTpro应用案例1鉴定结果展示
案例二是药物靶点筛选的研究实验设计,以HCT116细胞系为研究对象,分为对照组、低浓度处理组、高浓度处理组,每组5个生物学重复。研究发现定量结果中更少的缺失值,并且检测到的激酶数量多于传统标记策略。新一代的标记系统TMTpro,可一次性进行多个浓度的小分子处理和更多的生物学重复设计,大大减少了不同实验带来的误差,对于药物靶点的领域应用有极大的灵活性,为小样本量的药物靶点研究的老师提出了很好的解决方案。
图12 TMTpro应用案例1鉴定结果展示
讲座最后,李嘉铭博士总结了新一代标记技术TMTpro的应用潜力-更高通量,更深覆盖,更节约时间,更加灵活。
图13 TMTpro应用总结
本期讲座回顾到此结束,感兴趣的老师可以联系我们获取视频回放,再次感谢各位老师的信任与支持。
中科新生命拥有超15年的质谱服务经验,现提供TMT16标蛋白组学服务,一次性标记16个样本,更可靠,消除多批次标记不平行问题,可定量蛋白数提升20%。更便宜,无需搭桥,节省内标样本费,费用可省近万元。详情请来电咨询400-066-6761或021-54665263。
附上各位老师关注的热点问题及专家解答。
4月15日丁琛教授《蛋白质组学和转录因子》
1、TFRE序列涵盖的转录因子识别序列覆盖了多少比例?
基本上能达到非常高的覆盖度,比方100多种不同的序列,但实际最终鉴定出的这个转录因子接近到1500,最新的数据能达到1400多种。实际上都是被覆盖了,而且不止一次覆盖,不止一种覆盖,很多的转录因子都有覆盖。
2、TFRE方法在质谱采集及鉴定中,怎样去除与非转录因子蛋白干扰?
没办法去除,TFRE鉴定出来的蛋白,一部分是转录因子,也有很多是非转录因子,因质谱非常灵敏,所以能鉴定大量的非转录因子,但对照组比较准确的话,比方说不同的地点、不同的时间、不同的细胞,普通的刺激等等,实际操作时能很好去排除这些非转录因子的干扰。
3、讲座中提到目前蛋白组学的瓶颈有鉴定深度和低丰度蛋白,除了转录因子,其他的有没有好的解决方法可以解决这些问题?
低丰度蛋白如膜蛋白,主要采用富集的办法。翻译后修饰,磷酸化、泛素化均属于低丰度,都是采用富集方法,另外是用抗体检测。
4月15日朱洪文博士《定量蛋白质组学方法在大队列肿瘤研究中的应用》
1、请问DIA数据有缺失值要补吗?用什么方法补空白?
是否进行填补看个人需求,并不绝对。可分别进行填补或不填补,并对数据进行分析,比较结果,常用方法有KNN方法。
2、拷贝数为什么会影响丰度?顺反式效应的蛋白是如何确定的?
通过对拷贝数变异(CNA)数据与蛋白质的丰度数据进行相关性分析,筛选统计学上显著的CNA-protein相关性得到。顺式效应指影响同一染色质区域基因表达的蛋白质丰度,呈现在CNA-protein相关性图上为对角线区域;反式效应指影响到其它染色质区域基因表达的蛋白质丰度,呈现在CNA-protein相关性图上为列区域。
3、请问如果有些蛋白的磷酸化位点非常多,怎么确定哪些位点比较重要呢?
质谱的数据只能告诉哪些位点发生磷酸化,或者哪些位点在研究的生物学过程中丰度发生变化。至于具体的功能可以结合一些数据库的信息进行考察,比如蛋白结构的信息(比如某个位点位于蛋白的活性区域、与其它蛋白的相互作用区域等);或者进行湿实验对磷酸化位点进行突变和后续功能验证。
4、检测到磷酸化变化,但是没有相应的抗体怎么办?
可以考虑SRM和PRM等靶向方法进行检测。
4月16日讲座沈诚频博士《DIA数据挖掘进展和展望》
1、从长远来看,dDIA和建库的DIA哪个更主流一些,或者从鉴定效果上来说,更推荐哪一个?
DIA建库目前还是最灵敏的方法,长远看预测建库应该可以逐渐替代DDA建库的方法,不过这个方法在假阳性验证上还存在一定困难,所以要普及的话还需要进一步的验证和优化,这也是我们目前在做的。
2、是否推荐用Spectronaut的q-value percentile选项减少缺失值的产生?还是用q-value选项过滤后自己进行缺失值填充?
Spectronaut缺失值没有进行特别优化,所以大样本量建议自行后处理。
3、请问临床样品使用一次DDA实验的结果建库的话,和DIA的结果匹配度不会比较低吗?
DDA临床样品建库我们一般建议每个group挑10个-20个样品混合建库,可以先做DIA,最后样品都准备完了全部混合再建库。当然有些我的用户就是直接DIA分析不建库,定性数量略少但是少掉的大部分是低丰度,重复性较差的蛋白对他们来说也不是关注重点。
4、现在大规模血浆样本,不去高峰度,推荐DIA吗,是否方法成熟,结果可靠?
大规模血浆样本不去高峰度目前Biognosys那边也是采用和我刚才介绍的组织一样的方法,做过1500+例样品,不去高峰度重复性还是很好的。如果手工做这个就得看操作的人了。
4月20日讲座李嘉铭博士 《TMT标记系统在大规模酵母蛋白质及磷酸化的应用以及TMTpro标记定量》
1、关于batch effect的问题,能否再介绍一下大队列样本标记消除batch effect的实验设计的方法以及数据处理的方法?
实验设计时可以采用某些技术重复进行不同标签的标记,在数据分析时可以通过总强度值归一,平均数做矫正,通过PCA等分析观察批次效应问题,可参见CELL文献具体介绍。
2、在标记定量的组学结果中,软件匹配完以后有少量的没有定量信息的蛋白出现,请问这是什么原因导致的?
出现少量没有定量值的现象,有两个可能的原因,一是信噪比过低的话,可能背景干扰会比较大,因此不进行定量。另外一个原因可能是母离子纯度,如果母离子干扰比较大的,认为定量干扰也比较大,因此也仅有定性结果。但如果出现大量没有定量值的结果,可能是实验会有一定问题,需要进行具体分析。
3、请问磷酸化组学是否可以做到绝对定量?
目前还是比较困难,一般大规模样本做到相对定量。