植物细胞图谱(PCA)计划 | 推动植物科学基础问题研究
2019年2月15日,Trends in Plant Science杂志在线发表了美国卡内基科学研究所Seung Y. Rhee、David W. Ehrhardt和纽约大学Kenneth D. Birnbaum的观点文章“Towards Building a Plant Cell Atlas”,正式提出了构建植物细胞图谱(Plant Cell Atlas, PCA)的计划,目标是绘制高分辨的植物细胞分子时空图谱,推动植物科学基础问题的研究。
文献来源:https://www.sciencedirect.com/science/article/pii/S1360138519300214
作者认为,植物细胞是植物生命活动的基础单元,全面深入地描绘植物细胞的特征对于推动相关植物科学问题的研究具有重大意义。因此,类比人类细胞图谱计划(The Human Cell Altas Project),作者提出了植物细胞图谱(Plant Cell Atlas, PCA)计划,旨在建立一个全面描述植物所有细胞类型的状态,整合包含分子、亚细胞、细胞和组织水平多层次、跨尺度的核酸、蛋白和代谢物信息的数据资源库。PCA的核心任务包括描绘细胞和亚细胞蛋白定位特征,追踪蛋白之间动态和多样的相互作用,鉴定不同细胞亚结构的分子组分,识别特定类型细胞过渡和终末状态,最终整合这些信息构建可验证的细胞功能模型。同时,作者设想了两种可能的方式呈现上述信息,一是类似谷歌地图的交互可视化形式,将动态时空信息在不同物理尺度显现,并对于任意尺度的特征提供详细、定量的基因组信息;二是建立植物细胞功能模型在信号、生长、分化和代谢等水平模拟细胞活动。
图1 植物细胞图谱的不同尺度
作者将PCA划分为3个阶段:①初步的工具建立和概念验证;②利用相关技术和工具绘制基础图谱和信息网络;③通过全球合作进一步扩充和完善基础图谱。在本文中,作者着重介绍了建立PCA所需关键技术的进展和需要解决的问题。
基因标记、转化和表达
为实行PCA计划,需要合适的荧光标签来在体内观察蛋白的定位情况。合适的标签插入位置和标签与目标蛋白之间的连接序列的选择非常关键,一个合理的建议是应用一种灵活的、适用于所有融合蛋白的连接序列,然后通过序列分析来评估标签应连接在目标蛋白的N端还是C端。由于过表达可能造成错误的蛋白定位,最好使用自身的启动子序列,另一方面,利用CRISPR原位添加标签将是更理想的选择。此外,瞬时表达能允许更高的通量,运用诱导型启动子可以控制融合蛋白的表达。利用纳米颗粒进行细胞转化的技术已经发展起来,包括电喷射、磁转染和纳米秆介导的电穿孔。如果这些技术应用到植物中,将使对不同植物组织,甚至不同植物物种进行大规模的瞬时转化成为可能。
成像:
在植物体内观察荧光标签蛋白需要灵敏的检测器、快速的捕获和光学切片。搭载高效检测器的转盘共聚焦显微镜和多点扫描满足这些要求。在植物组织成像中,避免细胞壁的光散射现象很重要,尤其是对表皮以下的细胞进行观察时。应用突破衍射极限的超分辨率显微镜,将会看到新的复合体和互作。此外,冷冻电镜的技术革新,包括相关荧光冷冻电镜(Correlated Fluorescence-CryoEM),将在纳米水平上看到细胞中的分子组织。应用先进的成像技术,比如互相关光谱技术(CCS)、扫描荧光相关光谱技术(FCS)、荧光共振能量转移(FRET)、生物发光能量转移(BRET)和双分子荧光互补(BiFC)等,我们能在活细胞中探索蛋白-蛋白互作和蛋白间的动态关系。这些数据可以确定蛋白互作、复合体和网络,从而搭建一个综合性的PCA。
图2 植物细胞图谱的核心技术和三个阶段
蛋白质组学:
大规模蛋白质组学技术对于全面解析植物细胞蛋白-蛋白相互作用和细胞分子机器构成至关重要。在尺度方面,已经出现了诸如AP-MS、CF-MS和双杂交筛选等大规模鉴定蛋白-蛋白相互作用的方法,发现了许多功能未知的全新蛋白复合物;在精度方面,新兴的蛋白质邻近标记技术则摆脱了传统技术对蛋白亲和力的限制,大大提升了对弱相互作用事件的捕获效率。作者认为,如果结合细胞器标记技术和细胞类型特异性表达,可以鉴定不同类型细胞的细胞器蛋白组或细胞状态,蛋白定位和互作图谱的建立可以做到相得益彰。
RNA-seq:
得益于混合序列标签等技术的应用,单细胞测序技术发展迅速,通量已经达到了上万级。高通量的单细胞测序方法为深入解析植物细胞响应内外源信号的状态异质性提供了契机。作者以植物分生组织为例,设想利用单细胞测序技术追踪分生组织细胞随时间序列的发育轨迹,以鉴定分生组织建成的关键阶段。
数据科学:
PCA需要利用很多大数据技术以整合和呈现数据,包括并行计算、数据管理、数据分析和机器学习。PCA的初期阶段有大量机器学习的应用,包括图像组分的检测和描绘、运动的追踪和形态特征的提取。作者认为对于海量的新细胞结构和组分,由于缺乏先验知识,需要诸如基于神经网络的深度学习等无监督机器学习来帮助鉴定和描述。此外,对于PCA的每个阶段,数据的获取、定量、特征识别和注释都需要数据的可视化。对于多维度复杂数据的可视化,作者提出将不同尺度的功能模块按层级组织,利用语义缩放(Semantic Zooming)工具可视化呈现。值得注意的是,PCA所需的定制化和自动化的图像分析软件目前仍然是未解决的关键问题,因此开发适合PCA大规模数据集和密集计算分析的软件是未来的重要任务。
小编心得:
作为国内最早从事蛋白质(组)学研究,以及最早对外开展蛋白质(组)分析服务的老司机,中科新生命积累了超过10年的、成熟的相关经验。在这十多年间,经历了蛋白质(组)学技术飞速发展和普及的历程,从2D凝胶电泳到TMT,从WB到MRM再到PRM,从单蛋白鉴定到组学再到修饰组,从常规蛋白蛋白组到DIA等;也不断目睹了以我们的数据实现公开发表,甚至登上顶级期刊的荣誉殿堂,我们希望能够更多地分享一些自己的经验,为各位老师的蛋白质组学研究之路提供有益的帮助。