New Phytologist (IF 10.151) | 植物代谢组助力极端环境的预测
代谢组学由于其带有组学推断和环境影响的印记,是预测植物环境的优秀综合系统。目前最佳理想型的作物产量停滞不前,并受到气候变化的威胁。在这种情况下,了解野生植物在极端生态系统中的适应能力,从而为了解新的适应机制提供了机会。先前的研究发现在高山、沙漠和盐地收获的植物中适应极端环境的相关代谢簇,如氨基酸、类胡萝卜素和多酚类,但是大多数研究都是针对独特或数量有限的物种。2022年4月 Thomas Dussarrat团队在New Phytologist(IF 10.151)上在线发表了题为“Predictive metabolomics of multiple Atacama plant species unveils a core set of generic metabolites for extreme climate resilience”的文章。该文将多物种的植物代谢组学和基于机器学习的广义线性模型(GLM)预测相结合,将代谢组与植物环境联系起来,使用通用代谢机制来适应极端生长条件,为全球生态化学和应激生理学提供了应用前景。
研究材料
阿塔卡马沙漠沿海拔梯度生长的 14 个科的 24 种植物及11种作物和观赏植物的地上部分。
技术路线
· 步骤1:阿塔卡马沙漠极端条件下的植物多样性研究;
· 步骤2:预测代谢组学揭示了多个适应性物种的核心代谢组;
· 步骤3:预测变量的注释和通路分析;
研究结果
1. 阿塔卡马沙漠极端条件下的植物多样性研究
阿塔卡马沙漠是植物生存环境最恶劣的地区之一,其中植物必须承受目前威胁农业的主要非生物胁迫。作者根据优势物种在自然生态系统中的覆盖范围从19个站点中收集了14 个科的24种植物,涵盖一年生和多年生植物、不同的碳固定系统(即 C3、C4和CAM)以及灌木和草本等不同的生命周期,代表相关的生物多样性。还根据植物科水平选择了 11 种农艺和观赏物种,并分析了阿塔卡马物种之间以及阿塔卡马与农艺或观赏植物物种之间的分类关系(图1)。
图1 阿塔卡马植物多样性研究
2. 预测代谢组学揭示了多个适应性物种的核心代谢组
为了深入了解这些植物适应阿塔卡马沙漠极端条件和响应环境变化的机制,作者进行了多平台代谢组学分析,共检测到了4911 个变量。鉴于植物化学多样性随着海拔梯度的环境条件而波动,而海拔代表了非生物因素的综合,作者使用GLM 去测试4911 个变量是否可以预测环境条件。首先,评估了根据其生物量和沿海拔梯度的覆盖率选择的五种不同植物物种计算海拔水平的可能性,从 500 个模型得到的平均R2(即计算和测量海拔之间的拟合)在 0.88 和 0.96 之间,表明植物代谢组整合了环境变化,环境条件引发了特征代谢模式,其中化合物与海拔高度相关。其次在整个数据集上使用 GLM分析, 发现66个预测变量可以极大地预测植物环境(79%),而与物种和科水平无关。最后使用由 2014 年收获的 9 种阿塔卡马植物数据集进一步验证这种预测的稳健性,结果证实植物具有一组核心代谢物以适应环境限制(图2)。
图2 阿塔卡马植物的预测代谢组学分析
3. 预测变量的注释和通路分析
作者对66个最佳预测变量进行了注释分析,最终保留了39个预测变量,且对平均 R2 没有显著影响,其中最佳的预测变量是淀粉。同时在几种农艺和观赏植物中也发现了阿塔卡马植物物种的预测变量,证明了这些代谢物的普遍存在。进一步通路分析发现超过一半的预测变量参与次级代谢(56%),而初级代谢和调节因子(如茉莉酸)共占 31%。总之,一组核心代谢物能够独立于植物物种预测 79% 的植物环境,同时也证实了支持植物适应环境限制的通用代谢途径的中心位置(图3)。
图3 预测变量的通路分析
4. 预测变量与环境因素之间的关系研究
海拔高度与阿塔卡马沙漠中的大多数环境参数密切相关。作者进行了一项结合 PCA 和 O2PLS 的分析,以揭示海拔因素并突出 39 个最佳预测变量与环境因素之间的关系。结果表明,海拔的判别能力主要是由温度、太阳辐照度、土壤含水量和几个土壤因素决定(图4)。
图4 预测变量与环境因素之间的关系研究
小编小结
综上所述,文章使用植物代谢组和机器学习算法,筛选出39 种常见化合物以79%的准确度预测植物环境,且这些代谢物独立于物种,表明植物代谢组可作为环境波动的优秀综合预测因子。
中科优品推荐
【中科新生命】可提供基于高质海量数据库的非靶向植物代谢组学服务,同时实现初生代谢物和次生代谢物的检测分析,助力植物方向研究。