新闻资讯

干货分享 | 多组别实验设计及分析思路

2021-12-12
中科新生命
1719

实验设计对于高通量组学数据分析尤为重要。在转录组学研究中,小样本量(eg:实验组vs对照组)的实验设计,通过分析两组间的差异得到不同条件下的差异基因,可以解释单因素带来的影响。但对于连续变化的生命进程发展趋势,则代表意义有限。这就要求研究者们利用大样本量建立转录组分析数据库。在多组别的转录组实验设计中,设置不同处理梯度,(浓度或时间),进行多组比较分析,可以有效的挖掘基因的表达规律,揭示复杂生物学现象背后的机理。
随着多组别实验的开展,不仅可以提供两组之间的差异信息,同时也可以呈现生命活动的动态变化趋势,从而帮助研究者在一个实验中获取更加全面的数据信息。但多组别实验的数据量较大,分析时更为复杂。如果没有合适的分析手段,那么数据挖掘会陷入僵局。那如何更加有效地利用大样本量转录组数据发文呢?下面的篇幅就交给小编,带您从杂乱无章的转录组数据中抽丝剥茧,拨开迷雾见青天。
#01 趋势分析
趋势分析,也叫趋势聚类,顾名思义就是在不同梯度样本中对具有相同变化模式或者趋势的变量进行归类。通常趋势分析包含梯度和实验变量两个维度数据。这里的梯度,可以是不同的处理时间、药物浓度/剂量、疾病恶化程度、生长周期等;而变量,则是随着梯度条件不同生物体状态所发生变化的对象,如基因的表达量。这样的解释难免显得晦涩,小编深知,实践是检验真理的唯一标准,我们一起来看一个案例,揭开趋势分析的神秘面纱。

    

玉米转化高度基于胚愈伤组织的形成,胚愈伤组织主要来源于未成熟玉米胚的盾片细胞。然而,在玉米中仅鉴定出少数几个与愈伤组织诱导有关的基因。为了揭示与玉米愈伤组织诱导有关的潜在基因,文章对含有2,4-二氯苯氧乙酸(2,4-D)培养基上培养0、1、2、4、6和8天的玉米胚胎进行了RNA测序。在这篇文章中,随着实验组别的增加,数据量也是不断的增加,为了获得关键数据,作者利用趋势分析对数据进行了深度挖掘,将数据分成8个cluster,分别对这8个cluster进行富集分析,发现cluster2和3中的基因显示与愈伤组织的形成有关,然后结合转录因子分析,进一步阐明cluster2中的ZmBBM2基因是玉米愈伤组织形成过程中的关键因子,再通过转基因实验验证,文章轻松到手。从这篇文章中可以看出,面对如此庞大的转录组数据分析,趋势分析在整个数据挖掘过程中起着举足轻重的作用[1]。
#02 Upset plot
在转录组数据分析过程中,经常需要针对某几组样本进行共有和特有基因的可视化展示,基于此需求,通常可以选择Venn分析进行可视化展示。然而,当我们需要分析的样本分组信息过多,Venn分析就无法有效的展示出不同分组之间共有和特有的基因信息。面对这样的问题,【中科新生命】推出可视化神包—Upset,以解决多组别之间共性与特性基因集的分析需求。

RNA-Seq越来越多地用于在全基因组范围内测量人类RNA的表达。可以通过获得基因的表达谱以鉴定和对治疗反应性基因进行功能表征。最终,此类研究有望揭示有关治疗效果的分子机制的见解,识别生物标志物,并实现个性化医学。在本文中,作者从三价流感疫苗(TIV)接种之前和TIV疫苗接种后10个时间点的5名受试者收集的外周血单核细胞(PBMC)和B细胞样品中提取的RNA,拟发现TIV疫苗接种后PBMC和B细胞中的关键转录事件。文章首先通过差异分析,鉴定在疫苗接种后的每一天与疫苗接种前相比的差异基因,对于这两种细胞类型,大多数差异基因在接种疫苗前均被上调,为了更加有效的展示比较组之间共有和特有差异基因,文章采用Upset进行集合的可视化,更加直观的揭示疫苗接种前后的差异变化。随后针对upset筛选出的两种细胞类型共有和特有基因集进行功能富集分析,两种细胞类型在多个与细胞周期相关的途径中富集,包括Reactome细胞周期的有丝分裂,细胞周期和DNA复制等。基于该模块的富集结果证实了细胞周期相关模块的富集,揭示了PBMC和B细胞的增殖特征[2]。
各位看官,以上的分享是否为您的实验设计带来了些灵感?如果您想了解更多玩转多组别组学数据的方法,赶紧联系我们吧!
参考文献
[1] Du X , Fang T , Liu Y , et al. Transcriptome Profiling Predicts New Genes to Promote Maize Callus Formation and Transformation[J]. Frontiers in Plant Science, 2019, 10:1633.
[2] Jensen T L , Frasketi M , Conway K , et al. RSEQREP: RNA-Seq Reports, an open-source cloud-enabled framework for reproducible RNA-Seq data processing, analysis, and result reporting[J]. F1000research, 2017, 6:2162.
转录测序服务介绍