检测线粒体基因的表达量是一个数据分析质控指标。除了部分特殊类型的细胞(如卵细胞)。如果定位到线粒体的比例高,表明细胞质量较低,这可能是细胞凋亡增加所致,也有可能是组织本身的特征。
seurat分析中,默认采用LogNormalize归一化算法。该归一化对低表达的基因没有影响。
肿瘤细胞具有异质性,目前暂无特异的marker基因能将恶性细胞和正常细胞区分开来。在实体肿瘤项目的研究中,推荐使用单细胞拷贝数变异(CNV)分析来区分恶性细胞和正常细胞。目前主流的分析软件有inferCNV,inferCNV需要一组正常细胞作为参考,通过热图就能够看出肿瘤基因组中的哪些区域发生了扩增或缺失,从而帮助判断肿瘤细胞
在定义细胞类型的时候,会遇到某个cluster不表达已知的marker基因,这种情况不代表这个cluster就无意义,因此会保留该cluster,并定义为Unknown。对于这类细胞,可以参考差异基因富集结果或根据细胞表达的基因功能来定义细胞类型。
可以。可以直接计算出每个细胞中这些marker基因的表达比例,然后挑选高表达(需要确定高表达的阈值)这些基因的细胞做后续分析。