基于单细胞RNA-Seq测序数据的差异基因分析
文献综述
摘要:人类各组织之间细胞类型,状态何相互作用差异巨大,而单细胞RNA测序技术提供了在单细胞水平观测基因表达的方法,可以更好的研究相同细胞之间的基因差异表达而导致的各种疾病原因,从而找到解决的方法。单细胞RNA测序是一种强大而深刻的从单细胞水平分析基因表达的方法。随着单细胞RNA测序技术的发展,越来越多的测序方法随之出现,紧随着其出现的是单细胞测序数据的差异表达分析方法,大约可以归为三类:传统的假设检验方法、针对Bulk数据的差异表达分析方法、针对单细胞数据的差异表达方法。为了寻找一种最合适的差异表达分析方法,本文将从这三类中选择目前最流行的五种差异表达分析方法重现,分别是DEsinle、SigEMD、SCDE、DESEq2、edgeR。分析这五种方法的优缺点,分别适用哪些场合。比较在相同单细胞数据集的情况下哪种差异表达分析方法是最适合这些数据的。
关键词:单细胞测序 RNA-Seq 差异表达分析方法
THEME: Differential gene analysis based on single cell RNA-Seq sequencing data
Abstract: There are great differences in cell types, states and interactions among human tissues. Single cell RNA sequencing technology provides a method to observe gene expression at the single cell level, which can better study the causes of various diseases caused by gene differential expression between the same cells, so as to find a solution. Single cell RNA sequencing is a powerful and profound method to analyze gene expression from single cell level. With the development of single cell RNA sequencing technology, more and more sequencing methods appear, followed by differential expression analysis methods of single cell sequencing data, which can be divided into three categories: traditional hypothesis testing methods, differential expression analysis methods for bulk data, and differential expression methods for single cell data. In order to find the most suitable method for differential expression analysis, we will select five most popular methods from these three categories, namely DEsinle、SigEMD、SCDE、DESEq2、and edgeR. The advantages and disadvantages of these five methods are analyzed, and which occasions are applicable respectively.To compare which differential expression analysis method is most suitable for the same single cell data set
Keywords: Single cell sequencing RNA-Seq Differential expression analysis
前言
单细胞测序技术是在2000年代后期取得重大突破之后才被广泛应用开来,取代了微阵列。无论是传统的bulk RNA-Seq还是scRNA-Seq,差异表达分析是比较两组不同样本集中的基因表达信息异同的基本方法。可以获得一组样本相对于另一组样本的基因表达显著上调(up-regulated)和显著下调(down-regulated),从而进一步研究这些差异表达基因的功能。由于单细胞测序技术的局限性,单细胞测序数据一般都具有高噪音,有较高的dropout问题,即很大一部分的低表达或中度表达的基因无法有效检测到。所以,以前针对传统多细胞转录组测序数据开发的差异表达检测方法或软件不一定完全适用于单细胞测序数据,若想比较不同亚型或不同条件下的细胞表达差异,为了得到可靠结果,需要选择一个好的差异表达分析方法。
本次毕业论文研究的是目前最流行的五种基因差异表达分析方法,选择出其中研究效果较好的一个用来研究单细胞测序数据。
研究目的与意义
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。