绪论
柳树属于杨柳科柳属(Salix),为落叶乔木,在中国分布广泛,生长速度快,寿命长,抗逆性强,加之树干通直,树形美观,是优良的园林绿化树种,也是农田防护林的常用树种。由于柳树与杨树同属杨柳科,基因组不大、速生且容易繁殖,目前已经成为木本植物遗传学与基因组学研究的理想材料。同时新一代测序技术的飞速发展和成本的降低为我们提供了对柳树这一物种内的许多个体进行测序以建立泛基因组和泛转录组的机会。RNA测序(RNA-seq)已成功用于定义转录组和查找未被注释的新转录本。与基因组测序相比,RNA-seq更经济。
关于主要作物物种的泛基因组的报道在近几年陆续出现。但是国内外关于林木泛基因组,尤其是柳树泛转录组构建及分析的研究报道尚比较缺乏。
1.1二代测序技术
第二代DNA测序技术又称大量并行测序技术,高通量测序技术,以低成本、99% 以上的准确度,1次可对几百、几千个样本的几十万至几百万条 DNA 分子同时进行快速测序分析。Illumina公司的HiSeq应该是目前全球使用量最大的第二代测序机器,该系统采用边合成边测序的方法,即生成新DNA互补链时,加入dNTP通过酶促级联反应催化底物激发出荧光,或者直接加入被荧光标记的dNTP 或半简并引物,在合成或连接生成互补链时,释放出荧光信号。通过捕获光信号并转化为一个测序峰值,获得互补链序列信息。 Illumina测序技术每次只添加一个dNTP的特点能够很好地解决同聚物长度的准确测量问题,它的主要测序错误来源是碱基的替换,目前它的测序错误率在1%-1.5%之间。
1.1.1泛转录组的由来与发展
在漫长的植物进化过程中,由于地域因素、环境因素等的影响,每个植物个体都形成了极其特别的遗传性状,单一个体的基因组已经不能涵盖这个物种的所有遗传信息,所以构建物种或者更高分类等级的泛基因组成了当前基因组学研究的热点和前沿。泛基因组的概念最先在微生物中提出来,通过对细菌多个个体测序发现,个体之间的基因组含量有巨大的差异。研究表明有一部分基因组出现在所有的个体中,称为核心基因组;大量的基因组序列只出现在一部分个体中,称为非必须基因组;还有一些序列只出现在个体中,每个个体特有的基因组,三者之和是这个物种的所有基因序列,称为泛基因组。通过对物种或多个物种进行泛基因组和泛转录组分析,能够检测在驯化和育种过程中的基因保留和丢失、发现遗传变异与表型变异的关系、揭示结构变异对基因差异表达的影响等。
转录组学是特定细胞或组织在特定发育阶段或生理状态下转录出的所有RNA的集合,是连接基因组遗传信息与生物功能的蛋白质组的纽带,是从整体水平研究基因功能、结构,进而解释一些特定生物学过程或分子机理,解释某一阶段特定的组织或者细胞中全部转录本的种类、结构、功能以及转录调控规律的科学,在生物学研究、医学研究、临床研究、药物研发等领域都有极佳的发展前景,植物转录学这一与人类未来息息相关的新兴学科由此诞生。
泛转录组学是应用转录组学的方法研究某一进化分支上所有基因的集合,鉴定出核心基因集合和非必须基因集合,即核心转录本与特异转录本。泛转录组学能够通过研究大规模基因表达的分析来揭示参与特定生命过程的基因及这些基因的状态变化,即从RNA水平上研究基因表达情况。对同一样品进行转录组测序可获得低表达量基因,而对不同样品进行同时测序可以获得样品之间的差异表达基因,对有参考基因组的转录组进行研究可以获得转录本的表达丰度,差异表达基因,转录发生位点,可变剪切位点及转录本SNP等重要生物学信息。
1.1.2 RNAseq技术简介
RNAseq技术一种基于二代测序技术的转录组测序技术,是特定时空条件下产生的所有转录本的集合,包括mRNA和非编码RNA,是连接遗传信息与蛋白组生物功能的组带和桥梁。原理是提取样本总RNA后,根据所测RNA种类进行分离纯化。再进而片段化为所用测序平台所需的长度 (或反转录后片段化),反转录后连接测序接头。接着利用 PCR扩增达到一定丰度上机测序,直到获得足够的序列。所得序列通过与参考基因组比对或从头组装形成全基因组范围的转录谱。所以转录组测序技术可以研究细胞或组织在特定条件下所有转录本信息,可以对基因的转录情况在整体水平上进行研究并对基因进行定位和注释,是研究植物特定生理过程的分子机理的有效手段。且转录组具有通量高,针对性强等特点,可以对样本差异表达基因进行分析,是一个挖掘功能基因资源的重要手段。
1.1.3转录组测序技术在植物适应性方面研究进展
李敏等[[1]]运用Illumina HiSeq高通量测序平台对盐敏感的旱柳沿江柳和耐盐旱柳的杂交F1代根部进行了测序和分析。该研究用提取出的检测合格的柳树总RNA构建cDNA文库并进行RNA-Seq测序分析,将过滤后的原始数据用Trinity拼接,获得了107950条 Unigene,平均长度为1 076,96 bp。通过与 COG、GO 等 8 个数据库比对,60 848 个基因获得注释信息,其中38 182条 Unigene 在 GO 数据库中获得注释,24 101条 Unigene 在 KEGG 数据库中获得注释。GO 和 KEGG 富集分析结果表明,与正常生长的F1代旱柳植株转录组相比,差异表达基因主要调节核糖体代谢、植物激素信号转导等生物学功能。
与此相似,谭玲玲等[[2]]使用Illumina深度测序的方法研究了冷胁迫下高山离子芥的转录组,并通过生物信息学方法比较了高山离子芥和拟南芥冷调节基因的GO功能和KEGG代谢途径网络。该研究构建了两个cDNA文库并进行转录组测序,获得了高山离子芥的54870个unigene(cDNA序列)。GO 和 KEGG 富集分析结果表明,激活蛋白质磷酸化和泛素化可能是高山离子芥快速适应低温环境的机理之一。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。