基于茶花三代数据的线粒体全基因组装配文献综述

 2022-08-03 10:26:34

基于茶花三代数据的线粒体全基因组装配文献综述

摘要:文章主要对从三代数据中组装拼接线粒体全基因组进行较为全面的介绍。概述了其定义、基本原理、实现步骤、解决方法等内容。从第三代测序技术所得数据的特点进行分析,着重应对数据纠错方法,进而对装配基因组的发展现状、主要应用作了简单论述。

关键字:三代测序;基因组;数据纠错;装配

  1. 前言

随着基因组测序技术的进步及测序数据的迅猛增长,DNA测序目前已发展到第三代测序技术,该技术主要有单分子实时测序技术和纳米单分子测序技术。该测序方式对比第二代测序直接对DNA分子测序,不需要模板扩增,具有更高的通量和灵敏度,更长读长及测序费用更低。第三代单分子实时测序技术(SMRT)虽然弥补了第二代测序读长短、受GC含量影响大等局限性,同时时间复杂度较低,模板不用进行扩增,但是其测序的随机错误率较高影响了拼接算法的可行性,进而降低基因组装配的质量。【1】应对第三代测序获得的reads数据准确性低的状况,需要进行高效精确确的数据纠错,进而对全基因组组装拼接。

对此,课题研究主要收集了近六年来,国内外各10篇相关的研究论文。主要分析三代测序数据的纠错算法,以及组装拼接线粒体全基因组所用的工具和方法,从而进行研究,以获得高效精确的成果。

二、关于从三代数据中组装线粒体全基因组的概述

1.植物线粒体全基因组的介绍

1.1植物细胞器全基因组的现状及重要性

植物的细胞器(叶绿体和线粒体)基因组序列为研究植物分子生态及进化提供了重要的资源和信息。随着DNA高通量测序技术的发展,越来越多的植物全基因组被测序。目前研究者们针对各自的研究课题实现了全基因组序列组装,并且应用在许多物种上,然而其组装效率和结果的准确性有待提高。与此同时,一些包含重要的细胞器基因信息的测序序列被当作“垃圾DNA”而丢弃,目前为止仅有1193个植物叶绿体基因组和199个植物线粒体基因组发表于NCBI。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。