人类细胞染色质可及测序信息数据库文献综述

 2022-11-04 10:34:26
  1. 文献综述(或调研报告):
  2. 表观基因组学

真核生物个体的细胞的基因序列是相同的,但真核细胞却在形态和功能上体现出高度的多样性,这来自于DNA的遗传修饰对基因表达的调控。真核生物的DNA分子和组蛋白缠绕形成核小体,核小体堆积而成的高级结构形成染色质,这种层次包装的性质在基因调控中起着中心作用。这种在基因组的水平上研究这类表观遗传修饰的领域被称为“表观基因组学”。

目前人类基因组中编码蛋白质的2%的序列已经得到了相当广泛的研究,但是和表观基因组学相关的非编码基因序列以及遗传修饰等,仍还有很多的研究空间。

表观基因组学的研究对象是能够对基因表达产生影响的修饰因素,主要通过全基因组高通量的测序的方法对于编码在DNA-蛋白质复合物里的表观遗传信息管窥一豹,诸如DNA甲基化,组蛋白修饰,转录因子,核小体位置等。

  1. 开放染色质

染色质分为常染色质和异染色质,常染色质结构的折叠程度相对偏低,因此可以结合其他蛋白质(酶),进行复制和翻译等,这部分染色质就叫做开放染色质。染色质开放性(chromatin accessibility)是指真核生物染色质DNA在核小体或转录因子等蛋白与其结合后,对其他蛋白能否再结合的开放程度。染色质开放性(可及性)可以反映对应区域的基因的表达的调控。

  1. 过去的开放染色质检测方法的局限性

传统的识别开放染色质的方法诸如Dnase-seq和Mnase-seq,其核心思路是开放部位的DNA失去组蛋白的保护,DNA酶可以结合上去把DNA切成片段,使用PCR富集之后通过高通量测序,然后map到基因组上确定被切下DNA的位置,进而量化染色质的开放程度。之后推出的FAIRE-seq利用甲醛固定后使用酚氯仿抽提分离出开放染色质的DNA片段。

(1) 这种Dnase-seq和Mnase-seq两方法的需要大量的细胞数量作为起始素材(例如,DNase-seq需要约50M细胞作为起始素材,FAIRE-seq也需要1-50M个细胞作为起始素材,因此很依赖细胞的体外扩增来达到足够的素材量。但是细胞的体外扩增步骤又有可能使细胞的表观基因组状态发生不可预测的变化,因此会影响检测结果),(2)且需要复杂精细的实验步骤和漫长的实验周期(例如,已发布的一个DNase-seq标准流程包括大约44步实验,和两个通宵的孵化,而已发布的FAIRE-seq标准流程需要两个通宵孵化,至少3天的实验流程),且实验步骤存在多种潜在易丢失信息的步骤诸如adapter ligation,凝胶纯化和交联反转。(3)FAIRE-seq虽然不依赖酶和抗体,但是检测的背景信号水平高,信噪比低,且甲醛交联时间不好掌握。(4)此外,这几种方法不能同时检测核小体定位、染色质可及性和TF结合的相互作用(MNase-seq侧重核小体定位,DNase-seq侧重转录因子结合位点,FAIRE侧重染色质开放区域)。

因为上述的缺点,这几种方法的应用场景受限(例如很难用于临床个体级的检测)

  1. ATAC-seq的原理和优点

ATAC-seq利用了高度活性化的Tn5转座酶。转座子已被证明能在体内与活性调控元件结合,因此使用原核的转座子Tn5,将其搭载的两个接头(已知DNA序列的标签)整合在真核染色质的开放部分。(如Fig.1所示)因为存在位阻的非开放染色质中这种转座更难发生,因此对标签进行PCR建库,用于可达染色质部分的DNA碎片优先生成,通过高通量测序后map回原基因组,即可确定开放染色质分布。

Fig.1 本图展示了Tn5酶在ATAC-seq建库过程中选择性切下开放染色质的DNA片段的方式。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。