Method Article
R 环构成了一类普遍存在的转录驱动的非 B DNA 结构,它们存在于所有基因组中,具体取决于 DNA 序列和拓扑学有利性。近年来,R 环与各种适应性和适应不良作用有关,并与人类疾病背景下的基因组不稳定性有关。因此,许多研究人员对基因组中这些结构的准确定位非常感兴趣。此处描述了 DRIP-seq(DNA:RNA 免疫沉淀,然后进行高通量测序)。这是一种稳健且可重复的技术,允许对 R 环进行准确和半定量的映射。还描述了该方法的最新迭代,其中使用超声处理 (sDRIP-seq) 完成碎裂,这允许对 R 环进行链特异性和高分辨率映射。因此,sDRIP-seq 解决了 DRIP-seq 方法在分辨率和链性方面的一些常见局限性,使其成为 R 环映射的首选方法。
R 环构成了一类普遍存在的转录驱动的非 B DNA 结构,它们存在于所有基因组中,具体取决于 DNA 序列和拓扑学有利性。近年来,R 环与各种适应性和适应不良作用有关,并与人类疾病背景下的基因组不稳定性有关。因此,许多研究人员对基因组中这些结构的准确定位非常感兴趣。此处描述了 DRIP-seq(DNA:RNA 免疫沉淀,然后进行高通量测序)。这是一种稳健且可重复的技术,允许对 R 环进行准确和半定量的映射。还描述了该方法的最新迭代,其中使用超声处理 (sDRIP-seq) 完成碎裂,这允许对 R 环进行链特异性和高分辨率映射。因此,sDRIP-seq 解决了 DRIP-seq 方法在分辨率和链性方面的一些常见局限性,使其成为 R 环映射的首选方法。
R 环是三链核酸结构,主要在转录过程中形成,新生 RNA 转录本与模板 DNA 链杂交。这导致 RNA:DNA 杂交体的形成,并导致非模板 DNA 链在单链环状状态下发生位移。生化重构 1,2,3,4 和数学建模5 与其他生物物理测量 6,7 相结合,已经确定 R 环更有可能发生在表现出特定有利特性的区域。例如,由于与 DNA 双链体相比,DNA:RNA 杂交体的热力学稳定性更高,因此在鸟嘌呤 (G) 和胞嘧啶 (C) 的分布中表现出链不对称性的区域,使得 RNA 富含 G,这种特性称为正 GC 偏斜,因此在转录时倾向于形成 R 环8。已经进化出正 GC 偏斜的区域,例如许多真核基因 4,9,10,11 的早期部分,在体外和体内容易形成 R 环 3,4,12。负 DNA 超螺旋应力也非常有利于结构形成13,14,因为 R 环可以有效地吸收这种拓扑应力,并使周围的 DNA 纤维恢复到有利的松弛状态 5,15。
从历史上看,R 环结构被认为是 RNA 与 DNA 在转录过程中罕见的自发缠结的结果。然而,DNA:RNA 免疫沉淀 (DRIP) 与高通量 DNA 测序 (DRIP-seq) 相结合的发展允许首次对 R 环进行全基因组定位,并揭示这些结构在人类细胞中比预期的要普遍得多 4,16。R 环出现在哺乳动物基因组中数以万计的保守转录基因热点上,偏爱 GC 偏斜的 CpG 岛与基因的第一个内含子和许多基因的末端区域重叠17。总体而言,R 环在人类细胞中共占据基因组的 3%-5%,与其他生物体(包括酵母、植物、果蝇和小鼠)的测量结果一致 18,19,20,21,22。
对人类细胞中 R 环形成热点的分析表明,这些区域与特定的染色质特征相关23。一般来说,R 环存在于核小体占有率较低和 RNA 聚合酶密度较高的区域。在启动子处,R 环与两种共转录沉积的组蛋白修饰 H3K4me1 和 H3K36me3 的募集增加相关17。在基因末端,R 环与紧密排列的基因相关,这些基因经历有效的转录终止17,与之前的观察结果一致24。R 环还显示参与噬菌体、质粒、线粒体和酵母基因组25、26、27、28、29、30、31 复制起点的 DNA 复制起始。此外,76% 的易 R 环人 CpG 岛启动子作为早期组成型复制起点 32,33,34,35 发挥作用,进一步加强了 R 环和复制起点之间的联系。总的来说,这些研究表明 R 环代表了一种新型的生物信号,它可以以上下文依赖性方式触发特定的生物输出23。
早期,在免疫球蛋白类转换重组过程中,R 环显示在类转换序列上形成 3,36,37。这种编程的 R 环被认为通过引入双链 DNA 断裂来启动类别开关重组38。从那时起,有害的 R 环形成,通常被认为是由过度的 R 环形成引起的,与基因组不稳定性和过程有关,例如超重组、转录-复制碰撞、复制和转录应激(回顾 39,40,41,42,43).因此,改进 R 环结构的映射代表了更好地破译这些结构在健康和疾病中的分布和功能是一项令人兴奋且重要的挑战。
DNA:RNA 免疫沉淀 (DRIP) 依赖于 S9.6 单克隆抗体对 DNA:RNA 杂交体的高亲和力44。DRIP-seq 允许对 R 环形成进行稳健的全基因组分析 4,45。虽然有用,但由于使用限制性内切酶来实现温和的 DNA 片段化,该技术的分辨率有限。此外,DRIP-seq 不提供有关 R 环形成方向性的信息。在这里,我们报道了 DRIP-seq 的一种变体,它允许以链特异性方式以高分辨率映射 R 环。该方法依赖于在免疫沉淀之前进行超声处理对基因组进行片段化,因此该方法称为 sDRIP-seq(超声处理 DNA:RNA 免疫沉淀与高通量测序耦合)(图 1)。超声处理的使用可以提高分辨率并限制在 DRIP-seq 方法中观察到的限制性酶联碎裂偏差46。sDRIP-seq 产生的 R 环图与 DRIP-seq 和先前描述的高分辨率 DRIPc-seq 方法的结果非常一致,其中测序文库由免疫沉淀的 R 环结构的 RNA 链构建45。
面对众多可供选择的方法,用户可能想知道哪种基于 DRIP 的特定方法更适合他们的需求。我们提供以下建议。DRIP-seq 尽管存在局限性,但在技术上是最简单的,并且是此处讨论的所有三种方法中最稳健(产率最高)的;因此,它仍然具有广泛的用途。已经发布了大量 DRIP-seq 数据集,为新数据集提供了有用的比较点。最后,生物信息学分析管道更简单,因为数据不会滞留。建议新用户开始使用 DRIP 磨练他们的 R 环映射技能,然后进行定量聚合酶链反应 (qPCR) 和 DRIP-seq。sDRIP-seq 的技术难度略高:由于超声处理(如下所述),产量略有降低,并且测序文库过程略复杂。然而,搁浅和更高分辨率的增益是无价的。值得注意的是,sDRIP-seq 将捕获双链 RNA:DNA 杂交体和三链 R 环。由于文库构建步骤,DRIP-seq 不会捕获双链 RNA:DNA 杂交体。DRIPc-seq 对技术的要求最高,需要更多的起始材料。作为回报,它提供最高的分辨率和搁浅度。由于测序文库是由 R 环或杂交体的 RNA 部分构建的,因此 DRIPc-seq 可能会受到可能的 RNA 污染,特别是因为 S9.6 对 dsRNA 19,47,48 具有残余亲和力。sDRIP-seq 允许进行链特异性、高分辨率的映射,而无需担心 RNA 污染,因为测序文库来源于 DNA 链。总的来说,这三种方法仍然有用,并且存在不同程度的复杂性和略有不同的注意事项。然而,这三者都产生高度一致的数据集48,并且对 RNase H 预处理高度敏感,这是确保信号特异性的重要控制45,49。值得注意的是,鉴于对测序文库施加的大小选择,小杂交种(估计 <75 bp),例如在滞后链 DNA 复制启动位点(冈崎引物)周围瞬时形成的杂交体将被排除在外。同样,由于所有 DRIP 方法都涉及 DNA 片段化,因此需要负 DNA 超螺旋才能保持稳定性的不稳定 R 环将丢失5。因此,DRIP 方法可能会低估 R 环负载,尤其是对于短的、不稳定的 R 环,最好使用体内方法捕获45,48。值得注意的是,在亚硫酸氢钠处理后,R-loop 也可以以 S9.6 非依赖性方式在单个 DNA 分子上以深度覆盖、高分辨率和链特异性方式进行分析12。此外,使用催化失活的 RNase H1 酶的策略已被用于在体内绘制天然 R 环,突出了主要在暂停的启动子处形成的短而不稳定的 R 环 50,51,52。
以下方案针对在培养物中生长的人 Ntera-2 细胞系进行了优化,但它已经成功地适应了一系列其他人类细胞系(HEK293、K562、HeLa、U2OS)、原代细胞(成纤维细胞、B 细胞)以及其他经过小修饰的生物体(小鼠、果蝇)。
1. 细胞收获和裂解
2. DNA 提取
3. DNA 片段化
注:对于基于限制性内切酶的 DRIP-seq,请遵循步骤 3.1。对于基于超声处理的 DRIP-seq,请跳至步骤 3.2。
4. S9.6 免疫沉淀
注:无论 DNA 是通过 RE 还是超声处理进行片段化,免疫沉淀步骤都是相似的。
5. 仅对超声处理的 DNA 进行文库前步骤
注:超声处理导致 R 环的置换 ssDNA 链断裂。因此,三链 R 环结构在超声处理后转化为双链 DNA:RNA 杂交体。因此,在文库构建之前,这些 DNA:RNA 杂交体必须转化回双链 DNA。这里采用了第二链合成步骤。已成功使用的另一种方法是进行单链 DNA 连接,然后进行第二链合成53。
6. 仅针对 RE DNA 的文库前超声处理步骤
注意:DRIP 导致回收长度通常为千碱基的 RE 片段,因此不适合立即构建文库。
7. 文库构建
8. 质量控制
DRIP 和 sDRIP 可以通过 qPCR(图 2A)和/或测序(图 2B)进行分析。免疫沉淀步骤后,必须首先通过对阳性和阴性对照基因座以及 RNase H 处理的对照进行 qPCR 来确认实验质量。 表 2 提供了与多种人类细胞系中常用基因座相对应的引物。qPCR 的结果应显示为输入百分比,这对应于给定基因座裂解时携带 R 环的细胞百分比。在成功的 DRIP 实验中,阴性基因座的产量应小于 0.1%,而对于高度转录的基因座,如 RPL13A ,阳性基因座的产量可以从 1% 到 10% 以上变化(图 2A)。对于 sDRIP,根据 DRIP-qPCR 的判断,产量通常较低 (20%-50%),但似乎对回收率的影响是一致的,因此没有一个特定的 R 环子集受到的影响大于另一个子集。因此,从 DRIP、sDRIP 和 DRIPc 得出的图谱非常一致(图 2B)。qPCR 数据也可以显示为阳性基因座的输入百分比与阴性基因座的倍数富集,从而评估实验的特异性。折叠富集范围通常从最小 10 倍到超过 200 倍不等,具体取决于选择用于分析的基因座。当需要对代表基因敲低、敲除或各种药物治疗的多个样品进行精确定量时,强烈建议在对照中使用加标来标准化样品间实验差异。这种刺突可以对应于合成杂交种53 或不相关物种的基因组54。
DRIP 和 sDRIP 材料可以使用单端或双端测序策略进行测序。与大多数 ChIP 数据类似,可以使用标准计算流程提取和分析数据(有关 DRIP 相关信息,请参见45 )。在接头修剪和去除 PCR 重复后,可以将读数映射到参考基因组并上传到基因组浏览器。DRIP 和 sDRIP 的典型预期输出如图 2B 所示。DRIP 输出由唯一的绿色轨道表示,因为它不允许链特异性,而 sDRIP 显示 R 环映射到分别以红色和蓝色表示的正链和负链。与用 RNase H 预处理的样品相对应的对照轨迹显示信号明显减少,证实了该技术对 RNA:DNA 杂交衍生材料的特异性。在比较输入 DNA 材料的大小时,可以清楚地说明 sDRIP 允许的分辨率增益(图 2C)。sDRIP-seq 的可重复性,以及 RNase H1 预处理的全局影响以及 sDRIP-seq 和 DRIPc-seq 之间的相关性由 图 2D 中的 XY 图描述。
图 1:DRIP-seq 和 sDRIP-seq 程序概述。 两种方法都从为保留 R 环而开发的相同 DNA 提取步骤开始(R 环内的 RNA 链由波浪线表示)。对于 DRIP-seq,使用限制性内切酶对基因组进行片段化,通常会产生千碱基大小的片段,其中嵌入了较短的 R 环。对于 sDRIP-seq,基因组通过超声处理碎裂,这导致更小的片段以及移位的 R 环单链的剪切和丢失(由虚线表示)。使用 S9.6 抗体进行免疫沉淀后,DRIP 可回收嵌入限制性片段中的三链 R 环,而 sDRIP 可回收侧翼 DNA 很少的双链 RNA:DNA 杂交体,从而确保更高的分离度。对于 sDRIP,必须包括文库构建步骤,以将 RNA:DNA 杂交体转化回双链 DNA。如此处所示,这是构建特定于 strand 的文库的机会。正如方案本身所详述的那样,用 RNase H 进行外源性处理代表了两种程序特异性的关键控制;它们未在此处显示。 请单击此处查看此图的较大版本。
图 2:R 环映射策略的结果。 (A) 使用 DRIP 和 sDRIP 方法成功免疫沉淀的 qPCR 结果(对应于 qPCR 检查步骤 4.13)。结果来自人 Ntera-2 细胞在一个阴性位点和两个阳性位点的两项独立实验,包括高度易发 R 环的 RPL13A 位点和中度易发 R 环的 TFPT 位点。y 轴表示免疫沉淀的产量占输入 DNA 的百分比。请注意,DRIP 的回收率比 sDRIP 的回收率略高。(B) 在人 Ntera-2 细胞中进行的 R 环定位结果显示在以 CCND1 和邻近 ORAOV1 基因为中心的区域上。前两个轨道分别对应于 DRIP-seq 结果,分别是没有 RNase H 处理和有 RNase H 处理的结果。用于片段化基因组的限制性内切酶的位置显示在顶部。接下来的六个轨迹代表链特异性 sDRIP-seq 的结果,在 (+) 和 (-) 链之间分解(每个链两个重复),并用 RNase H 预处理,或者不用 RNase H 预处理,如图所示。最后四个轨道代表通过高分辨率链特异性 DRIPc-seq 方法进行 R 环映射的结果(Sanz等人,2016 年;Sanz 和 Chedin,2019 年),其中文库是由 R 环的 RNA 链构建的。可以清楚地看到, CCND1 和 ORAOV1 基因分别导致 (+) 和 (-) 链上形成 R 环,这与它们的方向性一致。正如预期的那样,RNase H 处理消除了信号。(C) 限制性内切酶片段化(左)和超声处理(右)后的起始 DNA 材料显示在琼脂糖凝胶电泳分离材料后。DNA 分子量标准对应于 100 bp 分子量标准,500 bp 条带用星号突出显示。(D) XY 信号相关图显示了 sDRIP-seq 的可重复性(左)、sDRIP-seq 对 RNase H1 预处理的总体敏感性(中)以及 sDRIP-seq 和 DRIPc-seq 之间的全局相关性(右)。所有数据均来自 Ntera-2 人类细胞。 请单击此处查看此图的较大版本。
表 1:PCR 程序设置。 列出了 PCR 循环的持续时间和温度设置。 请点击此处下载此表格。
表 2:用于人类细胞系 qPCR 验证的引物。所有序列均沿 5' 到 3' 方向列出。 请点击此处下载此表格。
这里描述的是两种方案,用于使用 S9.6 抗体在潜在的任何生物体中绘制 R 环结构。DRIP-seq 代表了第一个开发的全基因组 R 环映射技术。这是一种简单、稳健且可重复的技术,允许绘制 R 环沿任何基因组的分布。第二种技术称为 sDRIP-seq,也是稳健且可重复的,但由于包含超声处理步骤和链式测序文库构建方案,因此实现了更高的分辨率和链特异性。这两种技术在免疫沉淀前对 RNase H 处理都高度敏感,证实信号主要来自真正的 RNA:DNA 杂交体。最后,当比较 R 环阳性和 R 环阴性基因座之间的免疫沉淀产量时,两种技术在几种人类细胞系中都提供了高达 100 倍的差异,从而在低背景下提供高特异性定位。
在考虑实施哪种方法时,考虑它们各自的优势和局限性是有用的。如前所述,DRIP-seq 生成的地图分辨率较低,并且没有提供有关 R 环形成的搁浅性的信息。较低的分辨率主要是使用 RE 对基因组进行片段化的产物。这种温和的方法最能保留 R 环,从而允许此类结构的无与伦比的恢复,并使 DRIP-seq 非常稳健。为了规避分辨率有限的问题,同时保持高回收率,可以调整 RE 混合物和/或组合不同 RE 混合物产生的图谱以提高分辨率16。已经开发了一种使用 4 bp 切割器的技术来提高 DRIP-seq 的分辨率,并可能实现链特异性映射22,55,尽管生成的数据集尚未与其他人类数据集进行系统比较。需要注意的是,在基于 RE 的方法中,较大的片段往往可以更有效地回收,因为它们可以携带多个 R 环形成区域。在分析 DRIP-seq 数据集时,必须考虑这种偏差。同样,DRIP-seq 数据的峰值调用最终必须转化为 R 环阳性 RE 片段,因为正是这些片段被免疫沉淀,并且无法推断 R 环在这些片段中的位置。一般来说,建议用户首先采用基于 RE 的 DRIP-seq 来学习该方法并建立他们对实现图 2A 中记录的产量的信心。sDRIP-seq 通常会导致产量降低,这可能导致未经培训的图谱具有较低的信噪比。使用超声处理作为基因组碎片化的手段反过来提供了分辨率的极大改进,因为通常构成大多数 RE 片段的非 R 环部分将被折断,从而允许 S9.6 主要检索 R 环部分(图 1)。值得注意的是,超声处理会导致 R 环的 ssDNA 链置换断裂。因此,在免疫沉淀超声处理的 DNA:RNA 杂交体后添加第二链合成是必不可少的,这会在构建测序文库之前将这些杂交体转化回 dsDNA。如果没有此步骤,唯一可以连接到 dsDNA 接头的片段将是背景 dsDNA 片段;因此,生成的 Map 将没有任何信号。链特异性为理解 R 环形成机制提供了许多进一步的好处,使 sDRIP-seq 成为研究 R 环的首选方法。
重要的是,通过 DRIP-seq 和 sDRIP-seq 获得的图谱代表了 R 环在细胞群中的平均分布;因此,这些技术无法解决单个 R 环的长度和位置。为此,可以利用一种称为单分子 R 环足迹 (SMRF-seq)12 的独立互补方法,以链特异性方式以高分辨率揭示单个 R 环。使用 SMRF-seq 对 20 个不同基因座(包括独立于 S9.6)的 R 环形成进行评估,揭示了单个 R 环足迹的收集与基于 DRIP 的方法收集的种群平均分布之间具有很强的一致性12,为基于 DRIP 的方法提供了强有力的支持。同样重要的是要考虑到 R 环映射数据仅提供 R 环基因组分布的快照,而不提供有关 R 环形成、稳定性和分辨率的动力学信息。尽管如此,仍然可以部署 DRIP 方法,结合特定的药物治疗和通过时间序列对 R 环分布的评估17,53。当目标是表征响应遗传、环境或药理学扰动而改变的 R 环分布时,要牢记 R 环分析方法的局限性尤为重要。除了上面已经描述的那些之外,考虑对新生转录的任何可能变化是关键,因为由于这些结构的共转录性质,这些变化本质上会导致 R 环变化。这些问题和开发严格的 R 环映射方法的指南已被广泛讨论48,56,鼓励读者参考这些研究。
作者声明没有利益冲突。
Chedin 实验室的工作得到了美国国立卫生研究院 (R01 GM120607) 的资助。
Name | Company | Catalog Number | Comments |
15 mL tube High density Maxtract phase lock gel | Qiagen | 129065 | |
2 mL tube phase lock gel light | VWR | 10847-800 | |
Agarose A/G beads | ThermoFisher Scientific | 20421 | |
Agencourt AMPure XP beads | Beckman Coulter | A63881 | |
AmpErase Uracil N-glycosylase | ThermoFisher Scientific | N8080096 | |
Index adapters | Illumina | Corresponds to the TrueSeq Single indexes | |
Klenow fragment (3’ to 5’ exo-) | New England BioLabs | M0212S | |
NEBNext End repair module | New England BioLabs | E6050 | |
PCR primers for library amplification | primer 1.0 P5 (5’ AATGATACGGCGACCACCGAGA TCTACACTCTTTCCCTACACGA 3’) | ||
PCR primers for library amplification | PCR primer 2.0 P7 (5’ CAAGCAGAAGACGGCATACG AGAT 3’) | ||
Phenol/Chloroform Isoamyl alcohol 25:24:1 | Affymetrix | 75831-400ML | |
Phusion Flash High-Fidelity PCR master mix | ThermoFisher Scientific | F548S | |
Quick Ligation Kit | New England BioLabs | M2200S | |
Ribonuclease H | New England BioLabs | M0297S | |
S9.6 Antibody | Kerafast | ENH001 | These three sources are equivalent |
S9.6 Antibody | Millipore/Sigma | MABE1095 | |
S9.6 Antibody | Abcam | ab234957 |
请求许可使用此 JoVE 文章的文本或图形
请求许可This article has been published
Video Coming Soon
版权所属 © 2025 MyJoVE 公司版权所有,本公司不涉及任何医疗业务和医疗服务。