Method Article
Se describe en este documento un ensayo mediante el acoplamiento de identificación de ADN metiltransferasa adenina (DamID) a alto rendimiento de secuenciación (DamID-ss). Este método mejorado proporciona una mayor resolución y un rango dinámico más amplio, y permite el análisis de datos DamID-Seq en conjunción con otros datos de secuenciación de alto rendimiento tales como chip-ss, RNA-Seq, etc.
The DNA adenine methyltransferase identification (DamID) assay is a powerful method to detect protein-DNA interactions both locally and genome-wide. It is an alternative approach to chromatin immunoprecipitation (ChIP). An expressed fusion protein consisting of the protein of interest and the E. coli DNA adenine methyltransferase can methylate the adenine base in GATC motifs near the sites of protein-DNA interactions. Adenine-methylated DNA fragments can then be specifically amplified and detected. The original DamID assay detects the genomic locations of methylated DNA fragments by hybridization to DNA microarrays, which is limited by the availability of microarrays and the density of predetermined probes. In this paper, we report the detailed protocol of integrating high throughput DNA sequencing into DamID (DamID-seq). The large number of short reads generated from DamID-seq enables detecting and localizing protein-DNA interactions genome-wide with high precision and sensitivity. We have used the DamID-seq assay to study genome-nuclear lamina (NL) interactions in mammalian cells, and have noticed that DamID-seq provides a high resolution and a wide dynamic range in detecting genome-NL interactions. The DamID-seq approach enables probing NL associations within gene structures and allows comparing genome-NL interaction maps with other functional genomic data, such as ChIP-seq and RNA-seq.
ADN metiltransferasa identificación adenina (DamID) 1,2 es un método para detectar la proteína-DNA in vivo y es un enfoque alternativo a la cromatina immunoprecipitation (CHIP) 3. Se utiliza una cantidad relativamente baja de células y no requiere la reticulación química de la proteína con el ADN o un anticuerpo altamente específico. Este último es particularmente útil cuando la proteína diana está vagamente o indirectamente asociada con el ADN. DamID ha sido utilizado con éxito para mapear los sitios de unión de una variedad de proteínas, incluyendo proteínas de la envoltura nuclear, la cromatina asociada 4-10 11-13 proteínas, enzimas modificadoras de la cromatina 14, factores de transcripción y co-factores 15-18 y maquinarias RNAi 19. El método es aplicable en múltiples organismos incluyendo S. cerevisiae 13, S. pombe 7, C. elegans 9,17, D. melanogaster 5,11,18,20, A. thaliana 21,22, así como de ratón y células humanas líneas 6,8,10,23,24.
El desarrollo del ensayo DamID se basó en la detección específica de fragmentos de ADN adenina-metilado en células eucariotas que carecen de adenina endógena metilación 2. Una proteína de fusión expresada, que consiste en la proteína de unión a ADN de interés y E. ADN metiltransferasa coli adenina (Dam), puede metilar la base adenina en las secuencias GATC que están en proximidad espacial (más significativamente dentro de 1 kb y hasta aproximadamente 5 kb) a los sitios de unión de la proteína en el genoma 2. Los fragmentos de ADN modificados se pueden amplificar específicamente y se hibridaron a microarrays para detectar los sitios de unión genómicas de la proteína de interés 1,25,26. Este método original DamID estaba limitada por la disponibilidad de microarrays y la densidad de sondas predeterminados. Por ello, hemos integrado secuenciación de alto rendimiento ena DamID 10 y designado el método DamID-ss. El gran número de cortos lee genera a partir DamID-ss permite la localización precisa de la proteína-DNA del genoma de ancho. Encontramos que DamID-ss proporciona una mayor resolución y un rango dinámico más amplio que DamID de microarrays para el estudio de la lámina genoma nuclear (NL) 10 asociaciones. Este método mejorado permite sondear asociaciones NL dentro de las estructuras de genes 10 y facilita las comparaciones con otros datos de secuenciación de alto rendimiento, tales como chip-ss y ARN-ss.
El protocolo DamID-ss aquí descrito fue desarrollado inicialmente para el mapeo de asociaciones del genoma NL 10. Hemos generado una proteína de fusión mediante la inmovilización del ratón o Lamin B1 humano a E. coli DNA metiltransferasa adenina y se prueba el protocolo en 3T3 fibroblastos embrionarios de ratón, ratón C2C12 mioblastos 10 y IMR90 fibroblastos de pulmón fetal humano (datos no publicados). En este protocolo, empezamos con constructing vectores y expresar proteínas de fusión Dam-atados por la infección lentiviral en células de mamíferos 24. A continuación, se describen los protocolos detallados de amplificación de fragmentos de ADN adenina-metilado y la preparación de bibliotecas de secuenciación que deberían ser aplicables en otros organismos.
1. Generación y expresión de proteínas de fusión y Dam gratuito Proteínas
-Metilados Adenina 2. amplificar fragmentos de ADN
3. Preparación Biblioteca de secuenciación de alto rendimiento
La proteína de fusión Dam-V5-LMNB1 se verificó a ser co-localizada con la proteína Lamin B endógeno mediante tinción de inmunofluorescencia (Figura 1).
La amplificación por PCR con éxito de fragmentos de ADN adenina-metilado es un paso clave para DamID-ss. Las muestras experimentales deberían amplificar un frotis de 0,2 - 2 kb mientras que los controles negativos (sin DpnI, sin ligasa o sin plantilla PCR) debería resultar en no-o-claramente menos de amplificación (Figura 2).
Los fragmentos de ADN metilado están en el intervalo de 0,2 a 2 kb, mientras que el tamaño del inserto deseado para una biblioteca de NGS es de 200 a 300 pb. Por lo tanto, es esencial para fragmentar los productos de PCR de metilo en el rango de tamaño adecuado. Sin embargo, se encontró que era poco práctico para romper simultáneamente fragmentos de ADN más grandes a un tamaño adecuados y mantener la mayoría de los fragmentos más pequeños de ADN intactos en una sola duración de fragmentación. Por lo tanto, se realizaron experimentos de tiempo para determinar el tiempo mínimo (T 0.2kb) necesarios para fragmento de 1 g de ADN a un frotis de centrado a 200 pb (Figura 3). Entonces 6 duraciones de tiempo en incrementos iguales fueron seleccionados entre 5 min y T 0.2kb para la fragmentación real. La actividad enzimática de la doble cadena de ADN Fragmentase puede variar de un lote a otro y puede disminuir con el tiempo, por lo que se recomienda repetir este paso para un nuevo lote de Fragmentase o después del almacenamiento durante un período de tiempo.
El tamaño del inserto deseado es entre 200 y 300 pb correspondiente a los fragmentos de ADN entre 300 y 400 pb (incluyendo 121 adaptadores de secuenciación pb) en el gel de agarosa. Tres rebanadas delgadas dentro de este rango fueron extirpados de cada muestra experimental para reducir el rango de tamaño de una biblioteca y aumentar la posibilidadla obtención de al menos una biblioteca de secuenciación cualificado (Figura 4).
Una alícuota de 5 l de cada biblioteca de ADN amplificado se analizó en el gel de agarosa para determinar qué biblioteca puede calificar para la secuenciación. Como se muestra en la Figura 5A, una banda única clara del mismo tamaño que la porción de gel escindido debe ser visible en el gel de agarosa (etapa 3.7.4). A continuación, las bibliotecas seleccionadas fueron examinados por un Bioanalyzer (Figura 5B) para determinar el rango de tamaño exacto y las concentraciones antes de la secuenciación. Si se desea, las bibliotecas de ADN amplificados pueden ser examinados directamente por un Bioanalyzer sin análisis en gel. Cuando varias bibliotecas son de buena calidad, se recomienda para secuenciar las bibliotecas de tamaño similar rangos para un par de experimentales (las células que expresan Dam-V5-POI) y control (células expresando V5-Dam) muestras.
El corto lee generada porsistemas de secuenciación fueron asignadas primera vuelta al genoma correspondiente. Únicamente alineado lecturas fueron luego se pasa a los análisis posteriores. Una tubería para procesar corta lee, construir un mapa interacción genoma NL y analizar las asociaciones de genes NL fueron descritos en detalle en nuestro trabajo anterior 10. Los resultados representativos se muestran en la Figura 6.
Figura 1. Validación de subnuclear localizaciones de las proteínas de fusión por la tinción de inmunofluorescencia. IMR90 células de fibroblastos de pulmón humano se transfectaron transitoriamente con un plásmido que expresa Dam-V5-LMNB1 y se tiñeron por anti-Lamin B (A, rojo) y anti-V5 (B, verde). (C) Combinar de imágenes en A y B. Haga clic aquí para ver una versión más grande de tsu figura.
Figura 2. PCR amplificar fragmentos de ADN adenina-metilado. Una alícuota de 5 l de cada reacción de PCR se analizó en un gel de agarosa al 1%. Una mancha que van de 0,2 a 2 kb se amplificó a partir de cada muestra experimental, pero no se observó amplificación en los controles negativos (sin DpnI en el paso 2.1, sin ligasa en el paso 2.2, o ningún molde de PCR). Haga clic aquí para ver una versión más grande de esta cifra.
Figura 3. Determinación de duraciones óptimas de fragmentación. Los productos de PCR de metilo purificado estaban sujetos a la fragmentación para duraciones de tiempo a partir de 5 a 55 min en un incremento de 10 min (ADN sin digerir , Etiquetado como "0 min"). 1 g de escalera de ADN y 0,5 g de cada muestra de ADN fragmentado se analizaron en un gel de agarosa. El tiempo mínimo de digerir la mayoría de la frotis de ADN a alrededor de 200 pb se determinó que era alrededor de 35 min, por lo tanto, se seleccionaron seis duraciones de tiempo espaciados uniformemente entre 5 y 35 min (5 y 35 min incluido) para llevar a cabo la fragmentación real. Por favor haga clic aquí para ver una versión más grande de esta figura.
Figura 4. Tamaño de seleccionar las bibliotecas de ADN. Muestras de ADN de Dam-V5-LMNB1 y V5-Dam desde el paso 3.6 se corrieron en un gel de agarosa al 2%, y tres rodajas de gel de igual tamaño (L, M y H que corresponde a baja, media y alta en tamaño) fueron extirpados entre 300 y 400 pb como se muestra por las líneas amarillas. om / archivos / ftp_upload / 53620 / 53620fig4large.jpg "target =" _ blank "> Haga clic aquí para ver una versión más grande de esta figura.
Figura 5. bibliotecas de ADN amplificado para secuenciación de alto rendimiento. (A) Amplified bibliotecas de ADN analizadas en un gel de agarosa. Plantillas de PCR se purificaron a partir de rodajas de gel mostrados en la Figura 4. (B) Bioanalyzer resultados de la muestra V5-Dam (L) y la muestra Dam-V5-LMNB1 (L) que se subraya en (A). Estas dos bibliotecas tenían los rangos de tamaño estrecha similares y, por tanto cualificado para alta secuenciación rendimiento. Por favor haga clic aquí para ver una versión más grande de esta figura.
jpg "/>
Figura 6. Los datos NGS se muestran en la UCSC genoma navegador. Cromosoma 1 del ratón se muestra como un ejemplo. Los datos de secuencia se producen a partir de mioblastos C2C12 de ratón 10. Tracks "MB.LmnB1.w2k" y "MB.Dam.w2k", que corresponde a los datos de las células que expresan Dam-V5-LMNB1 y V5-Dam, respectivamente, de la trama normalizado densidades de lectura (lee por kilobase por millón asignada únicamente lee, o RPKM ) en consecutivos que no se superponen las ventanas 2 kb a lo largo del cromosoma. Seguir parcelas "MB.log2FC.w2k" asociaciones genoma-NL, es decir log2 RPKM proporciones de LMNB1 más de la presa, en una resolución de 2 kb. Pista "MB.sLADs" pinta Lamina Asociados dominios basados en la secuenciación (slads, es decir, las regiones genómicas que tienen mayores densidades de lectura de LMNB1 sobre la presa con significación estadística) en, no slads negros en las regiones grises y indeterminados en blanco. Haga clic aquí para download este archivo.
Whether Dam-tagged proteins retain the functions of endogenous proteins should be examined before a DamID-seq experiment. The subcellular localization of Dam-tagged nuclear envelope proteins should always be determined and compared with that of the endogenous proteins. For studying transcription factors, it is suggested to examine whether the Dam-fusion protein can rescue the functions of the endogenous protein in regulating gene expression. This functional test can be performed in organisms in which knockout mutants of endogenous DNA-binding proteins are available. Because advances in genome engineering have potentially allowed knocking out any endogenous gene of interest, functions of Dam-tagged DNA-binding proteins can be examined in cultured mammalian cells.
The critical step in this protocol is to successfully fragment the DpnII-digested DamID PCR products to around 200 bp. This step is designed to render the amplified adenine-methylated fragments to a narrow size range for sequencing and to randomize the starting nucleotides of the DNA fragments in a sequencing library. Inefficient fragmentation will leave the majority of the DNA fragments starting with GATC (the 5'-overhang from the second DpnII digestion), and will result in a much lower performance and yield or even a failure in Illumina sequencing. Other DNA fragmentation methods may be used as an alternative approach.
The resolution of DamID (and DamID-seq described here) is limited by the frequency of GATCs in the genome to be studied. Moreover, even with high throughput sequencing, the genomic localizations of a DNA-binding protein can only be mapped within two consecutive GATCs rather than to the actual DNA-binding sites.
Despite its limitation, the DamID assay has important advantages. Because DamID does not require highly-specific antibodies, it can be used to detect a subset of nuclear proteins that could be difficult to assay by ChIP (such as the nuclear envelope proteins). To study how these proteins regulate genome functions, it is important to integrate and cross-analyze their genome-wide localization data with the current epigenomic mapping data (such as data from the ENCODE and NIH Roadmap Epigenomics Projects 30,31). The DamID-seq approach provides both higher resolution and higher sensitivity than DamID by microarray and enables detecting differential NL-associations within gene structures 10. A combinatorial analysis of DamID-seq data, ChIP-seq data 32 and gene expression data has identified a class of NL-associated genes with distinct epigenetic and transcriptional features (data not published).
Another advantage of DamID is that it only requires a small number of cells. In recent years, there has been an explosion in single cell analysis of gene regulation 33,34. Although genome sequence 35, genome-wide gene expression 36 and chromatin conformation 37 can be assayed in a single cell, there has not been an available approach for detecting protein-DNA interactions genome-wide in a single cell. DamID-seq is a highly promising approach for this goal, and may complement the single cell imaging approach in detecting the dynamics of genome-NL interactions 38. One complication is that because the Dam-fusion protein is expressed at a much lower level than the endogenous protein in the DamID assay, it is possible that the Dam-fusion protein may only occupy a subset of genomic binding sites as compared to the endogenous protein.
DamID assay has mostly been used in cultured animal cells to detect protein-DNA interactions. Notably, developmental biologists have applied this assay in detecting protein-DNA interactions in specific cell types in vivo. For example, Dam-tagged RNA polymerase II was expressed specifically in Drosophila neural stem cells to detect their genome-wide occupancy without cell isolation 39. DamID-seq will be highly useful to study the genome-wide localizations of nuclear envelope proteins, transcription factors and chromatin regulators during development in animal models.
The authors have nothing to disclose.
We thank Dr. Bas van Steensel for providing the DamID mammalian expression vectors. We thank Yale Center for Genome Analysis and the Genomics Core in Yale Stem Cell Center for advice on preparing NGS libraries and implementing high throughput DNA sequencing. This work was supported by the startup funding from Yale School of Medicine, a Scientist Development Grant from American Heart Association (12SDG11630031) and a Seed Grant from Connecticut Innovations, Inc. (13-SCA-YALE-15).
Name | Company | Catalog Number | Comments |
ViraPower Lentiviral Expression Systems | Life Technologies | K4950-00, K4960-00, K4970-00, K4975-00, K4980-00, K4985-00, K4990-00, K367-20, K370-20, and K371-20 | |
Gateway BP Clonase II Enzyme Mix | Life Technologies | 11789-020 | |
Gateway LR Clonase II Enzyme Mix | Life Technologies | 11791-020 | |
DNeasy Blood & Tissue Kit (250) | QIAGEN | 69506 or 69504 | |
Gateway pDONR 201 | Life Technologies | 11798-014 | |
293T cells | American Type Culture Collection | CRL-11268 | |
Trypsin-EDTA (0.05%), phenol red | Life Technologies | 25300-054 | |
DMEM, high glucose, pyruvate | Life Technologies | 11995-065 | |
Fetal Bovine Serum | Sigma | F4135 | |
Tris | brand not critical | ||
EDTA | brand not critical | ||
200 Proof EtOH | brand not critical | ||
Isopropanol | brand not critical | ||
Sodium Acetate | brand not critical | ||
DpnI | New England Biolabs | R0176 | supplied with buffer |
DamID adaptors "AdRt" and "AdRb" | Integrated DNA Technologies | sequences available in ref. 24; no phosphorylation of the 5' or 3' end to prevent self-ligation. | |
T4 DNA Ligase | Roche Life Science | 10481220001 | supplied with buffer |
DpnII | New England Biolabs | R0543 | supplied with buffer |
DamID PCR primer "AdR_PCR" | Integrated DNA Technologies | sequences available in ref. 24 | |
Deoxynucleotide (dNTP) Solution Set | New England Biolabs | N0446 | 100 mM each of dATP, dCTP, dGTP and dTTP |
Advantage 2 Polymerase Mix | Clontech | 639201 | supplied with buffer |
1Kb Plus DNA Ladder | Life Technologies | 10787018 | 1.0 µg/µl |
QIAquick PCR Purification Kit | QIAGEN | 28104 or 28106 | |
MinElute PCR Purification Kit | QIAGEN | 28004 or 28006 | for an elution volume of less than 30 µl |
SPRI beads / Agencourt AMPure XP | Beckman Coulter | A63880 | apply extra mixing and more elution time if less than 40 µl elution buffer is used |
Buffer EB | QIAGEN | 19086 | |
NEBNext dsDNA Fragmentase | New England Biolabs | M0348 | supplied with buffer |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202 | |
T4 DNA Polymerase | New England Biolabs | M0203 | |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210 | |
T4 Polynuleotide Kinase | New England Biolabs | M0201 | |
Klenow Fragment (3’ → 5’ exo-) | New England Biolabs | M0212 | supplied with buffer |
sequencing adaptors | Integrated DNA Technologies | sequences available in ref. 28 | |
Quick Ligation Kit | New England Biolabs | M2200 | used in 3.4.3; supplied with Quick Ligation Reaction Buffer and Quick T4 DNA Ligase |
sequencing primer 1 and 2 | Integrated DNA Technologies | sequences available in ref. 28 | |
KAPA HiFi PCR Kit | Kapa Biosystems | KK2101 or KK2102 | supplied with KAPA HiFi DNA Polymerase, 5x KAPA HiFi Fidelity Buffer and 10 mM dNTP mix |
agarose | Sigma Aldrich | A4679 | |
ethidium bromide | Sigma Aldrich | E1510-10ML | 10 mg/ml |
QIAquick Gel Extraction Kit | QIAGEN | 28704 or 28706 | |
iTaq Universal SYBR Green Supermix | Bio-Rad Laboratories | 1725121 or 1725122 | |
Spectrophotometer | brand not critical | ||
0.45 μm PVDF Filter | brand not critical | ||
25 ml Seringe | brand not critical | ||
10 cm Tissue Culture Plates | brand not critical | ||
6-well Tissue Culture Plates | brand not critical | ||
S1000 Thermal Cycler | Bio-Rad Laboratories | ||
C1000 Touch Thermal Cycler | Bio-Rad Laboratories | for qPCR | |
Vortex Mixer | brand not critical | ||
Dry Block Heater or Thermomixer | brand not critical | ||
Microcentrifuge | brand not critical | ||
Gel electrophoresis system with power supply | brand not critical | ||
Magnet stand | for purification of DNA with SPRI beads; should hold 1.5-2 ml tubes; brand not critical | ||
UV transilluminator | brand not critical | ||
E-gel electrophoresis system | Life Technologies | G6400, G6500, G6512ST |
Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos
Solicitar permisoThis article has been published
Video Coming Soon
ACERCA DE JoVE
Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados