Method Article
Descriviamo qui un test con l'accoppiamento di identificazione del DNA adenina metiltransferasi (DamID) ad alto rendimento sequenziamento (DamID-ss). Questo metodo fornisce una migliore risoluzione più elevata e una gamma dinamica più ampia, e permette di analizzare i dati DamID-Seq in combinazione con altri dati di sequenziamento ad alto rendimento, come ChIP-seq, RNA-Seq, etc.
The DNA adenine methyltransferase identification (DamID) assay is a powerful method to detect protein-DNA interactions both locally and genome-wide. It is an alternative approach to chromatin immunoprecipitation (ChIP). An expressed fusion protein consisting of the protein of interest and the E. coli DNA adenine methyltransferase can methylate the adenine base in GATC motifs near the sites of protein-DNA interactions. Adenine-methylated DNA fragments can then be specifically amplified and detected. The original DamID assay detects the genomic locations of methylated DNA fragments by hybridization to DNA microarrays, which is limited by the availability of microarrays and the density of predetermined probes. In this paper, we report the detailed protocol of integrating high throughput DNA sequencing into DamID (DamID-seq). The large number of short reads generated from DamID-seq enables detecting and localizing protein-DNA interactions genome-wide with high precision and sensitivity. We have used the DamID-seq assay to study genome-nuclear lamina (NL) interactions in mammalian cells, and have noticed that DamID-seq provides a high resolution and a wide dynamic range in detecting genome-NL interactions. The DamID-seq approach enables probing NL associations within gene structures and allows comparing genome-NL interaction maps with other functional genomic data, such as ChIP-seq and RNA-seq.
DNA identificazione adenina metiltransferasi (DamID) 1,2 è un metodo per rilevare le interazioni proteina-DNA in vivo ed è un approccio alternativo per immunoprecipitazione della cromatina (ChIP) 3. Esso utilizza una quantità relativamente bassa di cellule e non richiede reticolazione chimica della proteina con DNA o un anticorpo altamente specifico. Quest'ultima è particolarmente utile quando la proteina bersaglio è liberamente o indirettamente associati con il DNA. DamID è stato utilizzato con successo per mappare i siti di legame di una varietà di proteine tra cui proteine dell'involucro nucleare 4-10, cromatina proteine associate 11-13, cromatina modifica enzimi 14, fattori di trascrizione e co-fattori 15-18 e RNAi macchinari 19. Il metodo è applicabile in diversi organismi compreso S. cerevisiae 13, S. pombe 7, C. elegans 9,17, D. melanogaster 5,11,18,20, A. thaliana 21,22 così come topo e cellule umane linee 6,8,10,23,24.
Lo sviluppo del test DamID si è basata sulla rilevazione specifica di adenina-metilato frammenti di DNA nelle cellule eucariotiche che la mancanza adenina endogena metilazione 2. Una proteina di fusione espressa, consistente della proteina legante il DNA di interesse e E. DNA coli adenina metiltransferasi (Dam), può metilare la base adenina in sequenze GATC che sono in prossimità spaziale (la maggior parte in modo significativo entro 1 kb e fino a circa 5 kb) per i siti di legame della proteina nel genoma 2. I frammenti di DNA modificati possono essere specificamente amplificati e ibridati microarray per rilevare i siti di legame genomici della proteina di interesse 1,25,26. Questo metodo originale DamID era limitata dalla disponibilità di microarrays e la densità di sonde predeterminati. Abbiamo quindi integrata high throughput sequencing ina DamID 10 e designato il metodo DamID-ss. Il gran numero di breve letture generata da DamID-ss permette la localizzazione precisa delle interazioni proteina-DNA del genoma-larghi. Abbiamo scoperto che DamID-ss fornito una risoluzione più elevata e una gamma dinamica più ampia rispetto DamID mediante microarray per lo studio del genoma nucleare lamina (NL) 10 associazioni. Questo metodo permette una migliore sondaggio associazioni NL all'interno di strutture geniche 10 e facilita il confronto con altri dati di sequenziamento ad alto rendimento, come ChIP-seq e RNA-Seq.
Il protocollo DamID-ss qui descritto è stato inizialmente sviluppato per la mappatura del genoma-NL associazioni 10. Abbiamo generato una proteina di fusione per legare il mouse o Lamin B1 umana a E. DNA metiltransferasi coli adenina e testato il protocollo di 3T3 fibroblasti embrionali di topo, topo C2C12 mioblasti 10 e IMR90 fibroblasti polmonari fetali umane (dati non pubblicati). In questo protocollo, iniziamo con constructing vettori ed esprimere proteine di fusione Dam-tethered di infezione lentivirale in cellule di mammifero 24. Successivamente, si descrivono i protocolli dettagliati di amplificare frammenti di DNA adenina-metilato e preparare le librerie di sequenziamento che dovrebbero essere applicabili in altri organismi.
1. Generazione ed espressione di proteine di fusione e Free Dam proteine
2. Amplify Adenina-metilati frammenti di DNA
3. Biblioteca Preparazione per High-throughput Sequencing
La proteina di fusione Dam-V5-LmnB1 è stato verificato per essere co-localizzato con il endogena Lamin B proteine mediante immunofluorescenza (Figura 1).
Il successo di amplificazione PCR di frammenti di DNA adenina-metilato è un passo fondamentale per DamID-ss. I campioni sperimentali dovrebbero amplificare una macchia di 0,2 - 2 kb, mentre i controlli negativi (senza DpnI, senza ligasi o senza mascherina PCR) dovrebbe portare a non-o chiaramente meno-amplificazione (Figura 2).
I frammenti di DNA metilati sono nell'intervallo da 0,2 a 2 kb, mentre la dimensione dell'inserto desiderata per una libreria NGS è da 200 a 300 bp. Pertanto, è essenziale per frammentare i prodotti di PCR di metile nella gamma formato adatto. Tuttavia, è stato trovato per essere poco pratico per rompere contemporaneamente frammenti di DNA più grandi a dimensioni adattes e mantenere la maggior parte dei piccoli frammenti di DNA intatto in una singola durata frammentazione. Pertanto, gli esperimenti sono stati eseguiti corso di tempo per determinare il tempo minimo (T 0.2kb) necessario per frammento di 1 ug di DNA ad uno striscio centrato a 200 bp (Figura 3). Poi sono stati selezionati 6 durate di tempo in incrementi uguali tra 5 minuti e T 0.2kb per la frammentazione attuale. L'attività enzimatica della doppia elica di DNA Fragmentase può variare da lotto a lotto e può diminuire nel tempo, quindi si consiglia di ripetere questa operazione per un nuovo lotto di Fragmentase o dopo conservazione per un periodo di tempo.
La dimensione inserto desiderato è compreso tra 200 e 300 bp corrispondente a frammenti di DNA tra 300 e 400 bp (compresi 121 bp adattatori sequenziamento) sul gel di agarosio. Tre fette sottili all'interno di questa gamma sono stati asportati da ciascun campione sperimentale per restringere la gamma di dimensioni di una biblioteca e di aumentare la possibilitàdi ottenere almeno una libreria sequenziamento qualificato (Figura 4).
Un'aliquota di 5 ml di ogni biblioteca DNA amplificato è stato analizzato il gel per determinare quale biblioteca possono qualificarsi per il sequenziamento. Come mostrato in Figura 5A, una chiara singola banda della stessa dimensione della fetta gel escisse dovrebbe essere visibile sul gel di agarosio (fase 3.7.4). Avanti, librerie selezionate sono stati esaminati da un Bioanalyzer (Figura 5B) per determinare la gamma esatta dimensione e concentrazione prima di sequenziamento. Se lo si desidera, le biblioteche di DNA amplificati possono essere esaminati direttamente da un Bioanalyzer senza l'analisi di gel. Quando più librerie sono di buona qualità, si consiglia di sequenziare librerie di dimensioni simili gamme per un paio di sperimentali (cellule che esprimono Dam-V5-POI) e di controllo (cellule che esprimono V5-Dam) campioni.
Il corto si legge generato dasistemi di sequenziamento sono stati mappati torna alla corrispondente genoma. Unicamente allineato letture venivano poi passati alle analisi successive. Una conduttura di elaborare a breve legge, costruire un'interazione mappa del genoma-NL e analizzare le associazioni gene-NL sono stati descritti in dettaglio nel nostro precedente lavoro 10. Risultati rappresentativi sono mostrati in Figura 6.
Figura 1. Convalida localizzazioni subnucleari di proteine di fusione da immunofluorescenza. IMR90 cellule di fibroblasti polmonari umane sono state transitoriamente trasfettate con un plasmide che esprime Dam-V5-LmnB1 e sono state colorate da anti-Lamin B (A, rossa) e anti-V5 (B, verde). (C) Unire di immagini in A e B. Si prega di cliccare qui per vedere una versione più grande di tla sua figura.
Figura 2. PCR amplificare frammenti di DNA adenina-metilato. Un'aliquota di 5 microlitri da ogni reazione PCR è stata analizzata su gel di agarosio all'1%. Uno striscio che vanno 0,2-2 kb è stato amplificato da ogni campione sperimentale, ma nessuna amplificazione è stata osservata nei controlli negativi (nessun DpnI al punto 2.1, non Ligase al punto 2.2, o nessun modello PCR). Cliccate qui per vedere una versione più grande di questa figura.
Figura 3. Determinazione durate ottimali di frammentazione. I prodotti di PCR purificati metile sono stati sottoposti a frammentazione per durate di tempo 5-55 min a un incremento di 10 min (DNA non digerito , Etichettato come "0 min"). 1 pg di DNA ladder e 0,5 mg di ciascun campione di DNA frammentato sono stati analizzati su un gel di agarosio. Il tempo minimo per digerire la maggioranza della striscio DNA di circa 200 bp è stato determinato in circa 35 minuti, quindi sei durate di tempo equidistanti tra 5 e 35 min (5 e 35 min incluse) sono stati selezionati per eseguire la frammentazione attuale. Favore clicca qui per vedere una versione più grande di questa figura.
Figura 4. Formato selezionando le librerie di DNA. Campioni di DNA di Dam-V5-LmnB1 e V5-Dam dal punto 3.6 sono stati eseguiti su un gel di agarosio al 2%, e tre fette di gel uguali dimensioni (L, M e H corrispondente a bassa, media ed alta dimensioni) venivano asportate tra 300 e 400 bp come mostrato dalle linee gialle. om / files / ftp_upload / 53620 / 53620fig4large.jpg "target =" _ blank "> Clicca qui per vedere una versione più grande di questa figura.
Figura 5. librerie di DNA amplificato per alta sequenziamento rendimento. (A) amplificata librerie di DNA analizzati su un gel di agarosio. Modelli di PCR sono stati purificati da fette di gel mostrato in figura 4. (B) Bioanalyzer risultati del campione V5-Dam (L) e il campione Dam-V5-LmnB1 (L) che sono stati sottolineato in (A). Questi due biblioteche avevano gli intervalli di dimensioni simili stretto e quindi qualificato per alta sequenziamento rendimento. Clicca qui per vedere una versione più grande di questa figura.
jpg "/>
Figura 6. dati NGS visualizzati nel UCSC browser genomico. Cromosoma mouse 1 Di seguito riportiamo come esempio. Dati della sequenza sono state prodotte da mioblasti topo C2C12 10. Tracce "MB.LmnB1.w2k" e "MB.Dam.w2k", corrispondenti ai dati provenienti da cellule che esprimono rispettivamente Dam-V5-LmnB1 e V5-Dam, trama normalizzato densità di lettura (legge per kilobase per milione mappata univocamente legge, o RPKM ) a non sovrapposte consecutivi finestre 2 kb lungo il cromosoma. Tieni traccia trame "MB.log2FC.w2k" associazioni genoma-NL, cioè log2 RPKM rapporti di LmnB1 oltre Dam, a 2 risoluzione kb. Traccia "MB.sLADs" dipinge Lamina Associated Domini basato sequenziamento-(slads, ossia regioni genomiche che hanno densità di lettura più elevate di LmnB1 su Dam con significatività statistica) in nero, non slads nelle regioni grigie e indeterminati in bianco. Cliccate qui per download questo file.
Whether Dam-tagged proteins retain the functions of endogenous proteins should be examined before a DamID-seq experiment. The subcellular localization of Dam-tagged nuclear envelope proteins should always be determined and compared with that of the endogenous proteins. For studying transcription factors, it is suggested to examine whether the Dam-fusion protein can rescue the functions of the endogenous protein in regulating gene expression. This functional test can be performed in organisms in which knockout mutants of endogenous DNA-binding proteins are available. Because advances in genome engineering have potentially allowed knocking out any endogenous gene of interest, functions of Dam-tagged DNA-binding proteins can be examined in cultured mammalian cells.
The critical step in this protocol is to successfully fragment the DpnII-digested DamID PCR products to around 200 bp. This step is designed to render the amplified adenine-methylated fragments to a narrow size range for sequencing and to randomize the starting nucleotides of the DNA fragments in a sequencing library. Inefficient fragmentation will leave the majority of the DNA fragments starting with GATC (the 5'-overhang from the second DpnII digestion), and will result in a much lower performance and yield or even a failure in Illumina sequencing. Other DNA fragmentation methods may be used as an alternative approach.
The resolution of DamID (and DamID-seq described here) is limited by the frequency of GATCs in the genome to be studied. Moreover, even with high throughput sequencing, the genomic localizations of a DNA-binding protein can only be mapped within two consecutive GATCs rather than to the actual DNA-binding sites.
Despite its limitation, the DamID assay has important advantages. Because DamID does not require highly-specific antibodies, it can be used to detect a subset of nuclear proteins that could be difficult to assay by ChIP (such as the nuclear envelope proteins). To study how these proteins regulate genome functions, it is important to integrate and cross-analyze their genome-wide localization data with the current epigenomic mapping data (such as data from the ENCODE and NIH Roadmap Epigenomics Projects 30,31). The DamID-seq approach provides both higher resolution and higher sensitivity than DamID by microarray and enables detecting differential NL-associations within gene structures 10. A combinatorial analysis of DamID-seq data, ChIP-seq data 32 and gene expression data has identified a class of NL-associated genes with distinct epigenetic and transcriptional features (data not published).
Another advantage of DamID is that it only requires a small number of cells. In recent years, there has been an explosion in single cell analysis of gene regulation 33,34. Although genome sequence 35, genome-wide gene expression 36 and chromatin conformation 37 can be assayed in a single cell, there has not been an available approach for detecting protein-DNA interactions genome-wide in a single cell. DamID-seq is a highly promising approach for this goal, and may complement the single cell imaging approach in detecting the dynamics of genome-NL interactions 38. One complication is that because the Dam-fusion protein is expressed at a much lower level than the endogenous protein in the DamID assay, it is possible that the Dam-fusion protein may only occupy a subset of genomic binding sites as compared to the endogenous protein.
DamID assay has mostly been used in cultured animal cells to detect protein-DNA interactions. Notably, developmental biologists have applied this assay in detecting protein-DNA interactions in specific cell types in vivo. For example, Dam-tagged RNA polymerase II was expressed specifically in Drosophila neural stem cells to detect their genome-wide occupancy without cell isolation 39. DamID-seq will be highly useful to study the genome-wide localizations of nuclear envelope proteins, transcription factors and chromatin regulators during development in animal models.
The authors have nothing to disclose.
We thank Dr. Bas van Steensel for providing the DamID mammalian expression vectors. We thank Yale Center for Genome Analysis and the Genomics Core in Yale Stem Cell Center for advice on preparing NGS libraries and implementing high throughput DNA sequencing. This work was supported by the startup funding from Yale School of Medicine, a Scientist Development Grant from American Heart Association (12SDG11630031) and a Seed Grant from Connecticut Innovations, Inc. (13-SCA-YALE-15).
Name | Company | Catalog Number | Comments |
ViraPower Lentiviral Expression Systems | Life Technologies | K4950-00, K4960-00, K4970-00, K4975-00, K4980-00, K4985-00, K4990-00, K367-20, K370-20, and K371-20 | |
Gateway BP Clonase II Enzyme Mix | Life Technologies | 11789-020 | |
Gateway LR Clonase II Enzyme Mix | Life Technologies | 11791-020 | |
DNeasy Blood & Tissue Kit (250) | QIAGEN | 69506 or 69504 | |
Gateway pDONR 201 | Life Technologies | 11798-014 | |
293T cells | American Type Culture Collection | CRL-11268 | |
Trypsin-EDTA (0.05%), phenol red | Life Technologies | 25300-054 | |
DMEM, high glucose, pyruvate | Life Technologies | 11995-065 | |
Fetal Bovine Serum | Sigma | F4135 | |
Tris | brand not critical | ||
EDTA | brand not critical | ||
200 Proof EtOH | brand not critical | ||
Isopropanol | brand not critical | ||
Sodium Acetate | brand not critical | ||
DpnI | New England Biolabs | R0176 | supplied with buffer |
DamID adaptors "AdRt" and "AdRb" | Integrated DNA Technologies | sequences available in ref. 24; no phosphorylation of the 5' or 3' end to prevent self-ligation. | |
T4 DNA Ligase | Roche Life Science | 10481220001 | supplied with buffer |
DpnII | New England Biolabs | R0543 | supplied with buffer |
DamID PCR primer "AdR_PCR" | Integrated DNA Technologies | sequences available in ref. 24 | |
Deoxynucleotide (dNTP) Solution Set | New England Biolabs | N0446 | 100 mM each of dATP, dCTP, dGTP and dTTP |
Advantage 2 Polymerase Mix | Clontech | 639201 | supplied with buffer |
1Kb Plus DNA Ladder | Life Technologies | 10787018 | 1.0 µg/µl |
QIAquick PCR Purification Kit | QIAGEN | 28104 or 28106 | |
MinElute PCR Purification Kit | QIAGEN | 28004 or 28006 | for an elution volume of less than 30 µl |
SPRI beads / Agencourt AMPure XP | Beckman Coulter | A63880 | apply extra mixing and more elution time if less than 40 µl elution buffer is used |
Buffer EB | QIAGEN | 19086 | |
NEBNext dsDNA Fragmentase | New England Biolabs | M0348 | supplied with buffer |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202 | |
T4 DNA Polymerase | New England Biolabs | M0203 | |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210 | |
T4 Polynuleotide Kinase | New England Biolabs | M0201 | |
Klenow Fragment (3’ → 5’ exo-) | New England Biolabs | M0212 | supplied with buffer |
sequencing adaptors | Integrated DNA Technologies | sequences available in ref. 28 | |
Quick Ligation Kit | New England Biolabs | M2200 | used in 3.4.3; supplied with Quick Ligation Reaction Buffer and Quick T4 DNA Ligase |
sequencing primer 1 and 2 | Integrated DNA Technologies | sequences available in ref. 28 | |
KAPA HiFi PCR Kit | Kapa Biosystems | KK2101 or KK2102 | supplied with KAPA HiFi DNA Polymerase, 5x KAPA HiFi Fidelity Buffer and 10 mM dNTP mix |
agarose | Sigma Aldrich | A4679 | |
ethidium bromide | Sigma Aldrich | E1510-10ML | 10 mg/ml |
QIAquick Gel Extraction Kit | QIAGEN | 28704 or 28706 | |
iTaq Universal SYBR Green Supermix | Bio-Rad Laboratories | 1725121 or 1725122 | |
Spectrophotometer | brand not critical | ||
0.45 μm PVDF Filter | brand not critical | ||
25 ml Seringe | brand not critical | ||
10 cm Tissue Culture Plates | brand not critical | ||
6-well Tissue Culture Plates | brand not critical | ||
S1000 Thermal Cycler | Bio-Rad Laboratories | ||
C1000 Touch Thermal Cycler | Bio-Rad Laboratories | for qPCR | |
Vortex Mixer | brand not critical | ||
Dry Block Heater or Thermomixer | brand not critical | ||
Microcentrifuge | brand not critical | ||
Gel electrophoresis system with power supply | brand not critical | ||
Magnet stand | for purification of DNA with SPRI beads; should hold 1.5-2 ml tubes; brand not critical | ||
UV transilluminator | brand not critical | ||
E-gel electrophoresis system | Life Technologies | G6400, G6500, G6512ST |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon