Method Article
Wir beschreiben hier einen Test durch Kopplung DNA-Adenin-Methyltransferase-Identifikation (DAMiD), um Hochdurchsatz-Sequenzierung (DAMiD-seq). Dieses verbesserte Verfahren bietet eine höhere Auflösung und einen größeren Dynamikbereich und erlaubt die Analyse DAMiD-seq Daten in Verbindung mit anderen Hochdurchsatz-Sequenzierung Daten wie ChIP-seq, RNA-seq usw.
The DNA adenine methyltransferase identification (DamID) assay is a powerful method to detect protein-DNA interactions both locally and genome-wide. It is an alternative approach to chromatin immunoprecipitation (ChIP). An expressed fusion protein consisting of the protein of interest and the E. coli DNA adenine methyltransferase can methylate the adenine base in GATC motifs near the sites of protein-DNA interactions. Adenine-methylated DNA fragments can then be specifically amplified and detected. The original DamID assay detects the genomic locations of methylated DNA fragments by hybridization to DNA microarrays, which is limited by the availability of microarrays and the density of predetermined probes. In this paper, we report the detailed protocol of integrating high throughput DNA sequencing into DamID (DamID-seq). The large number of short reads generated from DamID-seq enables detecting and localizing protein-DNA interactions genome-wide with high precision and sensitivity. We have used the DamID-seq assay to study genome-nuclear lamina (NL) interactions in mammalian cells, and have noticed that DamID-seq provides a high resolution and a wide dynamic range in detecting genome-NL interactions. The DamID-seq approach enables probing NL associations within gene structures and allows comparing genome-NL interaction maps with other functional genomic data, such as ChIP-seq and RNA-seq.
DNA-Methyltransferase-Adenin-Identifikation (DAMiD) 1,2 ist eine Methode, um Protein-DNA-Wechselwirkungen in vivo zu detektieren und ist ein alternativer Ansatz zur Chromatin-Immunopräzipitation (ChIP) 3. Es verwendet eine relativ geringe Menge an Zellen und keine chemische Vernetzung des Proteins mit der DNA oder einem hochspezifischen Antikörpers erforderlich. Letzteres ist insbesondere dann hilfreich, wenn das Zielprotein ist lose oder indirekt mit DNA verbunden. DAMiD wurde erfolgreich verwendet, um die Bindungsstellen aus einer Vielzahl von Proteinen, einschließlich Kernhüllenproteine 4-10, Chromatin-assoziierte Proteine 11-13, Chromatin modifizierender Enzyme 14, Transkriptionsfaktoren und Co-Faktoren und 15-18 RNAi Maschinen 19 abzubilden. Das Verfahren ist in mehreren Organismen, einschließlich S. erhoben cerevisiae 13, S. pombe 7, C. elegans 9,17, D. melanogaster 5,11,18,20, A. thaliana 21,22 sowie Maus und humanen Zelllinien 6,8,10,23,24.
Die Entwicklung des DAMiD Assay wurde auf den spezifischen Nachweis von Adenin-methylierten DNA-Fragmente in eukaryontischen Zellen, die endogene Adenin-Methylierung 2 fehlt basiert. Ein exprimiertes Fusionsprotein, bestehend aus der DNA-bindenden Proteins von Interesse und E. coli DNA-Adenin-methyltransferase (Dam), können die Adeninbase in GATC-Sequenzen, die in räumlicher Nähe befinden (am deutlichsten in 1 kb und bis zu etwa 5 kb) an die Bindungsstellen des Proteins in das Genom 2 methylieren. Die modifizierten DNA-Fragmenten, spezifisch amplifiziert und hybridisiert werden, um Mikroarrays, um die genomische Bindungsstellen des Proteins von Interesse 1,25,26 zu erfassen. Diese ursprüngliche DAMiD Verfahren wurde durch die Verfügbarkeit von Mikroarrays und der Dichte des vorbestimmten Sonden beschränkt. Daher haben wir in integrierten Hochdurchsatz-Sequenzierungum DAMiD 10 und bezeichnet das Verfahren, wie DAMiD-seq. Die große Anzahl von kurzen liest aus DAMiD-seq generiert ermöglicht eine präzise Lokalisierung von Protein-DNA-Interaktionen Genom-weiten. Wir fanden, dass DAMiD-seq vorgesehen eine höhere Auflösung und einen breiteren Dynamikbereich als DAMiD von Mikroarray für die Untersuchung genom Kernlamina (NL) 10 Verbände. Dieses verbesserte Verfahren ermöglicht Sondieren NL Assoziationen innerhalb Genstrukturen 10 und erleichtert den Vergleich mit anderen Hochdurchsatz-Daten, wie Chip-seq und RNA-seq.
Die hier beschriebene DAMiD-seq-Protokoll wurde ursprünglich für Mapping-Genom-NL Verbände 10 entwickelt. Wir erzielten ein Fusionsprotein angebunden Maus oder Mensch Lamin B1 bis E. coli DNA-Adenin-Methyltransferase und getestet, das Protokoll in 3T3 embryonalen Maus-Fibroblasten, Myoblasten C2C12 Maus 10 und IMR90 menschlichen fötalen Lungenfibroblasten (Daten nicht veröffentlicht). In diesem Protokoll, beginnen wir mit constructing Vektoren und ausdrücken Dam-gebundenen Fusionsproteine durch lentivirale Infektion in Säugetierzellen 24. Als nächstes beschreiben wir die ausführliche Protokolle zum Verstärken Adenin-methylierten DNA-Fragmente und Sequenzierung vorbereitet Bibliotheken, die in anderen Organismen anwendbar sein sollte.
1. Erzeugung und Expression von Fusionsproteinen und Free Dam Proteine
2. Amplify Adenin-methylierten DNA-Fragmenten
3. Bibliothek Vorbereitung zum Hochdurchsatz-Sequenzierung
Dam-V5-LmnB1 Fusionsprotein wurde überprüft, um mit dem endogenen Lamin B-Protein durch Immunfluoreszenzfärbung (Abbildung 1) co-lokalisiert werden.
Die erfolgreiche PCR-Amplifikation von Adenin-methylierten DNA-Fragmente ist ein wichtiger Schritt für DAMiD-seq. Die Versuchsproben sollten einen Abstrich von 0,2 zu verstärken - 2 kb, während der Negativkontrollen (ohne DpnI ohne Ligase oder ohne PCR-Vorlage) sollte in keiner oder eindeutig weniger Verstärkung (Abbildung 2) zur Folge haben.
Das methylierte DNA-Fragmente im Bereich von 0,2 bis 2 kb, während die gewünschte Plattengröße für eine NGS Bibliothek 200-300 bp. Daher ist es wichtig, die Methyl PCR-Produkte in den geeigneten Grßenbereich fragmentieren. Dennoch wurde festgestellt, nicht praktikabel, gleichzeitig brechen größere DNA-Fragmente auf geeignete Größe seins und halten die Mehrheit der kleineren DNA-Fragmente intakter in einem einzigen Fragmentierung Dauer. Daher wurden Zeitverlaufsexperimente durchgeführt, um die minimale Zeit (T 0.2kb) bis 1 ug DNA-Fragment zu einem Abstrich bei 200 bp (3) zentriert ist notwendig zu bestimmen. Dann wurden 6 Zeitdauern in gleichen Schritten zwischen 5 min und T 0.2kb für die tatsächliche Fragmentierung ausgewählt. Die enzymatische Aktivität der Doppelstrang-DNA Fragmentase kann von Charge zu Charge variieren und kann im Laufe der Zeit zu verringern, so empfiehlt es sich, diesen Schritt für eine neue Charge von Fragmentase oder nach Lagerung über einen Zeitraum zu wiederholen.
Die gewünschte Plattengröße zwischen 200 und 300 bp entsprechen, DNA-Fragmente zwischen 300 und 400 bp (einschließlich 121 bp Sequenzierung Adaptern) auf dem Agarosegel. Drei dünne Scheiben in diesem Bereich wurden von jeder Versuchsprobe herausgeschnitten, um den Größenbereich von einer Bibliothek einzugrenzen und erhöhen die Möglichkeit,erhalten mindestens einen qualifizierten Sequenzierung Bibliothek (Abbildung 4).
Ein Aliquot von 5 ul jeder amplifizierten DNA-Bibliothek wurde auf dem Agarosegel analysiert, um zu bestimmen, welche Bibliothek für die Sequenzierung in Betracht kommen. Wie in 5A gezeigt ist, sollte eine klare einzelne Bande mit der gleichen Größe wie der ausgeschnittenen Gelscheibe auf dem Agarosegel (Schritt 3.7.4) sichtbar. Als nächstes wurden die ausgewählten Bibliotheken von einem Bioanalyzer (5B) untersucht, um die genaue Größenbereich und Konzentrationen vor der Sequenzierung zu bestimmen. Falls gewünscht, amplifizierte DNA-Bibliotheken können direkt von einem Bioanalyzer ohne Gel-Analyse untersucht werden. Wenn mehrere Bibliotheken sind von guter Qualität, ist es empfehlenswert, zu sequenzieren Bibliotheken ähnlicher Größe reicht für ein Paar von experimentellen (Zellen, die Dam-V5-POI) und Kontrolle (Zellen, die V5-Dam) Proben.
Die kurze Lesevorgänge erzeugtSequenzierungssysteme wurden zum ersten Mal wieder auf die entsprechende Genom abgebildet. Eindeutig ausgerichtet liest wurden dann in nachfolgenden Analysen übergeben. Eine Pipeline zu verarbeiten kurzen liest, errichten ein Genom-NL Interaktionskarte und zu analysieren Gen-NL Verbände wurden im Detail in unserer bisherigen Arbeit 10 beschrieben. Repräsentative Ergebnisse sind in 6 gezeigt.
Abbildung 1 Validieren subnuclear Lokalisierungen von Fusionsproteinen durch Immunfluoreszenzfärbung. IMR90 menschlichen Lungenfibroblasten-Zellen wurden transient mit einem Plasmid, Dam-V5-LmnB1 transfiziert und wurden durch anti-Lamin B (A, rot) und Anti-V5 (B gefärbt, grün). (C) Zusammenführen von Bildern in A und B. Bitte klicken Sie hier, um eine größere Version zu sehen tseine Figur.
Abbildung 2. PCR Amplifikation Adenin-methylierten DNA-Fragmente. Ein aliquoter Teil von 5 & mgr; l von jeder PCR-Reaktion wurde auf einem 1% Agarosegel analysiert. Ein Abstrich von 0,2 bis 2 kb wurde aus jeder Versuchsprobe verstärkt, aber keine Amplifikation wurde in Negativkontrollen beobachtet (kein DpnI in Schritt 2.1, keine Ligase in Schritt 2.2, oder kein PCR-Vorlage). Zu Bitte klicken Sie hier eine größere Ansicht dieser Figur.
Abbildung 3. Bestimmen der optimalen Dauer der Fragmentierung. Gereinigtes methyl PCR-Produkte wurden unter Fragmentierung für Zeitdauern von 5 bis 55 min bei einer Schrittweite von 10 min (unverdaute DNA Als "0 min") markiert. 1 ug DNA-Leiter und 0,5 ug jedes fragmentierten DNA-Probe wurden auf einem Agarosegel analysiert. Die minimale Zeit, um den Großteil der DNA-Abstrich auf etwa 200 bp verdaut wurde bestimmt auf etwa 35 min, also sechs gleichmäßig beabstandeten Zeitdauern zwischen 5 und 35 min (5 und 35 min enthalten) wurden ausgewählt, um die tatsächliche Fragmentierung durchzuführen. Bitte Klicken Sie hier, um eine größere Version dieser Figur zu sehen.
Abbildung 4. Größe der Auswahl der DNA-Bibliotheken. DNA-Proben der Dam-V5-LmnB1 und V5-Dam von Schritt 3.6 wurden auf einem 2% Agarosegel laufen gelassen, und drei gleich große Gelscheiben (L, M und H entsprechend niedrig, mittel und hoch in der Größe) wurden zwischen 300 und 400 bp ausgeschnitten, wie durch die gelben Linien dargestellt. om / files / ftp_upload / 53.620 / 53620fig4large.jpg "target =" _ blank "> Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.
Figur 5. Amplified DNA-Bibliotheken für Hochdurchsatz-Sequenzierung. (A) Die amplifizierten DNA-Bibliotheken auf einem Agarosegel analysiert. PCR-Templates wurden von über 4 gezeigten Gelscheiben gereinigt. (B) Bioanalyzer Ergebnisse der V5-Dam (L) Probe und dem Dam-V5-LmnB1 (L) Probe, die in (A) unterstrichen wurden. Diese beiden Bibliotheken hatten die ähnliche enge Größenbereiche und damit qualifiziert für Hochdurchsatz-Sequenzierung. Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.
jpg "/>
Abbildung 6. NGS Daten im UCSC Genome Browser. Maus-Chromosom 1 angezeigt wird, als ein Beispiel gezeigt. Sequenzdaten wurden aus Maus-C2C12 Myoblasten 10 produziert. Tracks "MB.LmnB1.w2k" und "MB.Dam.w2k", entsprechend Daten von Zellen, die Dam-V5-LmnB1 und V5-Dam bzw. Grundstück normalisiert Lesedichten (Lesevorgänge pro Kilobase pro Million eindeutig zugeordnet liest oder RPKM ) in nicht überlappenden aufeinanderfolgenden 2 kb Fenster entlang des Chromosoms. Verfolgen "MB.log2FC.w2k" Grundstücke Genom-NL Verbände, dh log2 RPKM Verhältnisse LmnB1 über Dam, bei 2 kb Auflösung. Verfolgen "MB.sLADs" malt Sequenzierung basierende Lamina verbundenen Domänen (sLADs, dh genomische Regionen, die höhere Lesedichten LmnB1 über Dam mit statistischer Signifikanz haben) in Schwarz, nicht-sLADs in grau und unbestimmten Regionen in weiß. Bitte klicken Sie hier, um downloaD Diese Datei.
Whether Dam-tagged proteins retain the functions of endogenous proteins should be examined before a DamID-seq experiment. The subcellular localization of Dam-tagged nuclear envelope proteins should always be determined and compared with that of the endogenous proteins. For studying transcription factors, it is suggested to examine whether the Dam-fusion protein can rescue the functions of the endogenous protein in regulating gene expression. This functional test can be performed in organisms in which knockout mutants of endogenous DNA-binding proteins are available. Because advances in genome engineering have potentially allowed knocking out any endogenous gene of interest, functions of Dam-tagged DNA-binding proteins can be examined in cultured mammalian cells.
The critical step in this protocol is to successfully fragment the DpnII-digested DamID PCR products to around 200 bp. This step is designed to render the amplified adenine-methylated fragments to a narrow size range for sequencing and to randomize the starting nucleotides of the DNA fragments in a sequencing library. Inefficient fragmentation will leave the majority of the DNA fragments starting with GATC (the 5'-overhang from the second DpnII digestion), and will result in a much lower performance and yield or even a failure in Illumina sequencing. Other DNA fragmentation methods may be used as an alternative approach.
The resolution of DamID (and DamID-seq described here) is limited by the frequency of GATCs in the genome to be studied. Moreover, even with high throughput sequencing, the genomic localizations of a DNA-binding protein can only be mapped within two consecutive GATCs rather than to the actual DNA-binding sites.
Despite its limitation, the DamID assay has important advantages. Because DamID does not require highly-specific antibodies, it can be used to detect a subset of nuclear proteins that could be difficult to assay by ChIP (such as the nuclear envelope proteins). To study how these proteins regulate genome functions, it is important to integrate and cross-analyze their genome-wide localization data with the current epigenomic mapping data (such as data from the ENCODE and NIH Roadmap Epigenomics Projects 30,31). The DamID-seq approach provides both higher resolution and higher sensitivity than DamID by microarray and enables detecting differential NL-associations within gene structures 10. A combinatorial analysis of DamID-seq data, ChIP-seq data 32 and gene expression data has identified a class of NL-associated genes with distinct epigenetic and transcriptional features (data not published).
Another advantage of DamID is that it only requires a small number of cells. In recent years, there has been an explosion in single cell analysis of gene regulation 33,34. Although genome sequence 35, genome-wide gene expression 36 and chromatin conformation 37 can be assayed in a single cell, there has not been an available approach for detecting protein-DNA interactions genome-wide in a single cell. DamID-seq is a highly promising approach for this goal, and may complement the single cell imaging approach in detecting the dynamics of genome-NL interactions 38. One complication is that because the Dam-fusion protein is expressed at a much lower level than the endogenous protein in the DamID assay, it is possible that the Dam-fusion protein may only occupy a subset of genomic binding sites as compared to the endogenous protein.
DamID assay has mostly been used in cultured animal cells to detect protein-DNA interactions. Notably, developmental biologists have applied this assay in detecting protein-DNA interactions in specific cell types in vivo. For example, Dam-tagged RNA polymerase II was expressed specifically in Drosophila neural stem cells to detect their genome-wide occupancy without cell isolation 39. DamID-seq will be highly useful to study the genome-wide localizations of nuclear envelope proteins, transcription factors and chromatin regulators during development in animal models.
The authors have nothing to disclose.
We thank Dr. Bas van Steensel for providing the DamID mammalian expression vectors. We thank Yale Center for Genome Analysis and the Genomics Core in Yale Stem Cell Center for advice on preparing NGS libraries and implementing high throughput DNA sequencing. This work was supported by the startup funding from Yale School of Medicine, a Scientist Development Grant from American Heart Association (12SDG11630031) and a Seed Grant from Connecticut Innovations, Inc. (13-SCA-YALE-15).
Name | Company | Catalog Number | Comments |
ViraPower Lentiviral Expression Systems | Life Technologies | K4950-00, K4960-00, K4970-00, K4975-00, K4980-00, K4985-00, K4990-00, K367-20, K370-20, and K371-20 | |
Gateway BP Clonase II Enzyme Mix | Life Technologies | 11789-020 | |
Gateway LR Clonase II Enzyme Mix | Life Technologies | 11791-020 | |
DNeasy Blood & Tissue Kit (250) | QIAGEN | 69506 or 69504 | |
Gateway pDONR 201 | Life Technologies | 11798-014 | |
293T cells | American Type Culture Collection | CRL-11268 | |
Trypsin-EDTA (0.05%), phenol red | Life Technologies | 25300-054 | |
DMEM, high glucose, pyruvate | Life Technologies | 11995-065 | |
Fetal Bovine Serum | Sigma | F4135 | |
Tris | brand not critical | ||
EDTA | brand not critical | ||
200 Proof EtOH | brand not critical | ||
Isopropanol | brand not critical | ||
Sodium Acetate | brand not critical | ||
DpnI | New England Biolabs | R0176 | supplied with buffer |
DamID adaptors "AdRt" and "AdRb" | Integrated DNA Technologies | sequences available in ref. 24; no phosphorylation of the 5' or 3' end to prevent self-ligation. | |
T4 DNA Ligase | Roche Life Science | 10481220001 | supplied with buffer |
DpnII | New England Biolabs | R0543 | supplied with buffer |
DamID PCR primer "AdR_PCR" | Integrated DNA Technologies | sequences available in ref. 24 | |
Deoxynucleotide (dNTP) Solution Set | New England Biolabs | N0446 | 100 mM each of dATP, dCTP, dGTP and dTTP |
Advantage 2 Polymerase Mix | Clontech | 639201 | supplied with buffer |
1Kb Plus DNA Ladder | Life Technologies | 10787018 | 1.0 µg/µl |
QIAquick PCR Purification Kit | QIAGEN | 28104 or 28106 | |
MinElute PCR Purification Kit | QIAGEN | 28004 or 28006 | for an elution volume of less than 30 µl |
SPRI beads / Agencourt AMPure XP | Beckman Coulter | A63880 | apply extra mixing and more elution time if less than 40 µl elution buffer is used |
Buffer EB | QIAGEN | 19086 | |
NEBNext dsDNA Fragmentase | New England Biolabs | M0348 | supplied with buffer |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202 | |
T4 DNA Polymerase | New England Biolabs | M0203 | |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210 | |
T4 Polynuleotide Kinase | New England Biolabs | M0201 | |
Klenow Fragment (3’ → 5’ exo-) | New England Biolabs | M0212 | supplied with buffer |
sequencing adaptors | Integrated DNA Technologies | sequences available in ref. 28 | |
Quick Ligation Kit | New England Biolabs | M2200 | used in 3.4.3; supplied with Quick Ligation Reaction Buffer and Quick T4 DNA Ligase |
sequencing primer 1 and 2 | Integrated DNA Technologies | sequences available in ref. 28 | |
KAPA HiFi PCR Kit | Kapa Biosystems | KK2101 or KK2102 | supplied with KAPA HiFi DNA Polymerase, 5x KAPA HiFi Fidelity Buffer and 10 mM dNTP mix |
agarose | Sigma Aldrich | A4679 | |
ethidium bromide | Sigma Aldrich | E1510-10ML | 10 mg/ml |
QIAquick Gel Extraction Kit | QIAGEN | 28704 or 28706 | |
iTaq Universal SYBR Green Supermix | Bio-Rad Laboratories | 1725121 or 1725122 | |
Spectrophotometer | brand not critical | ||
0.45 μm PVDF Filter | brand not critical | ||
25 ml Seringe | brand not critical | ||
10 cm Tissue Culture Plates | brand not critical | ||
6-well Tissue Culture Plates | brand not critical | ||
S1000 Thermal Cycler | Bio-Rad Laboratories | ||
C1000 Touch Thermal Cycler | Bio-Rad Laboratories | for qPCR | |
Vortex Mixer | brand not critical | ||
Dry Block Heater or Thermomixer | brand not critical | ||
Microcentrifuge | brand not critical | ||
Gel electrophoresis system with power supply | brand not critical | ||
Magnet stand | for purification of DNA with SPRI beads; should hold 1.5-2 ml tubes; brand not critical | ||
UV transilluminator | brand not critical | ||
E-gel electrophoresis system | Life Technologies | G6400, G6500, G6512ST |
Genehmigung beantragen, um den Text oder die Abbildungen dieses JoVE-Artikels zu verwenden
Genehmigung beantragenThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Alle Rechte vorbehalten