Method Article
Descrevemos aqui um ensaio por acoplamento de identificação do DNA adenina metiltransferase (DamID) para sequenciamento de alta taxa de transferência (DamID-seq). Este método melhorado fornece uma resolução mais alta e uma maior gama dinâmica, e permite analisar os dados DamID-seq em conjunto com outros dados de sequenciação de alto rendimento tal como Chip-SEQ, ARN-SEQ, etc.
The DNA adenine methyltransferase identification (DamID) assay is a powerful method to detect protein-DNA interactions both locally and genome-wide. It is an alternative approach to chromatin immunoprecipitation (ChIP). An expressed fusion protein consisting of the protein of interest and the E. coli DNA adenine methyltransferase can methylate the adenine base in GATC motifs near the sites of protein-DNA interactions. Adenine-methylated DNA fragments can then be specifically amplified and detected. The original DamID assay detects the genomic locations of methylated DNA fragments by hybridization to DNA microarrays, which is limited by the availability of microarrays and the density of predetermined probes. In this paper, we report the detailed protocol of integrating high throughput DNA sequencing into DamID (DamID-seq). The large number of short reads generated from DamID-seq enables detecting and localizing protein-DNA interactions genome-wide with high precision and sensitivity. We have used the DamID-seq assay to study genome-nuclear lamina (NL) interactions in mammalian cells, and have noticed that DamID-seq provides a high resolution and a wide dynamic range in detecting genome-NL interactions. The DamID-seq approach enables probing NL associations within gene structures and allows comparing genome-NL interaction maps with other functional genomic data, such as ChIP-seq and RNA-seq.
ADN identificação adenina metiltransferase (DamID) 1,2 é um método para detectar interacções proteína-ADN in vivo e é uma abordagem alternativa para a imunoprecipitação da cromatina (ChIP) 3. Ele usa uma quantidade relativamente baixa de células e não necessita de reticulação química de proteína com ADN ou um anticorpo altamente específico. O último é particularmente útil quando a proteína alvo é frouxamente ou indirectamente associada com o ADN. DamID tem sido utilizado com êxito para mapear locais de ligação de uma variedade de proteínas, incluindo as proteínas do envelope nuclear 4-10, proteínas de cromatina associada cromatina 11-13, enzimas modificadoras 14, factores de transcrição e co-factores 15-18 e maquinarias RNAi 19. O método é aplicável em vários organismos, incluindo S. 13 cerevisiae, S. pombe 7, C. elegans 9,17, D. melanogaster 5,11,18,20, A. thaliana 21,22, bem como de ratinho e células humanas linhas 6,8,10,23,24.
O desenvolvimento do ensaio DamID foi baseado na detecção específica de fragmentos de ADN metilado-adenina em células eucarióticas que não possuem adenina endógenos metilação 2. Uma proteína de fusão expressa, que consiste da proteína de ligação de ADN de interesse e E. coli ADN metiltransferase adenina (DAM), pode metilar a base de adenina nas sequências GATC que estão em proximidade espacial (mais significativamente dentro de 1 kb e até cerca de 5 kb) para os locais de ligação da proteína no genoma 2. Os fragmentos de ADN podem ser modificados especificamente amplificado e hibridado com microarrays para detectar os locais de ligação genómicos da proteína de interesse 1,25,26. Este método DamID original é limitada pela disponibilidade de microarranjos e a densidade de sondas predeterminados. Temos, portanto, integrada alto throughput sequenciação empara DamID 10 e designado como o método DamID-SEQ. O grande número de curto geradas a partir de leituras DamID-SEQ permite localização precisa de interacções proteína-ADN a nível genoma. Descobrimos que DamID-seq fornecida uma resolução maior e uma gama dinâmica mais ampla do que DamID por microarray para estudar lâmina genoma nuclear (NL) 10 associações. Este método permite uma melhor sondagem associações NL dentro das estruturas do gene 10 e facilita comparações com outros dados de seqüenciamento de alto rendimento, como ChIP-seq e RNA-seq.
O protocolo DamID-seq aqui descrito foi desenvolvido inicialmente para mapeamento do genoma-NL 10 associações. Geramos uma proteína de fusão amarrados mouse ou Lamin B1 humana para E. coli DNA metiltransferase adenina e testou o protocolo em 3T3 fibroblastos de rato embrionárias, C2C12 mioblastos rato 10 e IMR90 fibroblastos de pulmão fetal humano (dados não publicados). Neste protocolo, começamos com constructing vetores e expressando proteínas de fusão Dam-tethered por infecção lentivírus em células de mamíferos 24. A seguir, descrevemos os protocolos detalhados de amplificar fragmentos de DNA metilado-adenina e preparar bibliotecas de seqüenciamento que deveriam ser aplicável em outros organismos.
1. Geração e Expressão de Proteínas de Fusão e Proteínas gratuito Dam
Fragmentos de DNA 2. Amplify Adenina-metilados
3. Preparação para a Biblioteca de alta capacidade Sequencing
Verificou-se a proteína de fusão Dam-V5-LmnB1 para ser co-localizada com a proteína endógena lamina B por coloração de imunofluorescência (Figura 1).
A amplificação bem sucedida PCR de fragmentos de DNA metilado-adenina é um passo fundamental para DamID-seq. As amostras experimentais devem amplificar um esfregaço de 0,2 - 2 KB, enquanto que os controlos negativos (sem Dpnl, sem ligase ou sem molde de PCR) deve resultar em nenhuma ou-menos claramente-amplificação (Figura 2).
Os fragmentos de ADN são metilados no intervalo de 0,2 a 2 kb, enquanto que o tamanho da inserção desejada para uma biblioteca de NGS é de 200 a 300 pb. Portanto, é essencial para fragmentar os produtos de PCR de metilo para a gama de tamanho apropriado. No entanto, verificou-se ser impraticável para romper simultaneamente os fragmentos de ADN maiores para baixo para o tamanho adequados e manter a maioria dos fragmentos de ADN menores intactas num período de fragmentação. Portanto, as experiências foram realizadas decurso de tempo para determinar o tempo mínimo (t 0.2kb) necessária para fragmento de 1 ug de ADN para um esfregaço centrado em 200 pb (Figura 3). Em seguida, foram selecionados 6 durações de tempo em incrementos iguais entre 5 min e T 0.2kb para a fragmentação actual. A actividade enzimática da dupla cadeia de ADN Fragmentase pode variar de lote para lote e pode diminuir ao longo do tempo, por isso, recomenda-se repetir este passo para um novo lote de Fragmentase ou após armazenagem durante um período de tempo.
O tamanho da inserção desejada situa-se entre 200 e 300 pb, correspondente aos fragmentos de ADN entre 300 e 400 pb (incluindo 121 pb adaptadores de sequenciação) em gel de agarose. Três fatias finas dentro desta gama foram excisados a partir de cada amostra experimental para limitar o tamanho de uma biblioteca e aumentar a possibilidadea obtenção de pelo menos uma biblioteca de sequenciação qualificado (Figura 4).
Uma alíquota de 5 ul de cada biblioteca de ADN amplificado foi analisado em gel de agarose para determinar qual biblioteca podem qualificar para sequenciação. Como mostrado na Figura 5A, uma banda única clara do mesmo tamanho que a fatia de gel excisado deve ser visível no gel de agarose (passo 3.7.4). Em seguida, as bibliotecas seleccionadas foram examinados por um Bioanalyzer (Figura 5B) para determinar a gama de concentrações e tamanho exacto antes da sequenciação. Se desejado, as bibliotecas de ADN amplificadas pode ser directamente analisada por uma análise em gel sem Bioanalyzer. Quando várias bibliotecas são de boa qualidade, recomenda-se para sequenciar bibliotecas de tamanho similar varia de um par de experimentais (células que expressam Dam-V5-POI) e controle (células expressando V5-DAM) amostras.
A curto lê gerado porsistemas de sequenciamento foram mapeados pela primeira vez ao genoma correspondente. Excepcionalmente alinhado leituras foram então passadas para análises subsequentes. Um gasoduto para processar curto lê, construir uma interação mapa do genoma-NL e analisar associações de genes-NL foram descritos em detalhes em nosso trabalho anterior 10. Os resultados representativos são apresentados na Figura 6.
Figura 1. A validação subnucleares localizações de proteínas de fusão por imunofluorescência. As células IMR90 de fibroblastos de pulmão humano, foram transfectadas transitoriamente com um plasmídeo que expressa Dam-V5-LmnB1 e foram coradas por anti-lamina B (A, vermelho) e anti-V5 (B, verde). (C) Mesclar de imagens em A e B. Por favor, clique aqui para ver uma versão ampliada da tsua figura.
Figura 2. amplificar por PCR fragmentos de ADN metilado-adenina. Uma alíquota de 5 ul de cada reacção de PCR foi analisado num gel de agarose a 1%. Uma mancha que varia 0,2-2 kb foi amplificado a partir de cada amostra experimental, mas nenhuma amplificação foi observada em controlos negativos (sem DpnI no passo 2.1, não Ligase na etapa 2.2, ou nenhum modelo de PCR). Por favor clique aqui para ver uma versão maior desta figura.
Figura 3. Determinar durações óptimas de fragmentação. Os produtos de PCR purificados foram sujeitos metil à fragmentação por períodos de tempo a partir de 5 a 55 min a um incremento de 10 min (ADN digerido , Rotulado como "0 minutos"). 1 ug de ADN de escada e 0,5 ug de cada amostra de ADN fragmentado foram analisados num gel de agarose. O tempo mínimo para digerir a maioria da mancha de ADN de cerca de 200 pb foi determinada como sendo cerca de 35 min, por conseguinte, seis durações de tempo espaçados uniformemente entre 5 e 35 min (5 e 35 min incluídos) foram seleccionados para realizar a fragmentação real. Por favor clique aqui para ver uma versão maior desta figura.
Figura 4. Tamanho seleccionando as bibliotecas de ADN. As amostras de ADN de Dam-V5 e V5-LmnB1-Dam do passo 3.6 foram corridos num gel de agarose a 2%, e três pedaços de gel de tamanho igual (G, H e H correspondente a baixa, média e alta em tamanho) foram excisadas entre 300 e 400 pb, como mostrado pelas linhas amarelas. om / files / ftp_upload / 53620 / "target =" _ blank 53620fig4large.jpg "> Clique aqui para ver uma versão maior desta figura.
Figura 5. bibliotecas de ADN amplificado para sequenciação de alto rendimento. (A) ADN amplificado bibliotecas analisadas num gel de agarose. Modelos de PCR foram purificados a partir de fatias de gel mostrados na Figura 4. (B) Os resultados Bioanalyzer da amostra V5-Dam (L) e a amostra Dam-V5-LmnB1 (L) que foram sublinhados em (A). Estas duas bibliotecas tinha as faixas de tamanho estreita semelhantes e, portanto, qualificado para sequenciamento alta taxa de transferência. Por favor clique aqui para ver uma versão maior desta figura.
jpg "/>
Figura 6. Os dados apresentados no NGS navegador genoma UCSC. Mouse cromossoma 1 é mostrado como um exemplo. Os dados da seqüência foram produzidos a partir de mioblastos C2C12 rato 10. Faixas "MB.LmnB1.w2k" e "MB.Dam.w2k", correspondente aos dados de células que expressam Dam-V5-LmnB1 e V5-Dam, respectivamente, enredo normalizada densidades de leitura (leituras por kilobase por milhão mapeados exclusivamente lê, ou RPKM ) em que não se sobrepõem consecutivos janelas 2 kb ao longo do cromossoma. Faixa "MB.log2FC.w2k" terrenos associações genoma-NL, ou seja, log2 RPKM rácios de LmnB1 mais de Dam, na resolução de 2 kb. Faixa "MB.sLADs" pinta Lamina Associated Domínios baseados em seqüenciamento (slads, ou seja, regiões genômicas que têm densidades de leitura mais altas de LmnB1 sobre Dam com significância estatística) em preto, não-slads em regiões de cinza e indeterminados em branco. Por favor clique aqui para download este arquivo.
Whether Dam-tagged proteins retain the functions of endogenous proteins should be examined before a DamID-seq experiment. The subcellular localization of Dam-tagged nuclear envelope proteins should always be determined and compared with that of the endogenous proteins. For studying transcription factors, it is suggested to examine whether the Dam-fusion protein can rescue the functions of the endogenous protein in regulating gene expression. This functional test can be performed in organisms in which knockout mutants of endogenous DNA-binding proteins are available. Because advances in genome engineering have potentially allowed knocking out any endogenous gene of interest, functions of Dam-tagged DNA-binding proteins can be examined in cultured mammalian cells.
The critical step in this protocol is to successfully fragment the DpnII-digested DamID PCR products to around 200 bp. This step is designed to render the amplified adenine-methylated fragments to a narrow size range for sequencing and to randomize the starting nucleotides of the DNA fragments in a sequencing library. Inefficient fragmentation will leave the majority of the DNA fragments starting with GATC (the 5'-overhang from the second DpnII digestion), and will result in a much lower performance and yield or even a failure in Illumina sequencing. Other DNA fragmentation methods may be used as an alternative approach.
The resolution of DamID (and DamID-seq described here) is limited by the frequency of GATCs in the genome to be studied. Moreover, even with high throughput sequencing, the genomic localizations of a DNA-binding protein can only be mapped within two consecutive GATCs rather than to the actual DNA-binding sites.
Despite its limitation, the DamID assay has important advantages. Because DamID does not require highly-specific antibodies, it can be used to detect a subset of nuclear proteins that could be difficult to assay by ChIP (such as the nuclear envelope proteins). To study how these proteins regulate genome functions, it is important to integrate and cross-analyze their genome-wide localization data with the current epigenomic mapping data (such as data from the ENCODE and NIH Roadmap Epigenomics Projects 30,31). The DamID-seq approach provides both higher resolution and higher sensitivity than DamID by microarray and enables detecting differential NL-associations within gene structures 10. A combinatorial analysis of DamID-seq data, ChIP-seq data 32 and gene expression data has identified a class of NL-associated genes with distinct epigenetic and transcriptional features (data not published).
Another advantage of DamID is that it only requires a small number of cells. In recent years, there has been an explosion in single cell analysis of gene regulation 33,34. Although genome sequence 35, genome-wide gene expression 36 and chromatin conformation 37 can be assayed in a single cell, there has not been an available approach for detecting protein-DNA interactions genome-wide in a single cell. DamID-seq is a highly promising approach for this goal, and may complement the single cell imaging approach in detecting the dynamics of genome-NL interactions 38. One complication is that because the Dam-fusion protein is expressed at a much lower level than the endogenous protein in the DamID assay, it is possible that the Dam-fusion protein may only occupy a subset of genomic binding sites as compared to the endogenous protein.
DamID assay has mostly been used in cultured animal cells to detect protein-DNA interactions. Notably, developmental biologists have applied this assay in detecting protein-DNA interactions in specific cell types in vivo. For example, Dam-tagged RNA polymerase II was expressed specifically in Drosophila neural stem cells to detect their genome-wide occupancy without cell isolation 39. DamID-seq will be highly useful to study the genome-wide localizations of nuclear envelope proteins, transcription factors and chromatin regulators during development in animal models.
The authors have nothing to disclose.
We thank Dr. Bas van Steensel for providing the DamID mammalian expression vectors. We thank Yale Center for Genome Analysis and the Genomics Core in Yale Stem Cell Center for advice on preparing NGS libraries and implementing high throughput DNA sequencing. This work was supported by the startup funding from Yale School of Medicine, a Scientist Development Grant from American Heart Association (12SDG11630031) and a Seed Grant from Connecticut Innovations, Inc. (13-SCA-YALE-15).
Name | Company | Catalog Number | Comments |
ViraPower Lentiviral Expression Systems | Life Technologies | K4950-00, K4960-00, K4970-00, K4975-00, K4980-00, K4985-00, K4990-00, K367-20, K370-20, and K371-20 | |
Gateway BP Clonase II Enzyme Mix | Life Technologies | 11789-020 | |
Gateway LR Clonase II Enzyme Mix | Life Technologies | 11791-020 | |
DNeasy Blood & Tissue Kit (250) | QIAGEN | 69506 or 69504 | |
Gateway pDONR 201 | Life Technologies | 11798-014 | |
293T cells | American Type Culture Collection | CRL-11268 | |
Trypsin-EDTA (0.05%), phenol red | Life Technologies | 25300-054 | |
DMEM, high glucose, pyruvate | Life Technologies | 11995-065 | |
Fetal Bovine Serum | Sigma | F4135 | |
Tris | brand not critical | ||
EDTA | brand not critical | ||
200 Proof EtOH | brand not critical | ||
Isopropanol | brand not critical | ||
Sodium Acetate | brand not critical | ||
DpnI | New England Biolabs | R0176 | supplied with buffer |
DamID adaptors "AdRt" and "AdRb" | Integrated DNA Technologies | sequences available in ref. 24; no phosphorylation of the 5' or 3' end to prevent self-ligation. | |
T4 DNA Ligase | Roche Life Science | 10481220001 | supplied with buffer |
DpnII | New England Biolabs | R0543 | supplied with buffer |
DamID PCR primer "AdR_PCR" | Integrated DNA Technologies | sequences available in ref. 24 | |
Deoxynucleotide (dNTP) Solution Set | New England Biolabs | N0446 | 100 mM each of dATP, dCTP, dGTP and dTTP |
Advantage 2 Polymerase Mix | Clontech | 639201 | supplied with buffer |
1Kb Plus DNA Ladder | Life Technologies | 10787018 | 1.0 µg/µl |
QIAquick PCR Purification Kit | QIAGEN | 28104 or 28106 | |
MinElute PCR Purification Kit | QIAGEN | 28004 or 28006 | for an elution volume of less than 30 µl |
SPRI beads / Agencourt AMPure XP | Beckman Coulter | A63880 | apply extra mixing and more elution time if less than 40 µl elution buffer is used |
Buffer EB | QIAGEN | 19086 | |
NEBNext dsDNA Fragmentase | New England Biolabs | M0348 | supplied with buffer |
T4 DNA Ligase Reaction Buffer | New England Biolabs | B0202 | |
T4 DNA Polymerase | New England Biolabs | M0203 | |
DNA Polymerase I, Large (Klenow) Fragment | New England Biolabs | M0210 | |
T4 Polynuleotide Kinase | New England Biolabs | M0201 | |
Klenow Fragment (3’ → 5’ exo-) | New England Biolabs | M0212 | supplied with buffer |
sequencing adaptors | Integrated DNA Technologies | sequences available in ref. 28 | |
Quick Ligation Kit | New England Biolabs | M2200 | used in 3.4.3; supplied with Quick Ligation Reaction Buffer and Quick T4 DNA Ligase |
sequencing primer 1 and 2 | Integrated DNA Technologies | sequences available in ref. 28 | |
KAPA HiFi PCR Kit | Kapa Biosystems | KK2101 or KK2102 | supplied with KAPA HiFi DNA Polymerase, 5x KAPA HiFi Fidelity Buffer and 10 mM dNTP mix |
agarose | Sigma Aldrich | A4679 | |
ethidium bromide | Sigma Aldrich | E1510-10ML | 10 mg/ml |
QIAquick Gel Extraction Kit | QIAGEN | 28704 or 28706 | |
iTaq Universal SYBR Green Supermix | Bio-Rad Laboratories | 1725121 or 1725122 | |
Spectrophotometer | brand not critical | ||
0.45 μm PVDF Filter | brand not critical | ||
25 ml Seringe | brand not critical | ||
10 cm Tissue Culture Plates | brand not critical | ||
6-well Tissue Culture Plates | brand not critical | ||
S1000 Thermal Cycler | Bio-Rad Laboratories | ||
C1000 Touch Thermal Cycler | Bio-Rad Laboratories | for qPCR | |
Vortex Mixer | brand not critical | ||
Dry Block Heater or Thermomixer | brand not critical | ||
Microcentrifuge | brand not critical | ||
Gel electrophoresis system with power supply | brand not critical | ||
Magnet stand | for purification of DNA with SPRI beads; should hold 1.5-2 ml tubes; brand not critical | ||
UV transilluminator | brand not critical | ||
E-gel electrophoresis system | Life Technologies | G6400, G6500, G6512ST |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados