Method Article
The identification of molecules associated with specific genomic regions of interest is required to understand the mechanisms of regulation of the functions of these regions. This protocol describes procedures to perform engineered DNA-binding molecule-mediated chromatin imunoprecipitation (enChIP) for identification of proteins and RNAs associated with a specific genomic region.
The identification of molecules associated with specific genomic regions of interest is required to understand the mechanisms of regulation of the functions of these regions. To enable the non-biased identification of molecules interacting with a specific genomic region of interest, we recently developed the engineered DNA-binding molecule-mediated chromatin immunoprecipitation (enChIP) technique. Here, we describe how to use enChIP to isolate specific genomic regions and identify the associated proteins and RNAs. First, a genomic region of interest is tagged with a transcription activator-like (TAL) protein or a clustered regularly interspaced short palindromic repeats (CRISPR) complex consisting of a catalytically inactive form of Cas9 and a guide RNA. Subsequently, the chromatin is crosslinked and fragmented by sonication. The tagged locus is then immunoprecipitated and the crosslinking is reversed. Finally, the proteins or RNAs that are associated with the isolated chromatin are subjected to mass spectrometric or RNA sequencing analyses, respectively. This approach allows the successful identification of proteins and RNAs associated with a genomic region of interest.
A identificação de moléculas associadas com as regiões genómicas específicas de interesse é necessária para compreender os mecanismos de regulação das funções genómicas, tais como transcrição e regulação epigenética. Embora tenham sido desenvolvidas várias técnicas para análise bioquímica de regiões genômicas específicas 1-7, eles não são amplamente utilizados nesta fase por causa de seus problemas intrínsecos, tais como aplicação limitada (por exemplo, apenas para-elevado número de cópias ou loci loci com repetições) e muito tempo e esforço necessário.
Para realizar a análise bioquímica de regiões genômicas específicas facilmente, nós desenvolvemos duas tecnologias específicas do locus de cromatina imunoprecipitação (chip), nomeadamente insercional chip (Ichip) 8-13 e engenharia mediada por molécula de ligação a DNA ChIP (enChIP) 14-17 . Em Ichip, um lugar de interesse é marcado por sequências de reconhecimento de inserção de uma proteína de ligação de DNA exógeno, como LexA. O locus é então isolado através de purificação por afinidade, utilizando a proteína de ligação de ADN marcado. Em enChIP, modificadas moléculas de ligação a ADN, tais como proteínas de dedos de zinco, proteínas (Tal) de activador do tipo de transcrição, e agrupados regularmente interspaced repetições palindr�icas curtas (CRISPR) complexos, são utilizados para marcar um local de interesse (Figura 1). Subsequentemente, a região genómica que é isolado através de purificação por afinidade das moléculas de ligação de ADN marcados.
Uma das vantagens de enChIP sobre ichip é que a inserção de sequências de reconhecimento de uma proteína de ligação do ADN exógeno não é necessário. Segmentação de loci CRISPR usando complexos que consistem em uma forma cataliticamente inactivo de Cas9 (dCas9) e um guia de RNA (gRNA) é muito mais fácil do que a segmentação dessas regiões por iChip ou enChIP utilizando proteínas TAL e zinc-finger. Aqui, descrevemos um protocolo passo-a-passo para enChIP combinada com a espectrometria de massa e sequenciação de RNA (RNA-Seq) para identificar lócus associa-proteínas e RNAs ted, respectivamente.
1. Projeto de Engineered moléculas de DNA-binding Reconhecendo o alvo Locus
2. Criação de Células para Análise enChIP
3. A ligação cruzada de células com formaldeído
4. Preparação da Cromatina (por 2 x 107 células)
5. Sonication de cromatina (por 2 x 10 7 células)
6. Avaliação da cromatina Fragmentação
7. Preparação de Dynabeads conjugado com anticorpos (por 2 x 10 7 células)
8. imunoprecipitação da cromatina (por 2 x 10 7 células)
9. SDS-PAGE, coloração e análise de espectrometria de massa
10. A purificação de RNA e Análise de RNA-Seq
Em geral, 1-30% de regiões genómicas alvo pode ser purificado utilizando enChIP. Figura 3 inclui dados representativos mostram os rendimentos em enChIP análises de telómeros direccionamento e o promotor do interferão (IFN) reguladora factor-1 (IRF-1) gene. Como exemplos de resultados típicos, Tabela 1 lista as proteínas associadas com o IRF-1 promotor de uma forma de IFNy específico identificado por enChIP-SILAC, Tabela 2 lista as proteínas se ligam a telómeros identificados por enChIP combinada com espectrometria de massa (enChIP-MS) e Tabela 3 lista os RNAs associadas com telômeros identificados por enChIP-RNA-Seq.
Figura 1. Visão geral do enChIP. enChIP usando CRISPR (A, B) e TAL (C, D, E ) é mostrado. Um sítio de interesse está marcado com moléculas de ligação de ADN modificadas, tais como uma proteína ou o sistema TAL CRISPR que consiste de uma forma cataliticamente inactiva de Cas9 (DCA) e a guia de ARN (gRNA). As interacções moleculares são fixadas com formaldeído ou outros agentes de reticulação, caso seja necessário. Subsequentemente, fixa cromatina é fragmentado por sonicação ou digestão enzimática. As regiões genómicas são marcados purificado por purificação de afinidade. Finalmente, a reticulação é invertida, e as moléculas interagem (regiões genômicas, RNAs e proteínas) são identificados utilizando sequenciamento próxima geração e espectrometria de massa. Por favor clique aqui para ver uma versão maior desta figura.
Figura 2. Seqüência de gBlock. O promotor U6 (em preto), o G nucleotídeo bntes a sequência de guia (em azul), a sequência de guia (gRNA espaçador) (em vermelho), a sequência de suporte (em verde), e uma sequência de terminador (em laranja) são mostrados.
Figura 3. Rendimentos de análises enChIP representante. Insumos (A) Porcentagem para a meta de IRF-1 lócus ea Sox2 lócus não-alvo. Entradas (B) Porcentagem para os telômeros-alvo e não-alvo y-satélites. Os números foram adaptados e modificados a partir de publicações anteriores 15,16.
Categorias | Proteínas |
Transcrição | DDX1, PARP1, CKAP4, Pescadillo homólogo, PURβ, activado RNA polimerase II activador transcricional de p15, BTF3, Myb de ligação1A proteína |
Desacetilação Histona, componentes corepressor | RBBP4, PA2G4, TBL3 |
Acetiltransferase | Proteína arginina metiltransferase N-1 |
DNA topoisomerase | DNA topoisomerase 2α |
Histones | Histona H2A.Z, H3.2 histona |
Tabela 1:. Exemplos de proteínas associadas com o promotor de IRF-1 humano região de uma forma de IFNy específico identificado por enChIP-SILAC A tabela foi adaptada de uma publicação anterior 16.
Categorias | Proteínas |
Proteínas se ligam a telómeros de mamíferos | PML, RPA, CDK1, PARP1, PCBP1 |
Telômero-binding proteínas em levedura ou outros organismos | IMP4 |
As proteínas que interagem com o telómero de ligação proteínas [proteína de ligação dos telômeros associado] | DNA polimerase α (Pola1) [Cdc13p], ARMC6 [TRF2], CTBP1 [FoxP2-POT1], exportin-5 [terc], GNL3L [TRF1], exportin-1 [terc], 14-3-3 [terc] |
Proteínas que localizam a heterochromatin | BEND3 |
Proteínas reguladoras marcas epigenéticas | KDM5C |
Proteínas cujas mutações afetam a função dos telômeros | Α DNA polimerase (Pola1), Hat1, Nup133, CDK7, DPOE1, PRDX1, TYSY, glutamato-cisteína-ligase, glutarredoxina, SMRC1 |
Tabela 2:. Exemplos de proteínas associadas com telômeros rato identificadas por enChIP-MS A tabela foi adapted de uma publicação anterior 15.
Categorias | RNAs |
Componentes da telomerase | Terc, rMRP |
Telomeric RNAs | Terras |
scaRNAs | Scarna6, Scarna10, Scarna13, Scarna2 |
H / ACA snoRNAs | Snora23, Snora74a, Snora73b, Snora73a |
C / D snoRNAs | Snord17, Snord15a, Snord118 |
lncRNA | Neat1 |
Tabela 3: Exemplos de RNAs associadas com telômeros rato identificadas por enChIP-RNA-Seq A tabela foi adaptada de uma publicação anterior 17..
Here, we describe the purification of specific genomic regions using engineered DNA-binding molecules such as the CRISPR system and TAL proteins, and the identification of proteins and RNAs bound to these genomic regions. Binding of engineered DNA-binding molecules to the genome may affect chromatin structure, including nucleosome positioning, and may abrogate genomic functions, as described in CRISPR interference experiments21. To avoid these potential aberrant effects, we propose specific guidelines for choosing target genomic regions. First, to avoid potential inhibition of the recruitment of RNA polymerases and transcription factors, as well as disruption of nucleosome positioning around the transcription start site, the target regions for analyses of promoter regions should be several hundred base pairs upstream of (5' to) the transcription start site. By contrast, when analyzing genomic regions with distinct boundaries, such as enhancers and silencers, genomic regions that are directly juxtaposed to these regions can be targeted because it is less likely that the binding of engineered DNA-binding molecules will affect their functions. Furthermore, it is best to avoid using target regions that are conserved among different species, because important DNA-binding molecules often bind to evolutionarily conserved regions and inhibition of their binding might disrupt the functions of the target genomic regions. In this regard, it is always necessary to check that the function of the target genomic region is maintained in the established cells used for enChIP analyses. Because multiple gRNAs can be tested easily and it is tedious and expensive to generate multiple versions of TAL or zinc-finger proteins recognizing different target genomic regions, enChIP using CRISPR is more advantageous than enChIP using other proteins.
It has been shown that dCas9 binds to off-target sites although affinity to those sites might be weaker than that to the target sites22-25. There are several ways to manage contamination of molecules bound to those off-target sites. First, the use of several, at least two, different gRNAs would be recommended. Those molecules commonly observed in enChIP using distinct gRNAs would be true positives. Second, comparison of different conditions for enChIP would be effective in cancelling contamination of non-specific molecules and molecules bound to off-target sites. Examples of those comparison sets would be (i) stimulation (-) and (+), or (ii) different cell types such as T cells vs. B cells. Finally, quantitative analysis of binding of candidate molecules should be performed to confirm their specific binding to the target sites. It is preferable to prepare cells expressing only dCas9 but not gRNA as a negative control.
Using enChIP analyses, we were able to successfully identify a number of known and novel molecules interacting with specific genomic regions (Tables 1-3)14-17. However, this technique failed to detect some other known proteins interacting with these regions. For example, STAT1 reportedly associates with the IRF-1 promoter upon IFNγ stimulation8, but our enChIP-SILAC analysis did not detect STAT1 as a protein induced to interact with this genomic region16. In addition, in the enChIP-MS analysis of telomeres, we did not detect shelterin proteins consisting of TRF-1 and TRF-215, which have been shown to interact with telomeres26. There are a few potential reasons for these discrepancies. First, the stoichiometry of binding of Stat1 to the IRF-1 promoter might be very low. It is reasonable that enChIP-MS, including enChIP-SILAC, detects proteins that are more abundantly associated with target genomic regions; hence, the analysis of more cells might be necessary to detect these proteins. Increases in the sensitivities of MS instruments would also contribute to the efficient detection of proteins with low stoichiometric binding. Second, some proteins, possibly including Stat1 and shelterins, might be difficult targets for MS analyses. Third, in our analysis of telomere-binding proteins15, the 3×FLAG-TAL proteins recognizing telomeres (3×FN-Tel-TAL) might have blocked the binding of shelterins to telomeres in a competitive fashion.
In contrast to the relative difficulty of detecting transcription factors binding to specific genomic regions using enChIP, we successfully identified epigenetic regulators such as histone modification enzymes using enChIP analyses. The success of this technique may be due to the fact that epigenetic regulators bind to a broad range of genomic regions; hence, more proteins per genomic region are available for MS. Because epigenetic regulators are increasingly recognized as important targets for drugs against intractable diseases such as cancer, enChIP would be a useful tool for the identification of epigenetic drug targets.
The authors have filed a patent on enChIP (Patent name: 'Method for isolating specific genomic regions using DNA-binding molecules recognizing endogenous DNA sequences'; Patent number: PCT/JP2013/74107). H.F. is a member of the Advisory Board of Addgene.
Este trabalho foi apoiado pela Fundação para a Ciência Takeda (TF); a Fundação Asahi Glass; o Memorial Foundation Uehara (HF); o Kurata Memorial Hitachi Ciência e Fundação de Tecnologia (FT e IC); Conceda-in-Aid para Jovens Cientistas (B) (# 25830131), Grant-in-Aid para a Investigação Científica (C) (# 15K06895) (TF); e um Grant-in-Aid para a Investigação Científica em 'Ciclo de transcrição' áreas inovadoras (# 25118512 & # 15H01354), Grant-in-Aid para a Investigação Científica (B) (# 15H04329), Grant-in-Aid para a Investigação exploratória ( # 26650059) e 'Genome Suporte' (# 221S0002) (HF) do Ministério da Educação, Cultura, Desporto, Ciência e Tecnologia do Japão.
Name | Company | Catalog Number | Comments |
gBlock synthesis service | Life Technologies | Gene Synthesis by GeneArt | |
gBlock synthesis service | IDT (Integrated DNA Technologies) | gBlocks Gene Fragments | |
pSIR-neo | Addgene | 51128 | |
pSIR-GFP | Addgene | 51134 | |
pSIR-DsRed-Express2 | Addgene | 51135 | |
pSIR-hCD2 | Addgene | 51143 | |
TAL synthesis service | Life Technologies | GeneArt Precision TALs | |
3xFLAG-dCas9/pCMV-7.1 | Addgene | 47948 | |
3×FLAG-dCas9/pMXs-puro | Addgene | 51240 | |
3×FLAG-dCas9/pMXs-IG | Addgene | 51258 | |
3×FLAG-dCas9/pMXs-I2 | Addgene | 51259 | |
3×FLAG-dCas9/pMXs-neo | Addgene | 51260 | |
anti-FLAG M2 Ab | Sigma-Aldrich | F1804 | |
FITC-conjugated anti-FLAG M2 | Sigma-Aldrich | F4049 | |
DMEM medium for SILAC | Life Technologies | 89985 | Other medium can be purchased from Life Technologies |
Dialyzed FBS for SILAC | Life Technologies | 89986 | |
L-Lysine-2HCl for SILAC | Life Technologies | 89987 | For Light medium |
L-Arginine-HCl for SILAC | Life Technologies | 89989 | For Light medium |
L-Lysine-2HCl, 13C6 for SILAC | Life Technologies | 89988 | For Heavy medium |
L-Arginine-HCl, 13C6, 15N4 for SILAC | Life Technologies | 89990 | For Heavy medium |
Complete, mini, EDTA-free | Roche Diagnostics | 4693159 | |
Ultrasonic Disruptor UD-201 | Tomy Seiko | ||
ChIP DNA Clean & Concentrator | Zymo Research | D5205 | |
Dynabeads-Protein G | Life Technologies | DB10004 | |
RNasin Plus RNase Inhibitor | Promega | N2611 | |
Isogen II | Nippon Gene | 311-07361 | |
Direct-zol RNA Miniprep kit | Zymo Research | R2050 | |
LTQ Orbitrap Velos | Thermo Fisher Scientific | A component of a nanoLC-MS/MS system for MS analysis | |
nanoLC | Advance, Michrom Bioresources | A component of a nanoLC-MS/MS system for MS analysis | |
HTC-PAL autosampler | CTC Analytics | A component of a nanoLC-MS/MS system for MS analysis |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados