Method Article
Characterizing microbial community has been a longstanding goal in environmental microbiology. Next-generation sequencing methods now allow for the characterization of microbial communities at an unprecedented depth with minimal cost and labor. We detail here our approach to sequence bacterial 16S ribosomal RNA genes using a benchtop sequencer.
Una delle principali questioni in ecologia microbica è "chi è là?" Questa domanda si può rispondere utilizzando vari strumenti, ma uno degli standard d'oro di lunga durata è quello di sequenziare ampliconi 16S RNA ribosomiale (rRNA) gene generati da-livello di dominio PCR Le reazioni di amplificazione di DNA genomico. Tradizionalmente, questo è stato eseguito da clonazione e Sanger (elettroforesi capillare) sequenziamento degli ampliconi della PCR. L'avvento di sequenziamento di prossima generazione ha enormemente semplificato e aumentato la profondità di sequenziamento per 16S rRNA sequenziamento del gene. L'introduzione di sequencer da banco permette ora piccoli laboratori per svolgere il loro 16S rRNA sequenza in-casa in una questione di giorni. Qui, un approccio per 16S rRNA gene ampliconi sequenziamento utilizzando un banco di nuova generazione sequencer è dettagliata. Il DNA ambientale viene prima amplificato mediante PCR utilizzando primer che contengono le schede di sequenziamento e codici a barre. Essi vengono poi accoppiati alle particelle sferiche tramite emulsione PCR. Le particelle sono loaded su un chip monouso ed il chip viene inserito nella macchina sequenziamento dopo di che viene eseguito il sequenziamento. Le sequenze vengono recuperati in formato FASTQ, filtrati ed i codici a barre vengono utilizzati per stabilire l'appartenenza campione della legge. Il filtrato e categorizzata letture vengono poi ulteriormente analizzati utilizzando gli strumenti disponibili pubblicamente. Un'analisi esempio in cui la legge sono stati classificati con un algoritmo di tassonomia trovare all'interno del pacchetto software Mothur è dato. Il metodo qui descritto è semplice, poco costoso e semplice e dovrebbe aiutare i laboratori più piccoli di trarre vantaggio dalla rivoluzione genomica in corso.
Sequenziamento metagenomiche è una tecnologia molto potente in quanto esso si rivolge la totalità delle informazioni genetiche contenute in un campione ambientale. Ci sono diversi gusti di sequenziamento metagenomica, tra cui shotgun sequencing, librerie di grandi inserti e amplicon sequenziamento. Amplicon sequenziamento offre il vantaggio di essere relativamente poco costoso, veloce e in grado di produrre legge da una singola regione genomica che può essere generalmente allineato. Inoltre, il flusso dei dati per il sequenziamento degli ampliconi è per lo più standardizzata. Tuttavia, poiché si basa sulla PCR, ha tutti i pregiudizi legati alla specificità incompleta, copertura incompleta e Primer polarizza 1,2, il che rende questo approccio semiquantitativo al meglio. Diverse regioni genomiche possono essere mirati per il sequenziamento degli ampliconi compresi i geni funzionali, ma le opzioni più popolari sono da utilizzare geni marcatori quali il gene 16S rRNA per generare un profilo di comunità. Tradizionalmente, 16S rRNA gene ampliconi sequencing è stata effettuata utilizzando tecniche di alta intensità di lavoro che comprendeva la clonazione in E. coli, colonia di raccolta ed estrazione plasmide seguita da Sanger sequenziamento sui plasmidi isolati, e, di conseguenza, la maggior parte degli studi analizzati meno di 100 cloni per campione. Sequenziamento di prossima generazione ha portato due importanti progressi: massiccia parallelizzazione delle reazioni di sequenziamento e, soprattutto, la separazione clonale di modelli senza la necessità di inserire frammenti di geni in un ospite. Questo ha semplificato enormemente il sequenziamento del 16S rRNA ampliconi del gene, che ora è tornato come una caratteristica di routine di molti studi di microbiologia ambientale, risultando in un "rinascimento" per il 16S rRNA gene ampliconi sequenziamento 3.
Dal momento che l'avvento di Roche 454 sequenziamento nel 2005 4, molte altre tecnologie di sequenziamento di prossima generazione sono apparsi sul mercato (ad esempio, Illumina, Solido, PacBio). Più recentemente, l'introduzione della sequenza bancors portati a piccoli laboratori la capacità di sequenziamento, una volta esclusivo di grandi centri di sequenziamento. Cinque macchine da banco sono attualmente disponibili: la 454 GS Junior, la Ion Torrent Personal Genome automatico (PGM) e Proton, e la Illumina MiSeq e NextSeq 500 Mentre tutti questi sequencer offrono meno legge per corsa e un minor numero di basi per ogni dollaro di più pieno sequencer scala, sono più flessibili, rapidi, e le loro bassi costi di acquisizione e di esecuzione li rende alla portata di piccoli laboratori accademici. Sequencer da banco sono particolarmente adatte per ampliconi, piccolo genoma e bassa complessità metagenoma sequenziamento negli studi di microbiologia ambientale, perché questo tipo di studi in genere non richiede una profondità estrema di sequenziamento. Ad esempio, è generalmente accettato che per il 16S rRNA sequenziamento del gene studia il numero di letture per campione non è di primaria importanza, come ~ 1000 recita in grado di generare gli stessi schemi come multi-milioni di letture dataset 5. Detto questo, da banco di nuova generatio n sequencer ancora generano grandi quantità di dati di sequenza, con rese massime di ~ 35 Mbp (454 GS Junior), ~ 2 Gbp (Ion Torrent PGM), ~ 10-15 Gbp (Ion Torrent Proton), ~ 10 Gbp (Illumina MiSeq) e ~ 100 GBP (Illumina Successivo Seq 500), che è più che sufficiente per la maggior parte degli studi di microbiologia ambientale.
Sequenziamento di prossima generazione di ampliconi 16S rRNA utilizzando sequenziatori da banco è stata recentemente applicata a una vasta gamma di ambienti. Ad esempio, la Ion Torrent PGM è stata utilizzata per la comunità analisi di sterili di miniera di uranio che avevano particolarmente pH elevato e bassa permeabilità 6, dei sistemi di acquacoltura a ricircolo 7, di idrocarburi contaminati suoli artici 8,9, di sabbie petrolifere di estrazione sedimenti colpite e biofilm dal fiume Athabasca 10,11, della rizosfera di salici piantati in terreni contaminati 12, dei corpi umani e animali 13-16 e di digestori anaerobici 17.
jove_content "> In questo contributo abbiamo dettaglio il nostro approccio alla sequenza 16S rRNA ampliconi del gene in casa utilizzando un banco sequencer di nuova generazione (la Ion Torrent PGM). Dopo l'estrazione del DNA, i geni 16S rRNA sono amplificati utilizzando primer batteriche a livello di dominio che contengono adattatori di sequenziamento e, sequenze specifiche del campione unici (codici a barre). Gli ampliconi sono purificati, quantificati e riunite in un rapporto equimolare. I campioni aggregati vengono poi amplificati clonale in una emulsione PCR e sequenziati. sequenze risultanti vengono analizzati utilizzando strumenti bioinformatici disponibili al pubblico ( ad esempio, Mothur).1 16S rRNA gene Amplicon Biblioteca Preparazione con il metodo Fusion
2 Amplicon Purificazione, quantificazione e Pooling
3. Emulsione PCR e sequenziamento
Analisi 4. base dei dati di sequenza
Dopo purificazione su gel, con 25 cicli di amplificazione PCR, i prodotti di amplificazione sono generalmente ad una concentrazione di 0,2-10,0 ng in 50 ml di acqua. Questo può variare notevolmente a seconda della concentrazione di DNA di partenza, il tipo di campione e il kit di purificazione utilizzato. Si raccomanda di mantenere il numero di cicli di PCR per il più basso possibile per evitare la formazione chimera e diminuire pregiudizi amplificazione, tenendo presente che tutti i campioni devono essere amplificati utilizzando lo stesso numero di cicli. Per ridurre al minimo il numero di policlonale letture e sfere vuote e massimizzare il numero di letture, il rapporto Qubit deve essere compresa tra 0,1 e 0,3 e la fluorescenza FAM deve essere superiore a 200 314 Utilizzo di un chip su una Ion Torrent PGM, la produzione media è di circa 0,3-0,5 M buona qualità legge dopo il filtraggio dei risultati in Mothur. Tabella 2 mostra una tipica composizione del numero di letture dopo ogni fase della procedura per una corsa contenente 36 ambienti multiplexaticampioni mentali amplificato con primer mira la regione V3-4 delle 16S e analizzati utilizzando Mothur. In Mothur, la procedura trim.seqs generare un file "* .trim.fasta" che contiene le sequenze che passavano i filtri di qualità e un "* .scrap.fasta" che contiene le sequenze che non ha superato i filtri di qualità con la ragione di reiezione in sequence header. Quando fornito con codici a barre nel file "oligo", questo comando genererà anche un file "* .Gruppi" che contiene l'appartenenza al gruppo di ogni sequenza in base alla sequenza di codice a barre. La procedura classify.seqs genera un ".tax.summary" che può essere aperto in Excel. Questo file contiene il riassunto della appartenenza tassonomica (in linee) per ciascuno dei campioni (nelle colonne). Questo file può essere utilizzato per analisi statistiche a valle e di visualizzare composizione della comunità a vari livelli tassonomici. Il file ".taxonomy" contiene il tassonomica dettagliataaffiliazione per ogni sequenza. La composizione media della comunità a livello di phylum / classe in tutti i 36 campioni è mostrato in Figura 1.
Figura 1 Composizione media comunitaria a livello di phylum / classe per tutti i campioni.
avanti | TACGGRAGGCAGCAG | |
codice a barre | CTAAGGTAAC | Sample01 |
codice a barre | TAAGGAGAAC | Sample02 |
codice a barre | AAGAGGATTC | Sample03 |
codice a barre | TACCAAGATC | Sample04 |
codice a barre | CAGAAGGAAC | Sample05 |
codice a barre | CTGCAAGTTC | Sample06 |
codice a barre | TTCGTGATTC | Sample07 |
codice a barre | TTCCGATAAC | Sample08 |
codice a barre | TGAGCGGAAC | Sample09 |
codice a barre | CTGACCGAAC | Sample10 |
Tabella 1 Esempio di file "oligo" per l'uso in Mothur.
# Di legge | % Del passo precedente | Avg. per campione | |
Numero di pozzi | 1262519 | - | 35.070 |
Wells con perline | 1114108 | 88.20% | 30.947 |
Perline con i modelli | 1112746 | 99.90% | 30.910 |
Perline monoclonali | 826.805 | 74.30% | 22.967 |
Buona qualità legge (uscita dal sequencer) | 782.204 | 94.60% | 21.728 |
(Lunghezza di 150bp min. Media. Punteggio di qualità di 20 su una finestra 50bp, min.) Passo Mothur filtri | 372.168 | 47.60% | 10.338 |
Classificato al livello di phylum in GreenGenes (il 50% della soglia di confidenza) | 342.171 | 91.90% | 9505 |
Classificata a livello familiare in GreenGenes (il 50% della soglia di confidenza) | 316.512 | 92.50% | 8.792 |
Classificato al livello di genere in GreenGenes (il 50% della soglia di confidenza) | 289.899 | 91.60% | 8053 |
Tabella 2 Numero di letture prodotte da una corsa tipica per 36 campioni ambientali multiplexing su una Ion Torrent 314 chip.
Il metodo presentato qui è semplice e poco costoso, e dovrebbe consentire a molti laboratori di accedere al potere di sequenziamento metagenomica. Anche se varia a seconda della piattaforma di sequenziamento utilizzate, una volta che le librerie sono costruite è richiesto molto poco hands-on tempo, con la maggior parte del processo di essere automatizzate. Per la piattaforma di sequenziamento qui utilizzato (Ion Torrent PGM), la procedura completa può essere eseguita in due giorni di lavoro. Al momento della scrittura (settembre 2013), i costi dei reagenti relativi all'esempio sopra descritto sono stati i seguenti: amplificazione PCR di 36 campioni: $ 25, purificazione gel e DNA PicoGreen quantificazione di 36 campioni: $ 125, emulsione PCR per un campione ampliconi pool : $ 150 e reagenti di sequenziamento: $ 250, per un totale di $ 550 o $ 15 per campione o $ 0,0015 lettura qualità-filtrato. Questo prezzo non comprende contratto di strumento di servizio, gli ammortamenti strumento, stipendio tecnico e l'utilizzo dello spazio in laboratorio.
tenda "> Uno dei passi più importanti è quello di riunire tutti i prodotti in un rapporto equimolare, al fine di recuperare numero simile di letture per ciascuno dei campioni. PicoGreen quantificazione è stato utilizzato qui, ma altri metodi potrebbe essere adatto, anche se meno preciso (ad esempio, la quantificazione UV, quantificazione a base di gel). Anche facendo la quantificazione più accurata e messa in comune, vi è una certa variabilità nel numero di letture per campione, e nel tipico run indicato nella tabella 2, che varia da 4.380 a 32.750 legge, con una media di 10.338 letture. Se l'elaborazione di gran numero di campioni (più di 40-50), singola colonna di purificazione gel può essere sostituito da purificazione gel in lamiera o di purificazione utilizzando perline con un taglio rigoroso dimensioni (ad esempio, AMPure perline) .Ad oggi, la tecnologia di sequenziamento di nuova generazione più utilizzato per il gene 16S rRNA è 454. tecnologia di sequenziamento La Ion Torrent utilizzato in questo protocollo è concettualmente molto similea 454 e le due tecnologie sono soggette allo stesso tipo di errori di sequenziamento. Non sorprendentemente, è stato dimostrato che il sequenziamento Ion Torrent portato risultati di sequenziamento molto simili a 454 sequenziamento 10. Recentemente, molti ricercatori hanno esplorato l'uso della tecnologia Illumina per 16S rRNA gene ampliconi sequenziamento 18,19. In ogni caso, sarebbe facile per adattare l'attuale protocollo per altri sequencer da banco come l'Illumina MiSeq o la 454 GS Junior cambiando le sequenze dei primer fusione per abbinare gli adattatori e codici a barre necessari per queste tecnologie di sequenziamento, come nel metodo descritto recentemente per il Illumina MiSeq 19. In alternativa, i ricercatori potrebbero seguire i passi 1 e 2 del protocollo qui descritto e inviare i ampliconi pool a un centro di sequenziamento, dove sarebbero stati eseguiti l'emulsione PCR e sequenziamento.
Il gene 16S rRNA letture sono stati tagliati e classificati utilizzando Mothur, ma molte altre analisi può essere eseguita su16S rRNA ampliconi del gene. Ad esempio, la diversità beta può essere valutata calcolando le distanze Unifrac tra ogni coppia campione utilizzando la procedura descritta in http://unifrac.colorado.edu/ 20. Alpha indici di diversità e il numero di unità tassonomiche operative di ciascun campione possono essere calcolati utilizzando strumenti all'interno QIIME come AmpliconNoise 21 o utilizzando la procedura descritta da Huse et al. 22 e disponibili all'interno Mothur.
I primer usati qui amplificato le regioni variabili 3 e 4 del gene 16S rRNA, ma molte altre regioni potrebbero essere mirati. In questo studio, i geni 16S rRNA sono stati amplificati da materiale vegetale e la scelta di fondo è stata fatta per evitare l'amplificazione del cloroplasto 16S rRNA gene 23,24. Vi è un'ampia varietà di altri primer disponibili che variano in termini di durata del prodotto, potenza tassonomica e l'utilità 25,26. Tuttavia, in tutti i casi 200-400 bp legge del gene 16S rRNA non può essere classificato in modo affidabile a livello di specie, e le analisi sono limitate al genere e livelli tassonomici più elevati. Altri geni potrebbero essere più appropriato se sono necessarie informazioni a livello di specie, come i cpn60 e rpoB geni 27,28. Future gocce drastici nel costo di sequenziamento e di aumenti nel potere di strumenti analitici potrebbero rendere fattibile sostituire 16S rRNA gene sequencing da metagenomica fucile, ma fino ad allora 16S rRNA sequenziamento del gene rimane il gold standard di microbiologia ambientale.
The authors have nothing to disclose.
Development of the method presented here has been carried out with various sources of funding, including Genome Canada and Genome Quebec, Environment Canada STAGE program and internal NRC funds.
Name | Company | Catalog Number | Comments |
Ion 314 Chip Kit v2 | Life Technologies | 4482261 | |
Ion PGM Sequencing 200 Kit v2 | Life Technologies | 4482006 | |
Ion PGM Template OT2 200 Kit | Life Technologies | 4480974 | |
HotStarTaq Plus Master Mix Kit | Qiagen | 203646 | |
Primers and probes | IDT | NA | |
Qiaquick Gel Extraction Kit | Qiagen | 28704 | |
BSA 20 mg/ml | Roche | 10,711,454,001 | |
Dynabeads MyOne Streptavidin C1 | Life Technologies | 65001 |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon