Method Article
Abbiamo sviluppato un metodo economico per seguire la dinamica allelica del polimorfismo non a singolo nucleotide che può essere facilmente adattata agli archivi congelati dell'evoluzione sperimentale. Una tecnica di tripletta PCR è stata accoppiata con elettroforesi capillare parallela automatizzata per quantificare la frequenza relativa di un allele di inserzione nel corso dell'evoluzione sperimentale.
Le varianti strutturali (SV) (cioè delezioni, inserzioni, duplicazioni e inversioni) sono ora note per svolgere un ruolo importante nella variazione fenotipica e, di conseguenza, in processi come la determinazione della malattia o l'adattamento a un nuovo ambiente. Tuttavia, le varianti a singolo nucleotide ricevono molta più attenzione delle SV, probabilmente perché sono più facili da rilevare e i loro effetti fenotipici sono più facili da prevedere. Lo sviluppo di tecnologie di sequenziamento profondo a breve e lunga lettura ha notevolmente migliorato il rilevamento delle SV, ma la quantificazione della loro frequenza dai dati di sequenziamento aggregato (poolseq) è ancora tecnicamente complessa e costosa.
Qui, presentiamo un metodo piuttosto semplice ed economico, che consente ai ricercatori di seguire la dinamica della frequenza dell'allele SV. Come esempio di applicazione, seguiamo la frequenza di inserimento di una sequenza di inserzione (IS) nelle popolazioni sperimentali evolutive di batteri. Questo metodo si basa sulla progettazione di triplette di primer attorno ai bordi delle varianti strutturali, in modo tale che gli ampliconi prodotti dall'amplificazione del wild-type (WT) e degli alleli derivati differiscano in dimensioni di almeno il 5% e che la loro efficienza di amplificazione sia simile. La quantità di ciascun amplicone viene quindi determinata mediante elettroforesi capillare parallela e normalizzata a una curva di calibrazione. Questo metodo può essere facilmente esteso alla quantificazione della frequenza di altre varianti strutturali (delezioni, duplicazioni e inversioni) e agli approcci pool-seq di popolazioni naturali, comprese le popolazioni patogene all'interno dei pazienti.
Le varianti strutturali (SV) sono alterazioni della sequenza genomica, che generalmente colpiscono 50 bp o più. Le quattro categorie di SV descritte sono inserimenti di grandi dimensioni, grandi cancellazioni, inversioni e duplicazioni. Fino a poco tempo fa, è stata dedicata maggiore attenzione alle varianti a singolo nucleotide (SNV) che alle varianti strutturali, in termini di effetti fenotipici e del loro ruolo come determinanti genetici della malattia, o del loro contributo all'adattamento. Ciò è probabilmente dovuto al fatto che è più facile rilevare gli SNV e prevederne gli effetti fenotipici. Tuttavia, le tecnologie di sequenziamento profondo a breve e lunga lettura hanno notevolmente migliorato la rilevazione delle SV, almeno in genomi singoli individuali o clonali1. Parallelamente, i loro effetti fenotipici sono stati meglio caratterizzati e sono stati documentati molti esempi della loro implicazione come determinanti genetici della malattia umana 2,3 o dell'adattamento ad un nuovo ambiente4.
Le delezioni e le inserzioni, spesso dovute a inserzioni di elementi genetici mobili (MGE), sono molto più dirompenti dei polimorfismi a singolo nucleotide (SNP) e portano a mutazioni frameshift e modifiche della struttura proteica. Le delezioni e le inserzioni MGE all'interno dei geni provocano quasi sempre l'inattivazione genica, e le inserzioni in regioni non codificanti possono portare alla repressione o all'espressione costitutiva di geni adiacenti quando le sequenze di inserzione (IS) contengono sequenze promotrici o di terminazione5. Mentre il knockout di geni essenziali porta a chiari effetti dannosi sulla forma fisica batterica, la perdita di geni non essenziali è vantaggiosa in alcuni casi. Nonostante i loro costi intrinseci, le duplicazioni possono anche essere vantaggiose e partecipare all'adattamento in quanto portano a un cambiamento nel dosaggio genico; Un aumento dell'attività di una proteina specifica può essere vantaggioso a seconda delle condizioni6.
Le popolazioni di evoluzione sperimentale microbica sono di solito iniziate con cloni. Questa iniziale assenza di diversità genetica, combinata con la caratteristica dell'"ambiente chiuso" delle provette, porta a un potenziale molto limitato di evoluzione per guadagno genico attraverso il trasferimento genico orizzontale e la ricombinazione. In queste condizioni specifiche, il contributo all'adattamento di delezioni, duplicazioni e inserimento intragenomico di MGE è particolarmente importante; i batteri spesso si adattano attraverso mutazioni con perdita di funzione (principalmente a causa di delezioni o inserzioni di MGE), colpendo geni che non sono utiliin ambienti artificiali stabili, spesso ricchi di sostanze nutritive, 7. Nell'esperimento di evoluzione di E. coli più longevo, le inserzioni di IS150 sono particolarmente frequenti tra le popolazioni evolute dopo 50.000 generazioni, con elementi IS che rappresentano il 35% delle mutazioni che raggiungono un'alta frequenza nelle popolazioni che mantengono il loro tasso di mutazione del punto ancestrale8.
Gli studi di evoluzione e risequenziamento accoppiano l'evoluzione sperimentale e le tecnologie di sequenziamento di nuova generazione (NGS) per studiare come i batteri si adattano, a livello fenotipico e genomico, a diverse condizioni ambientali e stress, come diverse fonti di carbonio ed energia, antibiotici e stress osmotico 9,10,11 . Questi studi tipicamente ottengono informazioni genomiche sulle popolazioni evolute o sui cloni solo nel punto finale sperimentale e, in alcuni casi, in un numero di punti temporali intermedi12,13,14. Questi dati forniscono informazioni sui geni e sui percorsi coinvolti nell'adattamento a un determinato ambiente, ma raramente consentono ai ricercatori di seguire le dinamiche degli alleli emergenti e ampi de novo nel tempo.
Un approccio per seguire queste dinamiche è quello di scegliere un numero limitato di alleli segreganti di interesse (a causa della funzione dei geni che influenzano, perché si muovono in parallelo in popolazioni indipendenti, ecc.) e utilizzare il sequenziamento amplico per quantificare la proporzione allelica, raggruppando molti punti temporali nella stessa sequenza15. Questo metodo è stato utilizzato con successo per seguire la dinamica di varianti di piccole dimensioni (SNPs o 1 bp indels) in16 e17 popolazioni naturali di microbi. Tuttavia, nel caso di indels più grandi o inserimenti MGE, la differenza di dimensioni degli ampliconi induce differenze di efficienza PCR, che distorcono la relazione tra proporzioni leggere e alleliche. In alcuni casi, la differenza di dimensioni tra i due alleli è superiore alla lunghezza classica dell'amplicone. Qui, abbiamo accoppiato una tecnica di tripletta PCR con elettroforesi capillare parallela automatizzata per quantificare la frequenza relativa di un allele di inserzione in base alla discriminazione delle dimensioni. Questo approccio consente lo sfruttamento di punti temporali sperimentali sottoutilizzati per determinare la dinamica di un allele mutante emergente e per seguire la sua frequenza di fissazione o perdita, in modo economicamente vantaggioso. Abbiamo applicato questo metodo per tracciare gli alleli mutS emergenti, mutati attraverso un'inserzione IS10, fornendo al genotipo mutato un fenotipo ipermutatore.
Questo metodo richiede due alleli bersaglio con una differenza di dimensioni del ≥5%. In primo luogo, le triplette di primer sono progettate per produrre frammenti di dimensioni simili, che condividono un primer comune. In secondo luogo, le condizioni di PCR sono ottimizzate e viene prodotta una curva di calibrazione utilizzando miscele di gDNA wild-type (WT) e mutante. Infine, i campioni vengono amplificati mediante PCR e la frequenza relativa di ciascun allele viene quantificata mediante elettroforesi capillare quantitativa parallela.
L'impostazione di questo protocollo richiede una conoscenza precisa del punto di inserimento, cancellazione, inversione o duplicazione all'interno della sequenza ancestrale. Queste informazioni sono solitamente ottenute mediante sequenziamento dell'intero genoma (WGS) dei campioni finali o intermedi. Nel seguente protocollo, il principio generale per il caso di una mutazione di inserzione è dato per ogni fase, insieme a un caso rappresentativo in cui viene seguita la frequenza di un'inserzione IS10 nel gene mutS in una popolazione evolutiva sperimentale di E. coli. In questa popolazione, WGS della popolazione endpoint ha identificato l'inserimento di un IS10 di 1.329 bp tra le posizioni 2.463 e 2.471, con conseguente duplicazione di questo sito di inserimento. Questo metodo è applicabile agli altri tre tipi di SV e le specificità di ciascun caso sono fornite nella discussione.
1. Progettazione di primer a tripletta
Figura 1: Schema del disegno del primer della tripletta sul gene mutS WT e sull'inserzione mutante mutS IS10. Il triangolo nero rappresenta il sito di inserzione IS10 nel gene mutS. Il gene WT è in blu e l'IS10 è in arancione. I primer FW1 e RV1 contrassegnano il sito di inserimento IS10 e producono un amplicone WT da 155 bp. Il primer RV1 e il primer intra-IS10 FW2 producono un secondo amplicone da 226 bp. Fare clic qui per visualizzare una versione ingrandita di questa figura.
2. Ottimizzazione delle condizioni di PCR
3. Curva di calibrazione
4. Preparazione del campione
5. Quantificazione allelica
Utilizzando il DNA estratto da un clone ancestrale e un clone ipermutatore isolato dalla popolazione S2.11 alla generazione 1.000, abbiamo stabilito la curva di calibrazione mostrata in Figura 2. Le proporzioni effettive dei mutanti provenienti da miscele di DNA preparate in laboratorio e misurate dallo strumento di elettroforesi capillare parallela sono state collegate da una relazione lineare di pendenza 1,0706, con un R2 di 0,9705. Inoltre, c'era un buon accordo tra le repliche biologiche; La deviazione standard era compresa tra 0,61 e 17,74 attraverso i nove punti della curva standard.
Figura 2: Curva standard di calibrazione. Proporzione osservata rispetto alla proporzione attesa di mix di DNA WT/mutante. Le barre di errore rappresentano l'errore standard tra le repliche biologiche. Fare clic qui per visualizzare una versione ingrandita di questa figura.
Il DNA è stato estratto da 19 punti temporali che vanno dalla generazione 356 alla generazione 990, amplificati e quantificati mediante elettroforesi capillare parallela. Il software Prosize è stato utilizzato per identificare e quantificare ogni amplicone in ciascun campione. Questi risultati sono stati convertiti in proporzione allelica utilizzando la curva di calibrazione.
I risultati mostrati in Figura 3 rivelano una traiettoria non monotona dell'allele mutS che induce l'ipermutatore. La generazione 680 (giorno 102) è stato il primo punto temporale in cui l'allele mutante era in quantità sufficiente per essere rilevato mediante elettroforesi capillare parallela. L'allele mutante è poi aumentato rapidamente in frequenza e ha raggiunto il 66,7% alla generazione 713 (33 generazioni dopo). La frequenza dell'allele mutante è poi rimasta stagnante ed è stata del 76% dalla generazione 766, nonostante in precedenza fosse aumentata rapidamente in frequenza. Inaspettatamente, la frequenza dell'allele mutante si è poi ridotta dal 76% al 49% nel corso di 13 generazioni (2 giorni), dopo di che è aumentata fino alla fissazione.
Figura 3: Dinamica degli alleli ancestrali (WT) e derivati (mutS::IS10) nel corso di un'evoluzione sperimentale di 1.000 generazioni. La frequenza allelica ancestrale è in grigio e la frequenza allelica derivata è in blu. Fare clic qui per visualizzare una versione ingrandita di questa figura.
Figura 4: Progettazione del primer e posizione dell'amplicone per la quantificazione dei quattro tipi di varianti strutturali. I frammenti amplificati sono raffigurati in bianco e nero. Le frecce rappresentano i primer nel loro sito di ibridazione; Le frecce punteggiate rappresentano i primer che si ibridano ma non partecipano ad alcuna amplificazione del frammento, o perché non c'è primer accoppiato (duplicazione e inversione) o il tempo di allungamento è stato ridotto per evitare l'amplificazione di grandi ampliconi (inserimento e cancellazione). Fare clic qui per visualizzare una versione ingrandita di questa figura.
Qui, abbiamo proposto un metodo economico che consente di seguire la dinamica degli alleli SV adattativi emergenti nelle popolazioni evolutive sperimentali. Questo metodo combina le classiche tecniche di PCR e l'elettroforesi capillare parallela automatizzata, consentendo di determinare le quantità relative di due alleli. Una volta impostato, consente la quantificazione delle proporzioni alleliche in molti campioni in parallelo, ed è molto meno costoso del WGS. Questo metodo può essere visto come un equivalente del sequenziamento dell'amplicone per le mutazioni non-SNP e come una soluzione ai limiti tecnici del sequenziamento dell'amplicone di grandi SV. Abbiamo dimostrato che il metodo quantifica accuratamente la proporzione di mutanti non-SNP, utilizzando una curva di calibrazione che supera la distorsione PCR (Figura 2).
La caratterizzazione della dinamica degli alleli SV può essere utile per identificare mutazioni collegate attraverso la loro dinamica temporale parallela, o per calcolare i coefficienti di selezione e identificare le loro variazioni nel tempo. Nell'esempio di applicazione che abbiamo presentato qui, abbiamo identificato, tramite WGS end-point, che gli ipermutatori erano segreganti o fissi in varie popolazioni di E. coli in evoluzione sperimentale18. Queste popolazioni erano considerate ipermutatrici in quanto avevano mutazioni dirompenti (inserzione IS) in uno dei geni di riparazione del mismatch metilico (MMR) e avevano accumulato molte più mutazioni nel corso delle 1.000 generazioni di evoluzione sperimentale rispetto a quelle che non portavano mutazioni nei geni MMR (24,38 ± 1,75 contro 126,7 ± 19,57). È noto che le mutazioni nei geni MMR portano ad un aumento del tasso di mutazione, consentendo ai batteri di campionare molte più mutazioni di quanto i loro tassi di mutazione al basale consentano12,13. Tuttavia, un grande aumento del tasso di mutazione si traduce anche in un accumulo più rapido di mutazioni deleterie e un maggiore carico mutazionale14,15. È stato previsto che i mutatori siano transitoriamente vantaggiosi nelle popolazioni che si adattano a nuovi ambienti, poiché la proporzione di mutazioni benefiche è maggiore in questa situazione. Il background genetico benefico generato sotto un alto tasso di mutazioni consente ai mutanti di propagarsi attraverso una popolazione facendo l'autostop sulle mutazioni benefiche che generano19. Le dinamiche temporali della propagazione degli ipermutatori sono state studiate mediante simulazioni, e con il metodo che proponiamo qui, è possibile seguire la dinamica degli alleli mutatori mediati da IS in popolazioni sperimentali19.
Nei nostri risultati rappresentativi, la SV è un'inserzione IS, ma il metodo qui descritto può essere facilmente esteso agli altri tipi di SV (vedi Figura 4). Il design del primer a tripletta segue esattamente la stessa logica per la quantificazione della delezione come per la quantificazione dell'inserimento: due primer si trovano attorno al punto di delezione e il terzo primer si trova all'interno della sequenza eliminata. Per le inversioni e le duplicazioni, due dei primer si trovano attorno a uno dei punti di interruzione e il terzo si trova all'interno del frammento invertito / duplicato, vicino all'altro punto di interruzione e diretto verso l'esterno del frammento. Per inserzioni, delezioni e inversioni, ogni amplicone è specifico per uno degli alleli, ancestrale o derivato. Per le duplicazioni, uno degli ampliconi è comune ai due alleli e l'altro è specifico per l'allele derivato. Questo deve essere considerato quando si calcola la proporzione di alleli dalla curva di calibrazione.
Infine, abbiamo sviluppato questo metodo per seguire una SV nelle popolazioni di batteri ad evoluzione sperimentale, per le quali il sequenziamento "metagenomico" a livello di popolazione è pratica comune. Tuttavia, questo metodo può essere applicato anche a popolazioni evolutive sperimentali di organismi multicellulari in un approccio pool-seq, o al campionamento intra-ospite di patogeni virali o microbici17.
Questo metodo presenta alcune limitazioni. In primo luogo, gli alleli confrontati devono differire in dimensioni di almeno il 5%. Questo ci impedisce di seguire la dinamica degli alleli prodotti da inserimenti o delezioni molto piccole. Fortunatamente, queste dinamiche alleliche possono essere seguite dal sequenziamento dell'amplicone. In secondo luogo, la sequenza dell'allele derivato deve essere nota per consentire la progettazione dei primer attorno all'inserimento o alla cancellazione o ai punti di interruzione. In terzo luogo, la progettazione e l'ottimizzazione del primer sono necessarie per ogni sito. Pertanto, questo metodo è appropriato per seguire un numero limitato di coppie di alleli target di interesse. Se molti alleli devono essere seguiti nella stessa popolazione, suggeriamo NGS di più punti temporali.
Gli autori non hanno conflitti di interesse da rivelare.
Questo lavoro è stato supportato dall'ERC HGTCODONUSE (ERC-2015-CoG-682819) a S.B. I dati utilizzati in questo lavoro sono stati (parzialmente) prodotti attraverso le strutture tecniche GenSeq dell'Institut des Sciences de l'Evolution de Montpellier con il supporto di LabEx CeMEB, un programma ANR "Investissements d'avenir" (ANR-10-LABX-04-01).
Name | Company | Catalog Number | Comments |
96 Well Skirted PCR Plate | 4titude | 4Ti - 0740 | PCR |
Agarose molecular biology grade | Eurogentec | EP-0010-05 | Agarose gel electrophoresis |
Agilent DNF-474 HS NGS Fragment Kit Quick Guide for the Fragment Analyzer Systems | Agilent | PDF instruction guide | |
Buffer TBE | Panreac appliChem | A4228,5000Pc | Agarose gel electrophoresis |
Calibrated Disposable Inoculating Loops and Needles | LABELIANS | 8175CSR40H | Bacterial culture |
Dneasy Blood and Tissue Kit | Qiagen | 69506 | DNA extraction |
Electrophoresis power supply | Amilabo | ST606T | Agarose gel electrophoresis |
Fragment Analyzer Automated CE System | Agilent | Parallel capillary electrophoresis | |
Fragment DNA Ladder | Agilent | DNF-396, range 1-6000bp | Parallel capillary electrophoresis |
GENTAMICIN SULFATE SALT BIOREAGENT | Sigma-Aldrich | G1264-1G | Bacterial culture |
High Sensitivity diluent marker | Agilent | DNF-373 | Parallel capillary electrophoresis |
High Sensitivity NGS quantitative analysis kit | Agilent | DNF-474 | Parallel capillary electrophoresis |
Ladder quick load 1 kb plus DNA ladder | NEB | N0469S | Agarose gel electrophoresis |
LB Broth, VegitoneNutriSelect Plus | Millipore | 28713 | Bacterial culture |
Master Mix PCR High Fidelity Phusion Flash | Thermo Fisher Scientific | F548L | PCR |
Primers | Eurogentec | PCR | |
Prosize data analysis software v.4 | Agilent | V.4 | Parallel capillary electrophoresis |
Qubit assays | Invitrogen | MAN0010876 | DNA quantification |
Qubit dsDNA HS Assay Kit | LIFE TECHNOLOGIES SAS | Q32854 | DNA quantification |
Thermocycler | Eppendorf | Ep gradients | PCR |
UVbox, eBOX VX5 | Vilber Lourmat | Agarose gel electrophoresis visualisation | |
Water for injectable preparation | Aguettant | PROAMP | PCR |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon