Method Article
I protocolli descritti consentono la costruzione, la caratterizzazione e la selezione (contro il bersaglio di scelta) di una libreria di "domainome" fatta da qualsiasi fonte di DNA. Questo risultato è ottenuto da una pipeline di ricerca che combina diverse tecnologie: phage display, un reporter pieghevole e sequenziamento di nuova generazione con uno strumento web per l'analisi dei dati.
Pieghevole reporter sono proteine con fenotipi facilmente identificabili, quali resistenza agli antibiotici, cui pieghevole e la funzione è compromessa quando fusa a mal pieghevole proteine o casuale open reading frame. Abbiamo sviluppato una strategia dove, utilizzando TEM-1 β-lactamase (l'enzima che conferisce resistenza all'ampicillina) su scala genomica, possiamo selezionare collezioni di domini proteina correttamente piegata dalla parte codifica del DNA del genoma qualsiasi intronless. I frammenti di proteine ottenuti da questo approccio, il cosiddetto "domainome", sarà ben espresso e solubile, che li rende adatti per studi strutturali/funzionali.
Clonazione e visualizzando il "domainome" direttamente in un sistema di visualizzazione dei fagi, abbiamo mostrato che è possibile selezionare domini proteici specifici con le proprietà di associazione desiderata (ad es., per altre proteine o anticorpi), fornendo così essenziale informazioni sperimentali per l'identificazione dell'antigene o annotazione genetica.
L'identificazione dei cloni più arricchiti in una popolazione policlonale selezionata può essere realizzato utilizzando tecnologie di sequenziamento di nuova generazione romanzo (NGS). Per queste ragioni, abbiamo introdurre l'analisi di sequenziamento profondo della biblioteca stessa e le uscite di selezione per fornire informazioni complete sulla diversità, abbondanza e mappatura precisa di ogni frammento selezionato. I protocolli qui presentati mostrano i passaggi chiavi per la costruzione della libreria, la caratterizzazione e la convalida.
Qui, descriviamo un metodo di alto-rendimento per la costruzione e la selezione delle biblioteche di domini proteici piegato e solubile da qualsiasi fonte di partenza genica/genomica. L'approccio combina tre diverse tecnologie: phage display, l'uso di un reporter pieghevole e sequenziamento di nuova generazione (NGS) con uno strumento di web specifico per l'analisi dei dati. I metodi possono essere utilizzati in diversi contesti di ricerca basati su proteine, identificazione e annotazione di nuovi domini di proteine/proteine, caratterizzazione delle proprietà strutturali e funzionali di proteine note come pure la definizione di rete di interazione della proteina.
Molte questioni aperte sono ancora presenti nella ricerca di base di proteine e lo sviluppo di metodi per la produzione di proteine ottimale è un bisogno importante per diversi campi di indagine. Ad esempio, nonostante la disponibilità di migliaia di genomi procarioti ed eucarioti1, mappa corrispondente dei proteomi relativi con un'annotazione diretta delle proteine codificate e peptidi è ancora manca per la grande maggioranza degli organismi. Il catalogo dei proteomi completi sta emergendo come un obiettivo impegnativo che richiede uno sforzo enorme in termini di tempo e risorse. Il gold standard per annotazione sperimentale rimane la clonazione di tutti l'Open Reading Frame (ORF) di un genoma, costruendo il così chiamato "ORFeome". Di solito funzione genica viene assegnato in base su omologia di geni correlati di attività nota ma questo approccio è poco accurato a causa della presenza di molte annotazioni errate in riferimento database2,3,4, 5. Inoltre, anche per le proteine che sono state identificate e annotate, ulteriori studi sono richiesti per ottenere la caratterizzazione in termini di abbondanza, modelli di espressione in contesti diversi, incluse le proprietà strutturali e funzionali, nonché reti di interazione.
Inoltre, poiché le proteine sono composte da domini diversi, ognuno di loro che mostrano le caratteristiche specifiche e che contribuiscono in modo diverso alle funzioni della proteina, lo studio e la definizione esatta di questi domini possono consentire un quadro più completo, entrambi presso il singolo gene e a livello del genoma completo. Tutte le informazioni necessarie rendono la ricerca di base di proteine un campo ampio e impegnativo.
In questa prospettiva, un contributo importante potrebbe essere dato dai metodi imparziali e ad alta produttività per la produzione di proteine. Tuttavia, il successo di tali approcci, accanto a notevoli investimenti necessari, si basa sulla capacità di produrre la proteina solubile/stabile costrutti. Questo è un grande fattore di limitazione poiché è stato stimato che solo circa il 30% delle proteine può essere espresso con successo e prodotto a livelli sufficienti per essere sperimentalmente utile6,7,8. Un approccio per superare questa limitazione è basato sull'uso di DNA in modo casuale frammentato per produrre diversi polipeptidi, che insieme offrono sovrapposti rappresentazione di frammento di singoli geni. Solo una piccola percentuale dei frammenti di DNA generati casualmente sono ORFs funzionale mentre la grande maggioranza di loro è non funzionali (per la presenza di codoni di stop all'interno di loro sequenze) o codifica per un naturale (ORF in un frame diverso da quello originale) polipeptidi con nessun significato biologico.
Per affrontare tutti questi problemi, il nostro gruppo ha sviluppato una piattaforma di analisi conforme agli standard della proteina di alto-rendimento espressione e interazione che può essere utilizzata su una scala genomica9,10,11,12. Questa piattaforma integra le seguenti tecniche: 1) un metodo per selezionare raccolte di domini proteina correttamente piegata dalla parte codifica del DNA da qualsiasi organismo; 2) la tecnologia di visualizzazione dei fagi per selezionare i partner delle interazioni; 3) il NGS completamente Interactoma intero sotto studio di caratterizzare e identificare i cloni di interesse; e 4) uno strumento web per l'analisi dei dati per gli utenti senza competenze di programmazione o bioinformatica eseguire analisi Interactoma-Seq in modo semplice e facile da usare.
L'utilizzo di questa piattaforma offre importanti vantaggi rispetto alle strategie alternative di indagine; soprattutto il metodo è completamente imparziale, ad alta produttività e modulare per lo studio che vanno da un singolo gene fino a un intero genoma. Il primo passo della pipeline è la creazione di una libreria dal DNA frammentato in modo casuale in fase di studio, che quindi è profondamente caratterizzata da NGS. Questa libreria viene generata utilizzando un vettore di derivati dal dove vengono clonati geni/frammenti di interesse tra una sequenza di segnale per la secrezione della proteina nello spazio periplasmico (cioè, un leader di Sec) ed il gene di β-lactamase TEM1. La proteina di fusione conferisce resistenza all'ampicillina e la capacità di sopravvivere sotto pressione di ampicillina solo se frammenti clonati sono in-frame con entrambi questi elementi e la proteina di fusione risultante è correttamente piegato10,13 ,14. Tutti i cloni salvato dopo selezione antibiotica, i cosiddetti "cloni filtrata", sono ORFs e, a grande maggioranza di loro (più dell'80%), sono derivati da veri geni9. Inoltre, la potenza di questa strategia sta nei risultati che tutti i cloni di ORF filtrati sono codifica per proteine correttamente piegato/solubile/domini15. Come molti cloni, presenti nella biblioteca e mappatura nella stesso regione/dominio, hanno punti diversi iniziale e finale, in questo modo imparziale, passo singolo identificazione dei frammenti minimi che possono portare a prodotti solubili.
Un ulteriore miglioramento nella tecnologia è dato dall'utilizzo di NGS per caratterizzare la libreria. La combinazione di questa piattaforma e di uno strumento web specifico per l'analisi dei dati dà importanti informazioni imparziali sulle sequenze del nucleotide esatto e sulla posizione di ORFs selezionato sul riferimento del DNA in fase di studio senza la necessità di ulteriori analisi estese o sforzo sperimentale.
Domainome librerie possono essere trasferite in un contesto di selezione e utilizzate come uno strumento universale per eseguire studi funzionali. La proteina di alto-rendimento espressione e interazione analisi piattaforma che abbiamo integrato e che abbiamo chiamato Interactoma-Seq sfrutta la tecnologia di visualizzazione dei fagi trasferimento ORF filtrato in un vettore phagemid e creando un fago-ORF biblioteca. Una volta ri-clonato in un contesto di visualizzazione dei fagi, proteina domini vengono visualizzati sulla superficie delle particelle di M13; in questo modo le librerie domainome possono essere selezionate direttamente per frammenti del gene codifica i domini con specifiche attività enzimatiche o associazione proprietà, permettendo di reti Interactoma profilatura. Questo approccio è stato inizialmente descritto da Zacchi et al. 16 e più tardi usato in diversi altri contesto13,17,18.
Rispetto ad altre tecnologie usate per studiare l'interazione proteina-proteina (tra cui due sistema ibrido del lievito e spettrometria di massa19,20), uno dei principali vantaggi è l'amplificazione del partner associazione che si verifica durante dei fagi visualizzare più cicli di selezione. Questo aumenta la sensibilità della selezione permettendo così l'identificazione dei domini delle proteine bassa associazione abbondanti presenti nella libreria. L'efficienza della selezione eseguita con biblioteca filtrato ORF è ulteriormente incrementata grazie all'assenza di cloni non funzionali. Infine, la tecnologia permette la selezione deve essere eseguita contro proteine e non proteici esche21,22,23,24,25.
Le selezioni dei fagi utilizzando la libreria domainome-fago possono essere eseguite utilizzando anticorpi provenienti dai sieri di pazienti con diverse condizioni patologiche, ad es. malattie di13, cancro o infezione malattie autoimmuni come esca. Questo approccio viene utilizzato per ottenere la cosiddetta "firma di anticorpo" della malattia in fase di studio che permette di identificare e caratterizzare gli antigeni/epitopi specificamente riconosciuti dagli anticorpi dei pazienti allo stesso tempo massiccio. Rispetto ad altri metodi l'uso del fago display permette l'identificazione di epitopi antigenici conformazionali e lineari. L'identificazione di una firma specifica potrebbe potenzialmente avere un impatto importante per la patogenesi di comprensione, nuovo vaccino design, identificazione di nuovi bersagli terapeutici e lo sviluppo di nuovi e specifici strumenti diagnostici e prognostici. Inoltre, quando lo studio si concentra sulle malattie infettive, dei principali vantaggi è che la scoperta delle proteine immunogeniche è indipendente dalla coltivazione di agente patogeno.
Il nostro approccio conferma che i reporter pieghevoli possono essere utilizzati su scala genomica per selezionare il "domainome": un insieme di domini proteici correttamente piegato, bene espresso, solubile dalla parte codifica del DNA e/o cDNA da alcun organismo. Una volta isolato i frammenti di proteine sono utili per molti scopi, fornendo informazioni essenziali sperimentale per l'annotazione del gene anche per quanto riguarda gli studi strutturali, anticorpo epitope mapping, identificazione dell'antigene, ecc. La completezza dei dati ad alta velocità forniti da NGS permette l'analisi di campioni altamente complessi, come ad esempio librerie dei fagi della visualizzazione e possiede il potenziale per eludere la tradizionale raccolta laboriosa e test dei cloni individuali dei fagi salvato.
Allo stesso tempo grazie alle caratteristiche della biblioteca filtrata e per l'estrema sensibilità e la potenza dell'analisi NGS, è possibile identificare il dominio della proteina responsabile di ogni interazione direttamente in una schermata iniziale, senza la necessità di creare librerie aggiuntive per ogni associato della proteina. NGS permette di ottenere una definizione esaustiva dell'intero domainome di qualsiasi origine genica/genomica di partenza e lo strumento di web analisi dati consente l'ottenimento di un'altamente specifica caratterizzazione da un punto di vista qualitativo e quantitativo della domini delle proteine Interactoma.
1. costruzione della biblioteca ORF (Figura 1)
2. subcloning di ORFs filtrato in un vettore Phagemid (Figura 2)
3. dei fagi libreria preparazione e procedura di selezione
4. fago biblioteca sequenziamento profondo piattaforma (Figura 3)
5. analisi dei dati Bioinformatic utilizzando lo strumento di Web Interactoma-Seq
L'approccio di filtraggio è schematizzato nella Figura 1. Può essere utilizzato ogni tipo di DNA intronless. In Figura 1A è rappresentata la prima parte dell'approccio filtraggio: dopo il caricamento su un gel dell'agarosi o un bioanalyzer, una buona frammentazione del DNA di interesse appare come una macchia di frammenti con una distribuzione di lunghezza nella grandezza desiderata di 150-750 bp. Un'immagine rappresentante virtuale gel del DNA frammentato ottenuta è dato. Caricato su gel di agarosio di frammenti sono poi recuperati, fine-riparato e fosforilati e poi clonati in un vettore di pFILTER precedentemente smussata per creare una libreria di frammenti di DNA casuale. Esecuzione di ogni passaggio della procedura di clonazione in condizioni ottimali è necessario per ottenere la libreria di buona qualità con una copertura totale del DNA in fase di studio.
In Figura 1B è rappresentato l'approccio filtraggio: la biblioteca è cresciuta in presenza di cloramfenicolo (pFILTER resistenza) da solo o cloramfenicolo ed ampicillina per selezionare per le colonie di ORF-contenente. Colonie soli avendo un frammento di DNA corrispondente a un ORF producono un β-lactamase funzionale e sopravvivono quando selezione antibiotica è presente. Figura 1 viene illustrato come aumentare pressione selettiva consente la selezione di buona cartella ORFs contro povero cartella quelli. Il risultato atteso è una diminuzione delle dimensioni libreria di circa 20 volte. Più alto numero di cloni superstiti indica insufficiente pressione selettiva.
ORF frammenti possono essere facilmente recuperati dalla biblioteca filtrata per successiva applicazione; per studi di interazione tra la nostra strategia si avvale della tecnologia dei display dei fagi. In Figura 2, sono rappresentati i passaggi principali della costruzione della libreria dei fagi: una biblioteca adeguata è preparata da taglio frammenti filtrati dal vettore pFILTER e ri-clonazione in un plasmide phagemid in fusione con la sequenza che codifica per la Fago capside proteina g3p. Una volta infettati con fago helper, la presenza del vettore nelle cellule di batteri permette la produzione di particelle fagiche visualizzazione ORF-g3p fusione prodotti sulla loro superficie, rendendo così la biblioteca filtrata disponibile per la selezione dei fagi della visualizzazione e ulteriore analisi.
Tutte le librerie vengono analizzate da NGS, come pure le uscite delle selezioni dei fagi, come mostrato nella seconda parte della Figura 3. Frammenti di DNA vengono tratti in salvo dalla crescita di colonie dall'amplificazione di PCR con oligonucleotidi specifici ricottura della spina dorsale del plasmide e portare adattatori specifici per il sequenziamento. NGS è eseguita e letture vengono poi analizzate con lo strumento di web analisi dati Interactoma-Seq.
Nella Figura 4 abbiamo segnalato una rappresentazione schematica della procedura di selezione di una libreria di visualizzazione filtrata dei fagi ORF. La selezione in questo esempio viene eseguita utilizzando anticorpi presenti nei sieri di pazienti affetti da diverse patologie (cioè patologie infettive, patologie autoimmuni, cancro). In questo caso la libreria dei fagi interagisce direttamente con gli anticorpi presenti nei sieri dei pazienti e in questo modo putativi antigeni specifici possono essere arricchiti perché sono riconosciuti dagli anticorpi specifici di malattia. In questo tipo di esperimento, la libreria è anche selezionata solitamente usando i sieri di controllo da pazienti sani al fine di avere un segnale di fondo da utilizzare per le procedure successive di confronto e normalizzazione.
Le selezioni vengono eseguite facendo uso dei sieri provenienti dallo stesso tipo di pazienti solitamente raggruppati in diverse piscine al fine di ridurre la variabilità inter-individuale del titolo dell'anticorpo di sieri. Ogni pool viene utilizzato in modo indipendente per due o tre giri consecutivi della selezione, per arricchire la libreria per immunitario-reattiva cloni specifici per la patologia in esame. Test set anticorpi vengono incubati con fagi biblioteca, immuno-complessi vengono recuperati dalla proteina A rivestito magnetics-perline e fagi associati vengono eluite dalle procedure standard. I cicli di selezione vengono eseguiti con l'aumento di lavaggio e rigore di associazione.
Le letture generate da NGS possono essere analizzate utilizzando lo strumento di web Interactoma-Seq specificamente sviluppato per gestire questo tipo di dati. Flusso di lavoro analisi di dati Interactoma-Seq è composto da quattro fasi sequenziali che, a partire da letture di sequenziamento crudo, genera l'elenco dei domini putativi con annotazioni genomiche (Figura 5A). Nel primo passaggio INPUT (Figura 5A - scatola rossa), Interactoma-Seq controlla se i file di input (crude letture, sequenza del genoma di riferimento, elenco di annotazione) siano correttamente formattati. Nel secondo passaggio pre-elaborazione (Figura 5A - orange box), dati di sequenziamento di bassa qualità vengono prima tagliati utilizzando Cutadapt28 a seconda dei punteggi di qualità e letture con meno di 100 basi di lunghezza vengono scartate. In un passaggio successivo allineamento leggere (Figura 5A - verde casella), il restante letture sono allineate con blastn29 alla sequenza del genoma che permette fino a 5% di mancate corrispondenze. Un file SAM viene generato e legge solo con punteggio di qualità superiore a 30 (Q > 30) vengono elaborati utilizzando SAMtools30 e convertito in un file BAM. Dopo l'allineamento, Interactoma-Seq esegue il rilevamento di domini (Figura 5A - scatola blu), richiamando Bedtools31 per filtrare legge sovrapposte almeno per l'80% della loro lunghezza all'interno di trascrizioni; la copertura, profondità max e valori di messa a fuoco sono quindi calcolati per ogni porzione ORF coperto mappando letture. La copertura rappresenta il numero totale di letture assegnate ad un gene; la profondità è il numero massimo di letture che copre una porzione genica specifica; il focus è un indice ottenuto dal rapporto tra la massima profondità e copertura, e può variare tra 0 e 1. Quando lo stato attivo è superiore a 0,8 e la copertura è superiore la copertura media osservata per tutte le regioni di mapping nel file BAM, la porzione di CD è classificata come un presunto dominio/epitopo. L'ultimo passaggio della pipeline Interactoma-Seq è l'OUTPUT (Figura 5A - contenitore viola), viene generato un elenco di putativi domini in formato tabulare separata. La pipeline Interactoma-Seq è stata inclusa in uno strumento di web per consentire agli utenti senza competenze di programmazione o bioinformatica per eseguire analisi Interactoma-Seq tramite l'interfaccia grafica e di ottenere i loro risultati in un formato semplice e user-friendly. Come mostrato in figura 5B, i risultati di output di un'analisi vengono visualizzati utilizzando JBrowse32 per consentire la visualizzazione e l'esplorazione. Interactoma-Seq genera tracce nel browser del genoma corrispondente putativi domini rilevati e fornisce anche classici diagrammi di Venn per mostrare le intersezioni tra domini putativi comuni arricchite per esempio negli esperimenti di diverse selezioni.
Figura 1: Panoramica schematica dei passaggi principali per la costruzione della biblioteca ORF-filtraggio
A) il DNA da fonte diversa è sonicato e frammentato in frammenti casuali di lunghezza bp 150-750. Frammenti sono recuperati dal gel e clonati come smussato in vector pFILTER; B) filtro passaggio utilizzando β-lactamase come reporter pieghevole. Vettore che contiene frammenti di ORF non vengono selezionate negativamente su ampicillina mentre ORF frammenti clonati permettono le colonie a crescere; C) applicazione di una crescente pressione selettiva (concentrazione di ampicillina nei media di solida crescita da 0 a > 100 μg/mL) consente la selezione di meglio piegati frammenti. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 2: Panoramica schematica dei passaggi principali per la costruzione della libreria dei fagi
A) ORF-filtrata frammenti sono tagliati fuori dal vettore filtrato tramite specifici enzimi di restrizione. Dopo il recupero e purificazione, frammenti sono clonati nel vettore phagemid e trasformati; B) phagemid batterica biblioteca è infetto con fago helper e, dopo una notte crescita, fagi sono PEG-precipitata e raccolti. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 3: Librerie ORF sequenziamento
L'ordinamento viene eseguito su entrambi la libreria selezionata ORF originale, così come sulla libreria phage display; 1) su entrambi i casi vengono recuperati colonie cresciute e DNA Estratto; 2) DNA frammenti vengono recuperati dall'amplificazione utilizzando primers specifici legati agli adattatori per sequenziamento; 3-4) frammenti sono recuperati e profonda sequenziati utilizzando NGS; 5) i dati sono analizzati utilizzando la pipeline Interactoma-Seq. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 4: Schema di selezione biblioteca usando gli anticorpi dei pazienti
Libreria dei fagi è utilizzato per la selezione contro gli anticorpi da sieri dei pazienti. Gli anticorpi sono immobilizzati su biglie magnetiche, viene eseguita l'acquisizione/selezione dei fagi della biblioteca, tre cicli di lavaggi sono effettuati e in seguito fagi selezionati sono recuperati e utilizzati per re-infettare Escherichia coli. Re-infettati Escherichia coli cellule sono placcate in pressione selettiva (ampicillina 100 μg/mL). Frammenti ORF vengono recuperati dall'amplificazione e amplicon piscine sono quindi sequenziate da NGS. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 5: Schema di analisi della libreria
A) rappresentazione del flusso di lavoro di analisi di dati, a partire da file FASTQ raw per le liste di domini con annotazioni finali; B) schematica rappresentazione degli ingressi e delle uscite dello strumento web Interactoma-Seq. Clicca qui per visualizzare una versione più grande di questa figura.
La creazione di una libreria alta qualità altamente diversificata ORFs filtrata è il primo passaggio fondamentale in tutta la procedura poiché interesserà tutti i passaggi successivi della pipeline.
Un'importante caratteristica vantaggiosa del nostro metodo è che qualsiasi fonte di (intronless) del DNA (cDNA, DNA genomic, PCR derivato o DNA sintetico) è adatto per la costruzione della libreria. Il primo parametro che deve essere preso in considerazione è che la lunghezza dei frammenti di DNA clonato nel vettore pFILTER dovrebbe fornire una rappresentazione dell'intera collezione dei domini di un genoma o un transcriptome, il cosiddetto "domainome". Abbiamo dimostrato che domini proteici possono essere clonati con successo, selezionata e infine identificata a partire da frammenti di DNA con una distribuzione lunghezza che va da 150 a 750 bp33,34, e questo è in linea con ciò che è riportato in la letteratura mostrando che la maggior parte dei domini proteici sono di lunghezza aa 100 (con un range da 50 a 200 aa)15.
DNA, il materiale di partenza deve essere frammentato nell'intervallo di dimensioni di scelta e più tardi clonato nel vettore di12 di filtraggio (pFILTER). Durante questi passaggi, potrebbe essere evitato potenziali bias massimizzazione dell'efficienza di tutte la clonazione fasi di reazioni incluse nel protocollo, in particolare frammento fine-riparazione e fosforilazione. La preparazione di vettore è impegnativa e occorre anche, a condizioni ottimali per evitare la degradazione del plasmide e/o contaminazione dal vettore non digerito.
Una volta che la libreria è stata creata, esso dovrebbe essere "filtrata" al fine di mantenere solo ORFs piegati frammenti. Un parametro fondamentale per modulare questo passaggio è la selettiva pressione applicata che possa essere modificata secondo il rigore del filtraggio desiderato. Selezione viene effettuata tramite ampicillina: maggiore è la concentrazione utilizzata, minore è il numero di colonie di batteri trasformati in grado di sopravvivere. Questo riflette la capacità del metodo di filtraggio per selezionare per buono-versus poveri-cartella ORFs34. Questa riduzione del numero di cloni è bilanciata dall'aumento pieghevole proprietà di frammenti selezionati. Di solito, la concentrazione di ampicillina dovrebbe essere sufficiente per ridurre a circa 1/20 il numero di colonie batteriche rispetto a quelli che potrebbero essere ottenuti la libreria il cloramfenicolo solo in crescita.
Convalida di biblioteca è fatto solitamente dall'amplificazione di PCR delle colonie casualmente scelto e loro sequenziamento. L'amplificazione di PCR di alcune colonie è suggerito per avere una rapida stima della qualità della biblioteca: la lunghezza degli inserti dovrebbe essere nell'intervallo previsto di 150-750 bp e diverse colonie dovrebbero presenti inserti con differenti dimensioni buono che indica preparazione di biblioteca in termini di variabilità. Questa strategia convenzionale di screening, quando applicato come unico metodo per la convalida di libreria, non è completa e richiede tempo, che consente l'analisi di un numero limitato di colonie e avendo un'alta probabilità di perdere la maggior parte dei cloni importante. Il nostro approccio si basa sul sequenziamento profondo della libreria, questo fornisce informazioni complete sulla biblioteca diversità e abbondanza e precisa mappatura di ciascuno dei frammenti selezionati.
L'implementazione della tecnologia NGS con l'approccio filtro aumenta la profondità dell'analisi di diversi ordini di grandezza. Recentemente, abbiamo ottimizzato il protocollo per la sequenziazione delle librerie ORF utilizzando la piattaforma Illumina e sviluppato uno strumento web specifico per l'analisi dei dati che rende l'analisi di questi tipi di dati per ogni utente senza qualsiasi bioinformatica competenze di programmazione.
La libreria "per sé" è uno strumento"universale" e può essere sfruttata in diversi contesti di espressione della proteina e/o selezione. Il nostro approccio metodologico si basa sul trasferimento della ORFeome prodotta in un contesto di visualizzazione dei fagi. Frammenti della proteina sono espressi sulla superficie dei fagi e divennero adatti per successiva selezione.
Questo è fatto da salvataggio ORFs filtrata dalla libreria pFILTER di digestione con enzimi di restrizione specifici e ri-duplicarle in un vettore compatibile phagemid permettendo loro fusione con il fago proteina g3p.
Dopo aver creata la libreria phagemid-ORF, può essere utilizzato per la selezione contro obiettivi diversi, come una presunta associazione proteina10 o anticorpi purificati35,36 come descritto qui. Poiché le particelle dei fagi visualizzerà sulla loro superficie filtrata ORFs, ciò si traduce in una procedura di selezione molto più efficace a causa dell'assenza di non visualizzazione cloni che di solito superare esso.
Dopo la selezione della libreria phage display ORF, i cloni di uscita possono essere sequenziati e analizzati con la stessa pipeline. NGS può fornire un completo e statisticamente significativa classifica dei più frequentemente selezionati ORFs e ciò permette l'identificazione delle proteine per lo più interagendo con l'esca utilizzata. Data la presenza di molte versioni diverse di ogni dominio differisce per alcuni aminoacidi, la sovrapposizione tra diversi cloni sequenziati identifica anche il minimo frammento/dominio mostrando proprietà di associazione. Infine, grazie all'abbinamento di genotipo e fenotipo informazioni nella libreria dei fagi, una volta identificati i domini di scelta, la sequenza del DNA può essere facilmente salvata dalla libreria per ulteriori studi, in vitro e in vivo convalida e caratterizzazione.
Gli autori non hanno nulla a rivelare.
Questo lavoro è stato supportato da una sovvenzione dal Ministero della pubblica istruzione e Università (2010P3S8BR_002 CP).
Name | Company | Catalog Number | Comments |
Sonopuls ultrasonic homogenizer | Bandelin | HD2070 | or equivalent |
GeneRuler 100 bp Plus DNA Ladder | Thermo Scientific | SM0321 | or equivalent |
GeneRuler 1 kb DNA Ladder | Thermo Fisher Scientific | SM0311 | or equivalent |
Molecular Biology Agarose | BioRad | 161-3102 | or equivalent |
Green Gel Plus | Fisher Molecular Biology | FS-GEL01 | or equivalent |
6x DNA Loading Dye | Thermo Fisher Scientific | R0611 | or equivalent |
QIAquick Gel Extraction Kit | Qiagen | 28704 | or equivalent |
Quick Blunting Kit | New England Biolabs | E1201S | |
NanoDrop 2000 UV-Vis Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
High-Capacity cDNA Reverse Transcription Kit | Thermo Fisher Scientific | 4368813 | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | or equivalent |
QIAquick PCR purification Kit | Qiagen | 28104 | or equivalent |
EcoRV | New England Biolabs | R0195L | |
Antarctic Phosphatase | New England Biolabs | M0289S | |
T4 DNA Ligase | New England Biolabs | M0202T | |
Sodium Acetate 3M pH5.2 | general lab supplier | ||
Ethanol for molecular biology | Sigma-Aldrich | E7023 | or equivalent |
DH5aF' bacteria cells | Thermo Fisher Scientific | ||
0,2 ml tubes | general lab supplier | ||
1,5 ml tubes | general lab supplier | ||
0,1 cm electroporation cuvettes | Biosigma | 4905020 | |
Electroporator 2510 | Eppendorf | ||
2x YT medium | Sigma-Aldrich | Y1003 | |
Ampicillin sodium salt | Sigma-Aldrich | A9518 | |
Chloramphenicol | Sigma-Aldrich | C0378 | |
DreamTaq DNA Polymerase | Thermo Fisher Scientific | EP0702 | |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447S | |
96-well thermal cycler (with heated lid) | general lab supplier | ||
150 mm plates | general lab supplier | ||
100 mm plates | general lab supplier | ||
Glycerol | Sigma-Aldrich | G5516 | |
BssHII | New England Biolabs | R0199L | |
NheI | New England Biolabs | R0131L | |
QIAprep Spin Miniprep Kit | Qiagen | 27104 | or equivalent |
M13KO7 Helper Phage | GE Healthcare Life Sciences | 27-1524-01 | |
Kanamycin sulfate from Streptomyces kanamyceticus | Sigma-Aldrich | K1377 | |
Polyethylene glycol (PEG) | Sigma-Aldrich | P5413 | |
Sodium Cloride (NaCl) | Sigma-Aldrich | S3014 | |
PBS | general lab supplier | ||
Dynabeads Protein G for Immunoprecipitation | Thermo Fisher Scientific | 10003D | or equivalent |
MagnaRack Magnetic Separation Rack | Thermo Fisher Scientific | CS15000 | or equivalent |
Tween 20 | Sigma-Aldrich | P1379 | |
Nonfat dried milk powder | EuroClone | EMR180500 | |
KAPA HiFi HotStart ReadyMix | Kapa Biosystems, Fisher Scientific | 7958935001 | |
AMPure XP beads | Agencourt, Beckman Coulter | A63881 | |
Nextera XT dual Index Primers | Illumina | FC-131-2001 or FC-131-2002 or FC-131-2003 or FC-131-2004 | |
MiSeq or Hiseq2500 | Illumina | ||
Spectrophotomer | Nanodrop | ||
Agilent Bioanalyzer or TapeStation | Agilent | ||
Forward PCR primer | general lab supplier | 5’ TACCTATTGCCTACGGCA GCCGCTGGATTGTTATTACTC 3’ | |
Reverse PCR primer | general lab supplier | 5’ TGGTGATGGTGAGTACTA TCCAGGCCCAGCAGTGGGTTTG 3’ | |
Forward primer for NGS | general lab supplier | 5’ TCGTCGGCAGCGTCAGA TGTGTATAAGAGACAGGCA GCAAGCGGCGCGCATGC 3’; | |
Reverse primer for NGS | general lab supplier | 5’ GTCTCGTGGGCTCGGAGA TGTGTATAAGAGACAGGGG ATTGGTTTGCCGCTAGC 3’; |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon