Method Article
Vi presentiamo un protocollo per quantificare con precisione le proteine con etichettatura isobarico, vasto frazionamento, strumenti di bioinformatica e procedura di controllo di qualità in combinazione con cromatografia liquida interfacciato ad uno spettrometro di massa ad alta risoluzione.
Sono stati compiuti molti progressi eccezionali in spettrometria di massa (MS)-base di proteomica, con il progresso tecnico particolare in cromatografia liquida (LC) accoppiata alla spettrometria di massa tandem (LC-MS/MS) e capacità di multiplexing etichettatura isobarica. Qui, presentiamo un protocollo di analisi profonda-proteomica che combina i tag massa tandem 10-plex (TMT) etichettatura con un'ampia piattaforma di LC/LC-MS/MS e correzione post-MS computazionale interferenze per quantificare con precisione i proteomi tutto. Questo protocollo comprende le seguenti fasi: estrazione di proteine e digestione, TMT etichettatura, 2-dimensionale (2D) LC, spettrometria di massa ad alta risoluzione e computazionale di elaborazione dei dati. Procedura di controllo qualità è inclusa per la risoluzione dei problemi e valutare la variazione sperimentale. Più di 10.000 proteine in campioni di mammiferi possono essere quantificati con fiducia con questo protocollo. Questo protocollo può essere applicato anche per la quantificazione delle modifiche post traduzionale con modifiche minori. Questo metodo multiplex, robusto fornisce un potente strumento per analisi di proteomica in una varietà di campioni complessi, tra cui la coltura delle cellule, tessuti animali e umani campioni clinici.
Gli avanzamenti nella tecnologia di sequenziamento di nuova generazione hanno portato ad un nuovo paesaggio per lo studio di sistemi biologici e malattia umana. Questo ha permesso un gran numero di misurazioni del genoma, trascrittoma, proteoma, metaboloma e altri sistemi molecolari a diventare tangibili. Spettrometria di massa (MS) è uno dei metodi più sensibili in chimica analitica, e la sua applicazione in proteomica ha rapidamente ampliato dopo il sequenziamento del genoma umano. Nel campo della proteomica, da alcuni anni hanno prodotto importanti progressi tecnici nella basata su MS-analisi quantitative, tra cui isobarica etichettatura e multiplexing capacità combinata con cromatografia liquida estesa, oltre alla strumentazione avanza, consentendo più veloce, più accurate misurazioni con meno materiale di campione richiesto. Proteomica quantitativa è diventati un approccio tradizionale per la profilatura di decine di migliaia di proteine e modifiche di posttranslational in campioni biologici altamente complessi1,2,3,4 , 5 , 6.
Metodi d'etichettatura isobariche multiplex ad esempio tag Isobarico per quantificazione relativa e assoluta (cioè, iTRAQ) e tag di massa tandem (TMT) MS hanno notevolmente migliorato la produttività del campione e aumentato il numero di campioni che possono essere analizzati in un unico esperimento1,6,7,8. Insieme con altri metodi di quantificazione basati su MS, come quantificazione privo di etichetta ed etichettatura con gli amminoacidi nella coltura delle cellule (cioè, SILAC), il potenziale di queste tecniche nella proteomica dell'isotopo stabile campo è notevole9 ,10,11. Ad esempio, il metodo TMT permette 10 campioni di proteine da analizzare insieme in 1 esperimento utilizzando reagenti 10-plex. Questi tag TMT strutturalmente identici hanno la stessa massa complessiva, ma isotopi pesanti differenzialmente sono distribuiti su atomi di carbonio o azoto, risultante in un ione unico reporter durante frammentazione MS/MS di ogni tag, consentendo pertanto una quantificazione relativa tra i 10 campioni. La strategia TMT è ordinariamente applicata per studiare vie biologiche, progressione di malattia e di processi cellulari12,13,14.
Notevoli miglioramenti tecnici sono migliorati sistemi di cromatografia liquida (LC)-MS/MS, sia in termini di LC separazioni e parametri di MS, per massimizzare l'identificazione della proteina senza sacrificare la precisione di quantificazione. Prima dimensione separazione dei peptidi mediante una tecnica di separazione con alta ortogonalità per la seconda dimensione è fondamentale in questo tipo di metodo di proteomica di fucile da caccia per ottenere i massimi risultati20. Cromatografia liquida a fase inversa ad alta pH (RPLC) offre prestazioni migliori rispetto a convenzionali scambio cationico forte cromatografia20. Quando alto pH RPLC è combinata con una seconda dimensione di basso pH RPLC, sia analitico gamma dinamica e la copertura della proteina sono migliorate, conseguente la capacità di identificare la maggior parte delle proteine espresse durante l'esecuzione di analisi intero proteoma15 ,16,17,18. Altri progressi tecnici includono piccole particelle C18 (1,9 µm) ed esteso lungo colonna (~ 1 m)19. Inoltre, altri miglioramenti importanti sono nuove versioni di spettrometri di massa con velocità di scansione rapida, una migliore sensibilità e risoluzione20e bioinformatica sofisticata pipeline per MS dati mining21.
Qui, descriviamo un protocollo dettagliato che incorpora le più recenti metodologie con modifiche per migliorare la sensibilità e la velocità effettiva, mentre ci si concentra sui meccanismi di controllo di qualità in tutto l'esperimento. Il protocollo comprende estrazione di proteine e digestione, TMT 10-plex etichettatura, pH di base e frazionamento RPLC pH acido, ad alta risoluzione MS rilevamento ed elaborazione di dati di MS (Figura 1). Inoltre, realizziamo diversi passaggi di controllo di qualità per la risoluzione dei problemi e valutare la variazione sperimentale. Questo protocollo dettagliato è destinato ad aiutare i ricercatori nuovi al campo ordinariamente identificare e quantificare con precisione migliaia di proteine da un lisato o tessuto.
Attenzione: si prega di consultare tutte le schede di dati di sicurezza pertinenti (cioè, MSDS) prima dell'uso. Si prega di utilizzare tutte le pratiche di sicurezza appropriato durante l'esecuzione di questo protocollo.
Nota: viene utilizzato un set di reagente TMT 10-plex isobarica etichetta in questo protocollo per la quantificazione del proteoma di 10 campioni.
1. preparazione di tessuti o cellule
Nota: è fondamentale per raccogliere campioni in tempi brevi a bassa temperatura per mantenere le proteine nel loro stato originale biologica.
2. Estrazione della proteina, controllo di qualità Western Blotting, digestione In soluzione e Peptide desalificazione
Nota: utilizzo ciascuno dei 10 campioni allo stesso modo durante qualsiasi passaggio prima che il pool di campioni con etichetta TMT è essenziale per ridurre variazione.
Buffer di lisi3. Etichettatura di peptidi TMT
Nota: è fondamentale per garantire che tutti i campioni sono completamente etichettati dai reagenti TMT. Diversi fattori (ad es., quantità di reagenti TMT, valore pH e precisione di quantificazione della proteina) possono influenzare TMT etichettatura di efficienza, che modificherà negativamente tutti i risultati a valle.
4. Estesa ad alta risoluzione, base pH LC Prefractionation
5. Preparazione di LC-MS/MS e parametri
Nota: quantificazione In TMT-base, ioni del peptide sono isobarico e appaiono come 1 massa in un'esplorazione MS1. Tuttavia, essi sono quantificati secondo l'intensità di ioni reporter (10 unico reporter ioni) durante la scansione di MS/MS dopo lo ione del peptide è stato frammentato con dissociazione di più alta energia collisione (HCD). I rapporti di TMT reporter dello ione possono essere soppressa da co-eluizione di ioni con etichetta TMT 24. Restringimento dello ione isolamento finestra 25, fase gassosa purificazione 26, il MultiNotch MS3 metodo 27 o vasto frazionamento con LC multidimensionali e lunghi gradienti (4-8 h) 28 sono approcci alternativi.
6. Analisi di dati di MS
Nota: Descriviamo l'analisi dei dati con il programma di software di salto. Tuttavia, l'analisi dei dati può essere eseguita con altri programmi commercialmente disponibili o free.
7. Convalida dei dati MS
Nota: per valutare la qualità dei dati di MS, almeno 1 metodo di convalida deve essere eseguita prima di procedere con gli esperimenti biologici che richiede tempo.
Abbiamo usato un mix di peptide cross-specie precedentemente descritte per analizzare sistematicamente l'effetto di compressione rapporto in 3 passi principali del protocollo, tra cui frazionamento pre-MS, MS impostazioni e correzione post-MS23. Il frazionamento di pre-MS è stato valutato e ottimizzato utilizzando una combinazione di pH di base RPLC e pH acido RPLC. Per l'analisi di post-MS, sono stati considerati solo specie-peptidi. Abbiamo usato questo modello di interferenza per esaminare una serie di parametri in LC/LC-MS/MS, inclusi finestra isolamento MS2, risoluzione online di LC, quantità di caricamento del pH siliceo online RPLC e risoluzione del RPLC alto pH non in linea (vedere la Figura 3 in riferimento 29).
Per modificare la risoluzione durante la LC non in linea, abbiamo separato i peptidi con etichettati isobarico in 320 frazioni e quindi combinati selezionate frazioni insieme per regolare la potenza di separazione. Risoluzione di LC non in linea è stato testato utilizzando un numero di sottoinsiemi di frazione raccolti (1, 5, 10, 20, 40, 80 e 320), mentre il monitoraggio dei livelli di interferenza. Abbiamo trovato che i livelli di interferenza è diminuito gradualmente da 16,4% al 2,8%, indicando tale frazionamento estesa durante la separazione LC non in linea un po' alleviato il problema della co-eluizione peptidi ma non era in grado di rimuovere completamente il interferenze.
Successivamente, abbiamo valutato l'effetto della finestra isolamento MS2 sull'interferenza. Abbiamo determinato sperimentalmente che l'interferenza è approssimativamente proporzionale alla dimensione della finestra di isolamento, in accordo con precedenti studi29,30. Ad esempio, una differenza di 4 volte della dimensione della finestra (Da 1.6-0,4) ha provocato un ~ 4 volte differenza di livello di inferenza (14,4% al 3,7%). Abbiamo anche determinato la quantità di carico ottimale sulla colonna per analisi MS e utilizzato queste informazioni per negare ulteriori interferenze. Abbiamo ridotto l'interferenza dal 9,4% al 3,3% del caricamento la giusta quantità di campione. Carico troppo campione può portare a picco ampliamento31 e quindi aumentare il livello di interferenza, con conseguente precisione di quantificazione della proteina ridotta. Infine, abbiamo ottimizzato la risoluzione RPLC online modificando le lunghezze gradiente (1, 2 e 4 h) e utilizzando una colonna lunga (~ 45 cm). Abbiamo trovato che una sfumatura di 4-h quasi eliminato l'interferenza (fino a 0,4%) ma anche aggiunto tempo di strumento. I parametri ottimizzati ha rivelato una finestra stretta isolamento (Da 0,4), ~ 100 ng di campione caricato sulla colonna e frazionamento midlevel (~ 40 x 2 h, 3,3 giorni). Abbiamo anche dimostrato che utilizzando una strategia basata su computer post-MS correzione migliorato precisione quantitativa quando determinazione rapporti di proteina (Figura 3B).
I nostri risultati indicano che l'uso di LC-MS parametri ottimizzati e correzione di post-MS in grado di fornire un profilo proteomico approfondita e virtualmente eliminano i disturbi che spesso viene prodotto mediante tecniche di etichettatura isobariche per quantificazione della proteina.
Figura 1: schema di analisi del profilo intero proteoma di TMT-LC/LC-MS/MS. Dieci campioni biologici sono stati lisati, digeriti ed etichettati con 10 diversi tag TMT, ugualmente riunite e frazionate in 80 frazioni mediante cromatografia liquida (LC) a fase inversa pH di base non in linea. Ogni altra frazione è stata ulteriormente separata da RPLC acide e analizzata online con uno spettrometro di massa ad alta risoluzione. I file raw di MS/MS sono stati elaborati e consultati in un database Uniprot per identificazione di peptidi e proteine. Proteine sono state quantificate secondo le intensità relative dei tag TMT. Infine, le proteine identificate e quantificate sono stati sottoposti ad analisi di dati integrativi. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 2: TMT etichettatura esame efficienza. Entrambi con etichetta TMT e loro corrispondenti senza etichetta di campioni sono stati analizzati mediante LC-MS/MS separatamente per esaminare TMT etichettatura di efficienza. Per l'etichettatura completa di TMT, (A), il peptide senza etichetta di picco era completamente assente nel campione con etichettato, (B), mentre il peptide TMT-etichetta era presente solo nel campione con etichettato. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 3: approccio computazionale per la rimozione di interferenza dopo la raccolta di dati di MS. (A) MS2 tutte le scansioni sono state divise in pulito (pannello di sinistra) e scansioni rumorosi (pannello di destra). Scansioni rumorosi esibiscono entrambi y1 ioni di K e R (1 da un peptide di destinazione e gli altri da contaminanti peptidi). (B) Peptidi di Escherichia coli sono stati individualmente etichettati con 3 diversi reagenti TMT e riuniti a 1:3:10 rapporti. Circa 20 volte più peptidi di ratto sono stati aggiunti come sfondo. Le intensità relative sommate dei peptidi Escherichia coli nei 3 gruppi ha rivelato che y1 basati su ion correzione è più accurato per la quantificazione di TMT-basato. Clicca qui per visualizzare una versione più grande di questa figura.
Descriviamo un protocollo ad alta velocità per la quantificazione delle proteine con una strategia di etichettatura isobarica 10-plex, che è stata implementata con successo in diverse pubblicazioni12,13,14,32 . In questo protocollo, possiamo analizzare fino a 10 campioni biologici differenti della proteina nell'1 esperimento. Ordinariamente possiamo identificare e quantificare ben oltre 10.000 proteine con elevata fiducia. Anche se etichettatura isobarica è un'efficace tecnologia per quantificare le proteine, è limitato dalla compressione di rapporto che può condurre ad inesattezza quantitativa. Nostro protocollo usando varie strategie, come l'ottimizzazione di LC/LC e le impostazioni di MS/MS in combinazione con y1 basati su ion post-MS correzione, rimuove efficacemente la maggior parte degli effetti di interferenza e di conseguenza migliora notevolmente la precisione di quantificazione della proteina.
Per la quantificazione della proteina, la suite di salto delle funzioni di programmi in un certo numero di modi. Abbiamo misurato l'impurità isotopico per ogni lotto di reagenti acquistati, che differisce leggermente dai valori riportati nei certificati fornito dal fornitore. L'impurità isotopica misurata è utilizzato per correggere le intensità degli ioni di reporter del software di salto. Una proteina è quantificata in genere da molti PSMs con varie intensità assoluta che sono influenzati da molteplici fattori, quali l'efficienza di ionizzazione. Poiché l'influenza dei fattori è sconosciuto, spettri di massa rivelano solo le abbondanze relative di ioni di reporter in un'analisi TMT. Le abbondanze relative di ioni di reporter sono calcolate dividendo l'intensità di ogni ione reporter dall'intensità media di 10 tutti i reporter. Per fornire il miglior rappresentante "segnale assoluto" della proteina, abbiamo calcolato una media delle intensità relative di 3 PSMs con la più alta intensità assoluta dalla proteina e la media di più forte intensità assoluta per stimare l'assoluto segnale della proteina. Abbiamo definito questi passaggi come ridimensionamento. La correzione di1 y è universalmente applicabile a qualsiasi analisi TMT; Tuttavia, in alcuni casi potremmo non correggiamo per peptidi con spettri MS/MS che contiene lo ione1 y. Tuttavia, abbiamo trovato che ~ 90% degli spettri hanno gli ioni y1 dalla lisina e arginina. Per compensare le interferenze causate dai co-eluizione peptidi che hanno gli stessi residui C-terminale come il peptide identificato, il livello di interferenza stimato era essenzialmente raddoppiato e utilizzato per la correzione. Questa ipotesi si basava sull'evidenza empirica che abbiamo raccolto nel corso di numerosi esperimenti TMT, in cui abbiamo osservato lo stesso livello di intensità per y1 a K - e R-contenenti peptidi.
Possono ridurre le interferenze con molti metodi diversi da quello che abbiamo descritto in questo protocollo, ad esempio l'approccio multinotch MS3. Tutti questi metodi sono validi e hanno i loro meriti individuali. In definitiva, la metodologia utilizzata dipende da vari fattori, compreso ma non limitato a quantità di campione, disponibilità dello strumento (cioè, tipo di strumento e tempo necessario per l'analisi dei campioni), risultati desiderati (ad esempio, numero di proteine identificate) e la quantificazione precisione necessarie.
Per garantire i risultati più accurati, è importante ascoltare i passaggi di controllo di qualità in tutto il protocollo. Questi includono l'utilizzo di precise norme per la quantificazione del campione (ad es., BSA che ha subito l'analisi dell'amminoacido), verificare l'efficienza di etichettatura del reagente TMT, determinare l'efficienza della digestione della tripsina, esecuzione di un test di rapporto premix per assicurare una miscelazione uguale di tutti i 10 campioni e utilizzando un software per correggere eventuali pregiudizi di caricamento. Nei casi in cui una proteina nota o più proteine sono tenuti ad esporre i cambiamenti di espressione tra singoli campioni, è importante eseguire l'analisi western blot dopo la lisi della cellula iniziale per confermare che questi cambiamenti sono presenti e possono essere rilevati. Questo assicura che i campioni rappresentano la biologia per essere testato e consente di risparmiare tempo, denaro e sforzo prima di effettuare l'intero protocollo TMT. Se un campione particolare è previsto per non esprimere determinate proteine, è anche importante utilizzare l'analisi western blot per confermare la loro assenza dopo lisi prima di continuare con il protocollo. Il test del rapporto di premiscela viene utilizzato quando la maggior parte delle proteine sono tenute a non cambiare attraverso i 10 campioni biologici. Abbiamo anche rimosso proteine contaminanti note, come le cheratine, così essi non inciderebbe negativamente la nostra correzione. Il nostro metodo di quantificazione rettificato per eventuali errori che possono essersi verificati da errori di pipettaggio, ecc. Quando possibile, abbiamo usato specificamente pipetta volumi superiori a 5 µ l per ridurre gli errori. Abbiamo eseguito vari cicli di questa prova di premiscela per garantire che abbiamo ottenuto un accurato mix di 1:1. È importante notare che abbiamo non ha eseguito questo tipo di test del rapporto di premiscela quando utilizzando campioni di immunoprecipitazione per il protocollo, come ci aspettavamo una grande percentuale delle proteine per cambiare. In tali casi, il test di premiscela sarebbe falsare i risultati. Questo vale anche per qualsiasi esperimento in cui almeno 1 dei 10 campioni dovrebbe variare notevolmente nell'espressione della proteina (vettore vuoto, inibizione del proteosoma, ecc.) In questi casi, si consiglia vivamente di utilizzare la replica per facilitare la quantificazione statistiche. Si consiglia in genere eseguendo 3 replica per questi tipi di campioni. In definitiva, il numero delle ripetizioni è basato sulla variabilità prevista di ciascun campione.
Con qualche limatura, questo robusto protocollo utilizzabile come una pipeline di proteomica generale per studiare le proteine, vie della proteina, la progressione della malattia e altre funzioni biologiche. Il protocollo qui presentato fornisce una potente tecnica per ottenere il riempimento della proteina profonda ed alleviare la soppressione del rapporto durante la quantificazione. Con modifiche minori, il presente protocollo può essere facilmente adattato per quantificare le modifiche post-traduzionali della proteina, quali fosforilazione, ubiquitinazione e acetilazione33,34. Questi tipi di progetti di proteomica globale possono essere integrati con la genomica, trascrittomica e possibilmente metabolomica per un approccio di biologia di sistemi comprendere i sistemi biologici e facilitare nuove scoperte dei meccanismi molecolari, biomarcatori e target terapeutico nella malattia13,28,35,36,37,38.
Abbiamo dimostrato un metodo per la quantificazione accurata oltre 10.000 proteine da lisati di cellule intere o tessuto. Ci aspettiamo che questo metodo sia ampiamente applicabile a molti sistemi biologici.
Gli autori non hanno nulla a rivelare.
Gli autori ringraziano tutti gli altri membri lab e impianto per utile discussione. Questo lavoro è stato parzialmente sostenuto da NI H concede ALSAC, R01AG047928, R01AG053987 e R01GM114260. L'analisi di MS è stata eseguita in Research Hospital proteomica Facility di St. Jude Children, parzialmente sostenuto da NIH Cancer Center Support grant P30CA021765. Gli autori ringraziano Nisha Badders per aiuto con il manoscritto di editing.
Name | Company | Catalog Number | Comments |
1220 LC system | Agilent | G4288B | |
50% Hydroxylamine | Thermo Scientific | 90115 | |
Acetonitrile | Burdick & Jackson | AH015-4 | |
Bullet Blender | Next Advance | BB24-AU | |
Butterfly Portfolio Heater | Phoenix S&T | PST-BPH-20 | |
C18 tips | Harvard Apparatus | 74-4607 | |
Dithiothreitol (DTT) | Sigma | D5545 | |
DMSO | Sigma | 41648 | |
Formic acid | Sigma | 94318 | |
Fraction Collector | Gilson | FC203B | |
Glass Beads | Next Advance | GB05 | |
HEPES | Sigma | H3375 | |
Iodoacetamide (IAA) | Sigma | I6125 | |
Lys-C | Wako | 125-05061 | |
Methanol | Burdick & Jackson | AH230-4 | |
Pierce BCA Protein Assay kit | Thermo Scientific | 23225 | |
Mass Spectrometer | Thermo Scientific | Q Exactive HF | |
nanoflow UPLC | Thermo Scientific | Ultimate 3000 | |
ReproSil-Pur C18 resin, 1.9um | Dr. Maisch GmbH | r119.aq.0003 | |
Self Pck Columns | New Objective | PF360-75-15-N-5 | |
Sodium deoxycholate | Sigma | 30970 | |
Speedva | Thermo Scientific | SPD11V | |
TMT 10plex Isobaric label reagent | Thermo Scientific | 90110 | |
Trifluoroacetic acid (TFA) | Applied Biosystems | 400003 | |
Trypsin | Promega | V511C | |
Urea | Sigma | U5378 | |
Xbridge Column C18 column | Waters | 186003943 | |
Ziptips C18 | Millipore | ZTC18S096 | |
SepPak 1cc 50mg | Waters | WAT054960 |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon