Method Article
Combinazione di co-genomica, analisi di espressione genica e l'identificazione di composti bersaglio per via metabolica dare annotazione funzionale del gene.
Dato il numero sempre crescente di specie vegetali modello per il quale sequenze genomiche complete sono disponibili e l'abbondanza delle risorse biologiche quali mutanti knockout, le adesioni e le popolazioni selvatiche di riproduzione avanzate, vi è un peso crescente per l'annotazione gene funzionale. In questo protocollo, l'annotazione della funzione dell'impianto gene usando combinato co-analisi di espressione genica, metabolomica e informatica è fornito (Figura 1). Questo approccio si basa sulla teoria di usando geni bersaglio di funzione nota per consentire l'identificazione di geni non annotate probabilità di essere coinvolti in un processo metabolico certa, con l'identificazione di composti bersaglio tramite metabolomica. Le strategie vengono proposti per l'applicazione di queste informazioni sulle popolazioni generati da entrambi gli approcci in avanti e genetica inversa, nonostante nessuno di questi sono senza sforzo. Con corollario questo approccio può anche essere utilizzato come un approccio per caratterizzare picchi sconosciuti rappresentano nuova o specifica sedario metaboliti nei tessuti limitate, specie vegetali o di trattamento dello stress, che è attualmente il processo importante per capire il metabolismo delle piante.
1. Preparazione del campione
2. Estrazione per Profiling Metabolite
3. Profiling metabolita della LC-MS
4. Analisi dei dati
5. Previsione della via metabolica
6. Preparazione della lista con Gene ID Gene Arabidopsis ortologhe
7. Co-ha espresso l'analisi del gene
8. L'integrazione di tutte le informazioni per predire Nuovi percorsi
9. Esperimenti per l'identificazione del gene mediante Bio-risorse
10. Risultati rappresentativi
La procedura di analisi integrato descritto in questo protocollo ha molte possibilità a seconda della specifica finalità sperimentali e la scelta di combinazioni biologiche ed analitiche. Scelta delle procedure e il disegno sperimentale deve essere effettuata correttamente, sulla base del percorso di destinazione, i composti e specie vegetali. La strategia di integrazione descritto in questo protocollo è foc utilizzato su annotazione della funzione dell'impianto gene e la scoperta di nuove funzioni dei geni, con un uso efficiente di diversi bio-dati e delle risorse. Risultato atteso è promesso di fornire l'unico caso della previsione definitiva. Questo fatto indica che, se prove sufficienti non può essere dato da profili di combinazione, l'esperimento non deve essere iniziato. Per questo motivo, in ogni caso, ulteriori esperimenti preliminari quali profili di espressione genica mirata di RT-PCR, possono supportare la previsione della funzione del gene. La precisione e la correttezza della predizione correla superiore in funzione della differenza qualitativa e il numero di variazione della combinazione. Inoltre, i candidati risultati buoni e validi può venire solo dalla previsione accurata dei percorsi. Annotazione di picco dovrebbe essere condotta con la combinazione di diversi approcci, per il rilevamento ad esempio la letteratura, estratto della pianta di riferimento, MS n, la specificità d'organo e l'analisi mutante 13.
1 "src =" / files/ftp_upload/3487/3487fig1.jpg "/>
Figura 1. Panoramica del flusso sperimentale di annotazione genica tramite approccio combinato. In alcuni casi, i progetti iniziano con la scoperta di un picco romanzo che viene rilevato in condizioni particolari o tessuti, e il desiderio di capire il suo ruolo all'interno del suo metabolismo. In altri casi lo scopo del progetto è l'identificazione del gene o la scoperta dei principali fattori di regolazione, quali fattori di trascrizione. Progettazione di esperimento dovrebbe essere piallato con una serie di dati che mostra chiare differenze dei livelli di metabolita nel vostro percorso di destinazione, utilizzando una vasta gamma di campioni di tessuto da organi diversi, e per le piante coltivate in modo differenziale o piante esposte a condizioni di stress, e sottoponendo il materiale a profiling metabolita. Le piante mutanti e transgeniche, nonché QTL materiale di riproduzione ospitare anche rappresentare adatto materiale genetico per questi studi. Previsione del percorso romanzo deve essere effettuata accuratamente con accurateannotazione di picco e l'approccio combinazione con diversi tipi di metabolotype come i titoli di organi e risposte allo stress secondo i dati di espressione genica del vostro percorso d'interesse. Nell'ultimo passaggio, profiling metabolita e trascrizione deve essere effettuata che alla fine, quando combinato con analisi in silico di web-risorse e caratterizzazione in vitro di espressione genica mediante espressione eterologa, portano alla conferma del gene candidato e la spiegazione della sua funzione e posizione all'interno di una via metabolica. Abbreviazioni: QTL, i loci di caratteri quantitativi.
Figura 2. Il flusso di lavoro di approccio combinatorio per l'annotazione di picco. Una procedura per l'identificazione di picco e annotazione dal composto standard, confronto tra wild type e mutanti knock out, multi-dimensionale spettrometria di massa del picco target di riferimento agli spettri di massa di pura comlibra dai database 12. Abbreviazioni: DB, database; KO, knock-out, 1-D, uno-dimensionali; 2-D, bidimensionali, NMR, risonanza magnetica nucleare, IR, infrarossi; MS n, di massa di massa spectrometries.
Figura 3. Esempio coregolamentazione analisi rete del percorso antocianine. Coespressione analisi sono state eseguite utilizzando il PRIME ( http://prime.psc.riken.jp/?action=coexpression_index ) sulla base dei dati impostati di versione ATTEDII 3 8,2 con l' Pajek programma ( http://vlado.fmf.uni-lj.si/pub/networks/pajek/ ). Correlazioni positive (r <0,5) sono utilizzati per stabilire connessioni di rete. Red nodo: dodici geni enzimatici (antociani At5g13930, CHS e TT4, calcone sintasi, At3g55120, CHI, TT5, calcone isomerise; At3g51240, F3H, TT6, flavanone 3-idrossilasi; At5g07990, F3'H, TT7, flavonoide 3'-idrossilasi; At5g17050, Fd3GT, UGT78D2, flavonoide 3 - O-glucosiltransferasi; At5g17220, AtGSTF12, TT19 ; At5g42800, DFR, TT3, diidroflavonolo reduttasi, At4g22880, ANS / LDOX, TT18, Antocianidina Synthese; At4g14090, A5GT, antociani 5 - O-glucosiltransferasi; At5g54060, A3G2 "XT, putativo antociani 3 - O-glucoside 2" - O - xylosyltransferase; At3g29590, A5GMaT, antociani 5 - O-glucoside 6'' '- O-malonyltransferase; At1g03940, A3GCouT, antociani 3 - O-glucoside 6 "- O - P-coumaroyltransferase) e due fattori di trascrizione per la produzione di antocianine (At1g56650, PAP1; At1g66390, PAP2) è stato utilizzato per la ricerca di geni candidati geni candidati sono stati trovati da un "intersezione di insiemi" ricerca con un valore di soglia con un coefficiente di r <./ Em >> 0,50 interrogato dalla intersezione di scene di tutti i geni interrogato (quattordici geni biosintetici antociani). A co-espressione della rete, compresi i geni candidati correlati (68 geni) e di geni interrogati (14 geni), è stato ricostruito da un "interconnessione di insiemi" di ricerca con r> 0.50 utilizzando il database PRIME. I file di output che sono stati formattati con un file '. Net' dal database PRIME e delle reti sono stati elaborati utilizzando il software Pajek. Nodo blu indica geni candidati, che con i geni correlati antociani.
specie | Maggiore secondaria metabolita |
Arabidopsis thaliana | Glucosinolati, flavonoli, antociani, derivato sinapoyl |
Populus trichocarpa | Flavonoli, antociani, derivato salicilato |
Vitis vinifera | Flavonoli, antociani, tannini, stilbene |
Solanum lycopersicum | Flavonoli, antociani, glycoalkaloid, chrologenate correlato, |
Nicotiana tabacum | Flavonoli, antociani, nicotianamide, chrologenate correlato, acylsugar |
Oryza sativa | Glycoflavone, antociani, steroli derivati |
Zea maggio | Glycoflavone, antociani, benzoxazinone, derivati degli steroli |
Medicago truncatula | Isoflavoni, antociani, saponina, |
Japonica Lotus | Isoflavone, flavonoli, antociani, saponina, |
Tabella I. principali metaboliti secondari in specie vegetali modello.
Co-espressione di database | Indirizzo |
Pianta a croce specIES | |
COP | http://webs2.kazusa.or.jp/kagiana/cop0911/~~V |
PlaNet | http://aranet.mpimp-golm.mpg.de/ |
Specie vegetali | |
ATEED-II | http://atted.jp/ |
BAR | http://142.150.214.117/welcome.htm |
COP | http://webs2.kazusa.or.jp/kagiana/cop |
GeneCAT | http://genecat.mpg.de/ |
Arabidopsis | |
ACT | http://www.arabidopsis.leeds.ac.uk/act/coexpanalyser |
AthCoR@CSB.DB | http://csbdb.mpimp-golm.mpg.de/csbdb/dbcor/ath.html |
CressExpress | http://cressexpress.org/~~V |
PRIME | http://prime.psc.riken.jp/?action=coexpression_index |
Oryza sativa | |
RiceArrayNet | http://arraynet.mju.ac.kr/arraynet/~~V |
Rice Array Database | http://www.ricearray.org/coexpression/coexpression.shtml |
Tabella II. Disponibile banca dati di espressione genica in silico per la co-analisi di espressione.
Dato che trascrittomica metabolomica e le tecnologie sono state utilizzate per diversi anni, il processo di integrazione dei dati per la metabolomica assistiti annotazione gene inizia generalmente con l'identificazione di un picco romanzo rappresenta un metabolita sconosciuto. Questo fatto porta alla fase successiva, che è quello di valutare la varianza quantitativa picchi metabolita o dei nuovi geni candidati ritenuti responsabili per il loro biosintesi. La strategia descritta in questo protocollo, tuttavia, ha tre problemi principali i) difficoltà di annotazione picco, ii) complessità di predizione percorso, iii) la risoluzione delle informazioni gene e la qualità dei dati di espressione genica. Per contrastare il primo problema, l'annotazione di picco deve essere eseguita con il co-eluizione di composti standard o le informazioni approccio combinatorio che utilizza da MS n analisi, estratto di riferimento, l'analisi mutante, ricerca su database metabolita e rassegna della letteratura (Figura 2, 12). Per il seconda problema, la previsione di percorso può essere ottenuto soltanto con annotazione di picco corretto. Tuttavia, profilatura metabolita della specificità del tessuto può anche essere picco annotazione supporto, perché accumulo metabolita deve essere correlata con le espressioni di geni correlati. Pertanto profili combinazione di diversi tessuti e condizioni di crescita può essere utile per questo secondo problema. Il terzo problema riguardante la risoluzione di informazioni gene dipende dai progressi dei dati di sequenza. Nel caso dell'impianto modello senza completamento della sequenza del genoma, co-espressione analisi utilizzando geni ortologhi in altre piante modello è utile. Il confronto e l'allineamento dettagliata analisi dell'albero filogenetico della sequenza di amminoacidi in grado di supportare la connessione organismi modello ad altre specie.
Questo protocollo è adatto a tutti metabolismi. È più efficiente nell'analisi di metabolismi intermedi e secondarie che sono ben caratterizzati ad essere soggetti a forti c trascrizionaleONTROLLO 1,5,11,16. In alcuni esempi, co-espressione di analisi riuscita essere eseguita in assimilazione zolfo, geni per la β-ossidazione, a catena ramificata degradazione aminoacidica, ripartizione clorofilla, e il catabolismo lisina 3, il metabolismo cellulare parete 10,7 e segnalazione luminosa cascata 14. Annotazione della funzione del gene via genomica combinati, la metabolomica e l'informatica non è solo per il gene di biosintesi e regolatore diretto del fattore di trascrizione, ma anche per capire processo fisiologico e la risposta (si veda ad esempio la figura 3. 14).
Per sviluppare questo approccio da piante modello a specie vegetali, il confronto metabolica tra le specie di piante è l'approccio efficace in alcuni metabolismo generale. Per esempio, se stesso composto viene rilevato in diverse specie vegetali, e alcuni geni ortologhi sono presenti in queste specie di piante, cross specie co-espressione analisi utilizzando ortologhi geni può fornire strong supporto per il vostro pronostico. Questo approccio può essere eseguita in Arabidopsis, pioppo, Medicago, oltre importanti colture quali orzo, riso, frumento e soia, da co-espressione analisi di specie vegetali (6, PlaNet: http://aranet.mpimp-golm.mpg . de / ,, 9, COP: http://webs2.kazusa.or.jp/kagiana/cop0911/ ; vedere un esempio, 15).
Non ci sono conflitti di interesse dichiarati.
Ringraziamo il Prof. Kazuki Saito in RIKEN PSC e il dottor Bjoern Usadel in MPIMP utili per le discussioni. TT è supportato da una borsa di studio della Alexander von Humboldt Foundation.
Name | Company | Catalog Number | Comments |
Nome del reattivo | Azienda | Numero di catalogo | |
Acqua distillata ULC / MS grad | BIOSOLVE | 23214102 | |
Acetonitrile (ACN) ULC / MS grado | BIOSOLVE | 01204102 | |
Metanolo (MeOH) ULC / MS grado | BIOSOLVE | 13684102 | |
Di acido formico (HCOOH) ULC / MS grado per cromatografia liquida | BIOSOLVE | 06914131 | |
Composti standard | EXTRASYNTHESE | ||
Linear trappola ionica (IT) ESI-MS Finnigan sistema-LTQ | Thermo Finnigan | ||
HPLC sistema Surveyor | Thermo Finnigan | ||
Analytical Luna colonna C18 (2), 2,0 mm, lunghezza 150 mm, 100 pori Ådimensioni e particelle sferiche di 3 mm | Phenomenex | 00F-4251-B0 | |
Xcalibur software | Thermo Finnigan |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon