Method Article
Combinaison de la génomique, l'analyse du gène co-expression et l'identification de composés cibles par métabolisme donner annotation des gènes fonctionnels.
Compte tenu du nombre sans cesse croissant d'espèces de plantes modèles pour lesquels des séquences génomiques complètes sont disponibles et l'abondance des ressources biologiques telles que les mutants knock-out, adhésions sauvages et les populations de sélection avancées, il ya une charge croissante pour l'annotation fonctionnelle des gènes. Dans ce protocole, l'annotation de la fonction des gènes des plantes en utilisant combiné l'analyse du gène co-expression, la métabolomique et de l'informatique est fourni (Figure 1). Cette approche est basée sur la théorie de l'utilisation de gènes cibles de fonction connue pour permettre l'identification des gènes non annotés susceptibles d'être impliqués dans un processus métabolique certaine, avec l'identification de composés cibles par l'intermédiaire métabolomique. Des stratégies sont mises en avant pour l'application de cette information sur les populations générés par les deux approches de génétique directe et inverse, en dépit d'aucun d'entre eux sont sans effort. En corollaire de cette approche peut également être utilisé comme une approche pour caractériser les pics inconnus représentant nouvelle ou spécifique en soimétabolites dans les tissus condaires limitées, les espèces végétales ou de traitement du stress, qui est actuellement le procès important de comprendre le métabolisme des plantes.
1. Préparation de l'échantillon
2. Extraction pour le profilage des métabolites
3. Profilage des métabolites par LC-MS
4. Analyse des données
5. Prédiction de la voie métabolique
6. Préparation de la liste des gènes avec l'ID gène d'Arabidopsis orthologues
7. Co-exprimés analyse génétique
8. L'intégration de toutes les informations pour prédire Nouveaux Sentiers
9. Des expériences pour l'identification de gènes grâce aux bio-ressources
10. Les résultats représentatifs
La procédure d'analyse intégrée décrite dans ce protocole offre de nombreuses possibilités en fonction de fins expérimentales spécifié et le choix des combinaisons biologiques et analytiques. Choix des procédures et la conception expérimentale doit être effectuée correctement sur la base de votre voie cible, composés et les espèces végétales. La stratégie d'intégration décrites dans le présent protocole est foc utilisé sur l'annotation de la fonction des gènes des plantes et la découverte des fonctions des gènes nouveaux avec un usage efficace de plusieurs bio-et les données des ressources. Résultat escompté est promis de fournir avec le seul cas de la prédiction concluante. Ce fait indique que si des preuves suffisantes ne peut être donnée par les profils de combinaison, l'expérience ne devrait pas être démarré. Pour cette raison, dans tous les cas, d'autres expériences préliminaires telles que le profilage d'expression génique ciblée par RT-PCR, peuvent soutenir votre prédiction de la fonction des gènes. Précision et exactitude de la prédiction est en corrélation plus élevée en fonction de la différence qualitative et le numéro de la variation de la combinaison. En outre, les bons candidats et les résultats valides ne peut venir que de la prédiction précise des voies. Annotation de pointe devrait être menée par la combinaison de plusieurs approches, pour étude de la littérature, par exemple, extrait de plante de référence, MS n analyse, spécificité d'organe et de l'analyse mutant 13.
1 "src =" / files/ftp_upload/3487/3487fig1.jpg "/>
Figure 1. Vue d'ensemble de l'écoulement expérimental de l'annotation des gènes par approche combinée. Dans certains cas, les projets commencent par la découverte d'un pic de roman qui est détecté dans des conditions particulières ou des tissus, et le désir de comprendre son rôle au sein de son métabolisme. Dans d'autres cas le but du projet est l'identification des gènes ou la découverte des principaux facteurs de régulation tels que les facteurs de transcription. Conception de l'expérience devrait être raboté avec un ensemble de données qui montre des différences claires de niveaux de métabolites dans votre voie cible, en utilisant un large éventail d'échantillons de tissus provenant de différents organes, et pour les plantes cultivées de façon différentielle ou des plantes exposées à des conditions de stress, et en soumettant le matériau à profilage des métabolites. Plantes mutantes et transgéniques ainsi que QTL matériel de reproduction hébergement représentent également appropriée le matériel génétique de ces études. Prédiction de la nouvelle voie doit être effectuée avec soin préciseannotation de pointe et une approche combinaison avec différents types de metabolotype tels que les titres d'organes et les réponses au stress en fonction de données d'expression génique de votre voie d'intérêt. Dans la dernière étape, le profilage et la transcription métabolite doit être effectuée qui sera par la suite, lorsqu'il est combiné avec une analyse in silico des web-ressources et dans la caractérisation in vitro de l'expression des gènes par l'intermédiaire d'expression hétérologue, conduire à la confirmation de la gène candidat et l'élucidation de sa fonction et la position dans une voie métabolique. Abréviations: QTL, Quantitative Trait Loci.
Figure 2. Le flux de travail de l'approche combinatoire pour l'annotation de pointe. Une procédure d'identification de pointe et l'annotation par le composé standard, la comparaison de type sauvage et mutants knock out, la spectrométrie de masse multi-dimensionnelle de la crête cible se référant à des spectres de masse de la com purlivres des 12 bases de données. Abréviations: DB, bases de données; KO, knock-out; 1-D, une dimension; 2-D, à deux dimensions; RMN, résonance magnétique nucléaire; IR, infra-rouge; MS n, la masse-masse spectrométries.
Figure 3. Exemple d'analyse de réseau de co-régulation de la voie des anthocyanes. Analyses de co-expression ont été réalisées en utilisant l'amorce ( http://prime.psc.riken.jp/?action=coexpression_index ) sur la base des données établies de la version 3 ATTEDII 8,2 avec le Programme Pajek ( http://vlado.fmf.uni-lj.si/pub/networks/pajek/ ). Des corrélations positives (r <0,5) sont utilisés pour établir des connexions réseau. Rouge noeud: douze gènes enzymatiques (anthocyanes At5g13930, CHS, TT4, chalcone synthase; At3g55120, CHI, TT5, chalcone isomérisation; At3g51240, F3H, TT6, flavanone 3-hydroxylase; At5g07990, F3'H, TT7, flavonoïde 3'-hydroxylase; At5g17050, Fd3GT, UGT78D2, flavinoïde 3 - O-glucosyltransférase; At5g17220, AtGSTF12, TT19 ; At5g42800, DFR, TT3, dihydroflavonol réductase; At4g22880, SNA / LDOX, TT18, anthocyanidine synthese; At4g14090, A5GT, anthocyanes 5 - O-glucosyltransférase; At5g54060, A3G2 "XT, putative anthocyanine 3 - O-glucoside 2" - O - xylosyltransferase; At3g29590, A5GMaT, anthocyanes 5 - O-glucoside 6'' '- O-malonyltransferase; At1g03940, A3GCouT, anthocyanine 3 - O-glucoside 6 "- O - p-coumaroyltransferase) et deux facteurs de transcription pour la production d'anthocyanine (At1g56650, PAP1; At1g66390, PAP2) a été utilisé pour la recherche des gènes candidats gènes candidats ont été trouvés par une «intersection des ensembles" de recherche avec une valeur seuil avec un coefficient de r <./ Em >> 0,50 interrogé par l'intersection des ensembles de tous les gènes interrogées (Quatorze gènes de biosynthèse de anthocyanes). Un réseau de co-expression, y compris les gènes candidats corrélés (68 gènes) et des gènes interrogées (14 gènes), a été re-construit par une «interconnexion des ensembles" recherche avec r> 0,50 en utilisant la base de données PRIME. Les fichiers de sortie qui ont été formatés avec un fichier '. Net »de la base de données PRIME et réseaux ont été établis en utilisant le logiciel Pajek. Noeud bleu indique des gènes candidats qui sont corrélés avec des gènes d'anthocyanine.
espèce | Major métabolite secondaire |
Arabidopsis thaliana | Glucosinolates, les flavonols, anthocyanes, dérivé sinapoyl |
Populus trichocarpa | Flavonols, anthocyanes, dérivé de salicylate |
Vitis vinifera | Flavonols, anthocyanes, tanins, stilbène |
Solanum lycopersicum | Flavonols, anthocyanes, glycoalcaloïde, chrologenate connexe, |
Nicotiana tabacum | Flavonols, anthocyanes, nicotianamide, chrologenate connexe, acylsugar |
Oryza sativa | Glycoflavone, anthocyanes, les dérivés de stérols |
Zea mai | Glycoflavone, anthocyanes, benzoxazinone, dérivés du stérol |
Medicago truncatula | Isoflavones, anthocyanes, la saponine, |
Japonica Lotus | Isoflavones, flavonols, anthocyanes, la saponine, |
Tableau I. Principales métabolites secondaires des espèces végétales modèles.
La co-expression de base de données | Adresse |
Plante de croix specs | |
Conférence des Parties | http://webs2.kazusa.or.jp/kagiana/cop0911/~~V |
PlaNet | http://aranet.mpimp-golm.mpg.de/ |
Les espèces végétales | |
ATEED-II | http://atted.jp/ |
BAR | http://142.150.214.117/welcome.htm |
Conférence des Parties | http://webs2.kazusa.or.jp/kagiana/cop |
GeneCAT | http://genecat.mpg.de/ |
Arabidopsis | |
AGIR | http://www.arabidopsis.leeds.ac.uk/act/coexpanalyser |
AthCoR@CSB.DB | http://csbdb.mpimp-golm.mpg.de/csbdb/dbcor/ath.html |
CressExpress | http://cressexpress.org/~~V |
PRIMe | http://prime.psc.riken.jp/?action=coexpression_index |
Oryza sativa | |
RiceArrayNet | http://arraynet.mju.ac.kr/arraynet/~~V |
Base de données array riz | http://www.ricearray.org/coexpression/coexpression.shtml |
Tableau II. Disponible base de données d'expression génique pour in silico la co-expression d'analyse.
Étant donné que la transcriptomique et la métabolomique technologies ont été utilisées pendant plusieurs années, le processus d'intégration de données pour la métabolomique assistés annotation des gènes débute généralement par l'identification d'un pic roman représentant un métabolite inconnu. Ce fait conduit à l'étape suivante qui consiste à évaluer la variance quantitative des pics de métabolites ou les nouveaux gènes candidats jugés responsables de leur biosynthèse. La stratégie décrite dans le présent protocole, cependant, a trois problèmes majeurs i) difficulté d'annotation de pointe, ii) la complexité de la prédiction du sentier, iii) la résolution de l'information génétique et la qualité des données d'expression génique. Pour contrer le premier problème, l'annotation de pointe doit être effectuée avec le co-élution de composés standard ou de l'information approche combinatoire en utilisant l'analyse à partir de MS n, extrait de référence, analyse de mutants, de recherche de base de données métabolite et revue de la littérature (Figure 2, 12). Pour la sproblème EUXIÈME, prévision voie ne peut être obtenue par l'annotation de pointe correcte. Toutefois, le profilage métabolite de la spécificité tissulaire peut aussi être l'annotation de pointe de soutien, parce que l'accumulation métabolite doit être en corrélation avec les expressions de gènes de gènes apparentés. Par conséquent profils de combinaison de différents tissus et les conditions de croissance peut être utile pour ce second problème. Le troisième problème concerne la résolution de l'information génétique dépend de l'état d'avancement de données de séquences. Dans le cas de l'usine modèle sans fin de la séquence du génome, la co-expression d'analyse en utilisant des gènes orthologues chez des plantes modèles d'autres est utile. Comparaison et l'analyse détaillée d'alignement arbre phylogénétique de la séquence d'acides aminés peut prendre en charge pour se connecter organismes modèles à d'autres espèces.
Ce protocole est adapté à tous les métabolismes. Il est plus efficace dans l'analyse des métabolismes intermédiaires et secondaires qui sont bien caractérisés pour être soumis à la transcription c forteontrôle 1,5,11,16. Des exemples, dans la co-expression d'analyse a réussi à être exécutée dans l'assimilation du soufre, des gènes pour β-oxydation, à chaîne ramifiée dégradation de l'acide aminé, ventilation chlorophylle, et le catabolisme lysine, de la paroi cellulaire 3 métabolisme 10,7 et la lumière de signalisation en cascade 14. Annotation fonctionnelle des gènes par l'intermédiaire génomique, la métabolomique combinés et de l'informatique n'est pas seulement pour le gène de biosynthèse et de régulateur direct du facteur de transcription, mais aussi pour la compréhension de processus physiologique et de la réponse (voir Figure 3 par exemple. 14).
Pour développer cette approche à partir de plantes modèles pour les espèces cultivées, la comparaison métabolique de toutes les espèces végétales est une approche puissante dans certains métabolismes généraux. Par exemple, si un même composé est détectée dans différentes espèces de plantes, et quelques gènes orthologues sont trouvés dans ces espèces de plantes, croix espèces co-expression des gènes orthologues analyse à l'aide peuvent fournir strong de support pour votre prédiction. Cette approche peut être effectuée chez Arabidopsis, le peuplier, Medicago, en plus des cultures importantes comme l'orge, le riz, le blé et le soja, par la co-expression d'analyse des plantes (6, PlaNet: http://aranet.mpimp-golm.mpg . de / ,, 9, la CdP: http://webs2.kazusa.or.jp/kagiana/cop0911/ ; voir un exemple, 15).
Pas de conflits d'intérêt déclarés.
Nous tenons à remercier le professeur Saito Kazuki dans RIKEN CFP et le Dr Bjoern Usadel dans MPIMP pour des discussions utiles. TT est soutenu par une bourse de la fondation Alexander von Humboldt.
Name | Company | Catalog Number | Comments |
Nom du réactif | Entreprise | Numéro de catalogue | |
Eau distillée ULC / MS grad | BIOSOLVE | 23214102 | |
Acétonitrile (ACN) ULC / MS de qualité | BIOSOLVE | 01204102 | |
Le méthanol (MeOH) ULC / MS de qualité | BIOSOLVE | 13684102 | |
L'acide formique (HCOOH) ULC / MS de qualité pour la chromatographie liquide | BIOSOLVE | 06914131 | |
Composés standard | Extrasynthèse | ||
Piège à ions linéaire (IT) ESI-MS système FINNIGAN-LTQ | Thermo Finnigan | ||
Arpenteur système HPLC | Thermo Finnigan | ||
Luna analytique colonne C18 (2), 2,0 mm de diamètre, 150 mm de longueur, 100 pores Ået la taille des particules sphériques de 3 mm | Phenomenex | 00F-4251-B0 | |
Xcalibur logiciels | Thermo Finnigan |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon