Method Article
* Ces auteurs ont contribué à parts égales
Cet article décrit la procédure pour l’identification et la caractérisation d’une famille de gènes dans la vigne à cette famille d' Arabidopsis Tóxicos dans Levadura (ATL) E3 ubiquitine ligases.
Classification et nomenclature des gènes dans une famille peuvent contribuer significativement à la description de la diversité des protéines et à la prévision de fonctions familiales selon plusieurs caractéristiques, telles que la présence de motifs de séquence ou de particulier sites de modification post-traductionnelle et le profil d’expression des membres de la famille dans des conditions différentes. Cet ouvrage décrit un protocole détaillé pour la caractérisation des gènes familiaux. Ici, la procédure est appliquée à la caractérisation de la famille Arabidopsis Tóxicos dans Levadura (ATL) E3 ubiquitine ligase à grapevine. Les méthodes comprennent l’identification de tout le génome des membres de la famille, la caractérisation de la localisation du gène, la structure et les doubles emplois, l’analyse des motifs de protéine conservée, la prédiction des sites de localisation et de la phosphorylation des protéines ainsi que Profil d’expression génique au sein de la famille dans différents ensembles de données. Telle procédure, qui pourrait être étendu à de nouvelles analyses selon des fins expérimentales, pourrait être appliquée à toute famille de gènes à des espèces végétales pour lesquelles il existe des données génomiques, et il fournit des renseignements précieux pour identifier les candidats intéressants pour des études fonctionnelles, donnant un aperçu des mécanismes moléculaires de l’adaptation des plantes à leur environnement.
Au cours de la dernière décennie, beaucoup de recherche a été effectuée en génomique de la vigne. Vigne est une culture économiquement pertinente reconnue, qui est devenu un modèle pour la recherche sur le développement de fruits et sur les réponses des plantes ligneuses aux stress biotiques et abiotiques. Dans ce contexte, la libération du Vitis vinifera CV PN40024 génome en 20071 et sa version mise à jour en 20112 conduit à une accumulation rapide de données à l’échelle « omiques » et à un éclatement des études de haut débit. Selon les données publiées de séquence, l’analyse détaillée d’une famille de gène donné (généralement composée de protéines partageant des motifs conservés, les similitudes structurelles ou fonctionnelles et les relations évolutives), peut désormais être réalisée afin de découvrir ses les fonctions moléculaires, évolution et profils d’expression génique. Ces analyses peuvent contribuer à comprendre comment familles de gènes contrôlent les processus physiologiques à une échelle du génome.
Plusieurs aspects du cycle de vie végétale sont réglementées par dégradation ubiquitine-mediated de protéines clés, qui exigent un chiffre d’affaires adaptée pour garantir des processus cellulaires réguliers. Important les composants du processus de dégradation induite par l’ubiquitine sont l’E3 ubiquitine ligases, qui sont responsables de la souplesse du système, grâce au recrutement de cibles spécifiques3. En conséquence, ces enzymes représentent une famille de gènes énorme, avec environ 1 400 E3 ligase-codage gènes prévues dans Arabidopsis thaliana génome4, chaque ubiquitine ligase E3 agissant pour l’ubiquitination des protéines cibles spécifiques. Malgré l’importance de l’ubiquitination de substrat spécifique dans la régulation cellulaire chez les plantes, on connaît mal comment la voie de l’ubiquitination est réglementée et protéines cibles ont été identifiées que dans de rares cas. Le déchiffrage de ces mécanismes de la spécificité et la régulation s’appuie d’abord sur l’identification et la caractérisation des différentes composantes du système, en particulier l’E3 ligases. Entre ubiquitine ligases, la sous-famille des ATL se caractérise par 91 membres identifiés chez a. thaliana affiche un anneau-H2 doigt domaine5,6, certains d'entre eux jouant un rôle dans la défense et l’hormone réponses7.
La première étape cruciale pour définir les membres d’une nouvelle famille de gènes est la définition précise des caractéristiques familiales, tels que les motifs de consensus, les domaines clés et caractéristiques de séquences de protéines. En effet, la récupération fiable de tous les membres de famille de gène BLAST analyse nécessite certaines caractéristiques de la séquence obligatoire, dans les domaines de protéine responsables de la protéine fonction/activité, servant de signature de la protéine. Cela peut être facilité par la caractérisation antérieure de la même famille de gènes chez d’autres espèces végétales ou obtenu en analysant les différents gènes putativement appartenant à la même famille dans différentes espèces de plantes, d’isoler les séquences communes. Les membres de la famille peuvent alors être individuellement nommés suivant des règles communes, a été réglées par un consortium international pour une espèce végétale donnée. Dans la vigne, par exemple, cette procédure est soumis aux recommandations du Comité de Nomenclature Super pour l’Annotation de gène de raisin (sNCGGa), établissant la construction d’un arbre phylogénétique y compris V. vinifera et a. thaliana membres de famille de gène pour permettre l’annotation de gène issu des séquences de nucléotides8.
Localisation chromosomique des membres de la famille et enquête sur la duplication génique permettent mettant en évidence la présence de gènes dupliqués génome entier ou tandem. Cette information semble utile pour démêler les fonctions des gènes putatifs, puisqu’elle pourrait voir la redondance fonctionnelle ou révéler des situations différentes, c'est-à-dire, non-fonctionnalisation, neo-fonctionnalisation ou subsidiaire fonctionnalisation9. Les deux néo - et sous-sous - functionalization sont des événements importants qui créent la nouveauté génétique, fournissant de nouveaux composants cellulaires pour l’adaptation des plantes à l’évolution des environnements10. En particulier, les duplications de gènes ancestraux et production de nouveaux gènes ont été très fréquentes au cours de l’évolution du génome vigne et nouvellement formé de gènes provenant des duplications proximales et tandem à grapevine étaient plus susceptibles de produire une nouvelle fonctions11.
Un autre facteur clé à déchiffrer la fonction des gènes familiaux est le profil de transcriptomique. La disponibilité des bases de données publiques donnant accès à une quantité énorme de données transcriptomiques peut être ainsi exploitée pour attribuer des fonctions aux membres de famille de gène à grande échelle en silico analyses d’expression. En effet, l’expression particulière de certains gènes dans les organes de la plante spécifique ou en réponse à certaines contraintes peut donner quelques conseils au sujet des rôles présumés des protéines correspondantes dans les conditions définies et apporter un soutien à des hypothèses sur la possible auxiliaire de fonctionnalisation de gènes dupliqués pour répondre aux différents défis. À cette fin, il est important de tenir compte de plusieurs ensembles de données : ceux-ci peuvent être gène déjà disponible des matrices d’expression, tels que l’atlas du génome transcriptomique des organes de la vigne et des stades de développement,12, ou peut être construits ad hoc par récupération des ensembles de données transcriptomiques pour les espèces de plante particulière soumises à des contraintes définies. En outre, une approche simple à l’aide de deux matrices, avec données de similitude par paires et l’autre avec des coefficients de co-expression par paire peuvent être appliqués afin d’évaluer les relations entre modèles de similitude et d’expression de séquence au sein d’une famille multigénique.
Le but de ce travail est de fournir une approche globale, définissant la structure des gènes, motifs de protéine conservée, localisation chromosomique, duplications géniques et profils d’expression, comme bien la prédiction des sites de localisation et de la phosphorylation des protéines, pour atteindre un caractérisation exhaustive d’une famille de gènes chez les plantes. Une telle approche globale est appliquée ici à la caractérisation de la famille ATL E3 ubiquitine ligase vigne. Selon le rôle émergent des ATL sous-famille des membres dans la régulation des processus cellulaires clés7, ce travail peut bien aider l’identification des candidats solides pour des études fonctionnelles et éventuellement élucider les mécanismes moléculaires régissant la adaptation de cette culture importante à son environnement.
1. identification des ATL putatif famille multigénique membre (s)
2. manuelle Inspection des membres des familles PSI-BLAST-identifiés
3. analyse des paramètres physiques de protéine et domaines
4. chromosomique Distribution, Duplications et organisation Exon-intron
5. nomenclature et analyse phylogénétique
6. vigne orgue et Stage profilage de l’Expression
7. profilage de l’expression en réponse aux stress biotiques et abiotiques
8. l’analyse des relations entre la Divergence des séquences paralogues et gène la co-expression
Le gène VIT_05s0077g01970, identifié comme étant le plus semblable à a. thaliana ATL2 (At3g16720) grâce à une recherche de BLASTp, a été utilisé comme sonde pour sonder les membres de la famille ATL dans le génome de la vigne (Vitis vinifera cv Pinot Noir PN40024). L’analyse de PSI-BLAST ont convergé après quelques cycles révélant une liste de gènes putatifs appartenant à la famille de gène ATL de vigne (Figure 1 a). La présence du domaine canonique RING-H2 pour chaque candidat a été évaluée par l’examen visuel de l’alignement de MUSCLE de toutes les entrées définies dans l’analyse (Figure 1 b). Seulement ces gènes contenant des acides aminés conservés correctement espacées, les deux résidus d’histidine, ainsi que les résidus de proline avant la troisième cystéine ont été considérés comme ATLs selon la définition originale de ATL dans Arabidopsis5. Un total de 96 vigne gènes rempli les conditions et ont été considérés pour davantage de caractérisation. Chaque membre de la famille ATL a été analysée pour définir les caractéristiques spécifiques du gène et la correspondante protéine codée, c'est-à-direla présence d’autres domaines connus en plus de l’anneau-H2, régions riches transmembranaires ou hydrophobes, subcellulaires localisation et sites de phosphorylation putatif (tableau 1 et tableau 2).
Figure 1 : enquête PSI-BLAST et alignement de la vigne putatif ATLs. (A) capture d’écran des hits top 10 de la première recherche d’itération PSI-BLAST à l’aide de la séquence de la protéine VIT_05s0077g01970 comme appât. (B) partie de l’alignement de la vigne sélectionné 96 putatifs ATLs montrant leur domaine RING-H2 et le LOGO correspondant obtenus à l’aide d’une suite de biologie moléculaire (voir Table des matières). Reproduit de Ariani et al. , sous une licence Creative Commons Attribution 4.0 International42.S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Nom | ID de gène | Longueur de gène (bp) | Numéro de l’intron | UniProt ID | Longueur de protéine (aa) | Motif de l’anneau-H2 | Nombre de domaine TM/H | Autres domaines | ||
VviATL3 | VIT_09s0002g00220 | 1245 | 0 | F6HXK6 | 304 | PxC | 1 | |||
VviATL4 [VviRHX1A] | VIT_15s0021g00890 | 1827 | 3 | D7SM36 | 203 | PxC | 0 | |||
VviATL18 | VIT_11s0118g00780 | 1113 | 2 | F6HCI8 | 193 | PC | 0 | |||
VviATL23a | VIT_18s0001g01060 | 935 | 0 | F6H0E4 | 114 | PxC | 0,5 | |||
VviATL23b | VIT_18s0001g01050 | 399 | 0 | E0CQX3 | 132 | PxC | 1 | |||
VviATL24 | VIT_17s0000g06460 | 4466 | 4 | D7SI89 | 217 | PxC | 1 | |||
VviATL27 | VIT_00s0264g00020 | 2554 | 4 | D7T1R5 | 235 | PxC | 1 | |||
VviATL43 | VIT_11s0052g00530 | 1576 | 2 | D7SQD9 | 457 | PxC | 3 | |||
VviATL54a | VIT_18s0001g06640 | 3221 | 1 | F6H0Y5 | 405 | PxC | 1 | |||
VviATL54b | VIT_03s0017g00670 | 2774 | 1 | F6HTI0 | 427 | PxC | 1 | |||
VviATL55 [VviRING1] | VIT_07s0191g00230 | 1844 | 0 | F6HRP9 | 372 | PxC | 1 | |||
VviATL63 | VIT_06s0004g06930 | 804 | 0 | D7SJU6 | 267 | PxC | 1 | |||
VviATL65 | VIT_03s0063g01890 | 2068 | 0 | F6HQI8 | 396 | PxC | 1 | |||
VviATL82 | VIT_01s0026g02540 | 820 | 0 | F6HPQ9 | 233 | PC | 0,5 | |||
VviATL83 | VIT_17s0000g08400 | 1887 | 0 | F6GSQ4 | 143 | PC | 0 | |||
VviATL84 | VIT_06s0004g00120 | 1853 | 0 | F6GUP5 | 368 | PC | 0,5 | ZF-RING_3 | ||
VviATL85 | VIT_12s0034g01400 | 786 | 0 | F6H965 | 261 | PC | 0,5 | |||
VviATL86 | VIT_12s0034g01390 | 1434 | 1 | D7T016 | 451 | PC | 0,5 | |||
VviATL87 | VIT_18s0001g03270 | 1002 | 0 | F6H0T2 | 333 | PC | 0,5 | ZF-RING_3 | ||
VviATL88 | VIT_08s0040g00590 | 1320 | 0 | F6HQR2 | 314 | PC | 0 | ZF-RING_3 |
Tableau 1 : première 20 VviATL gènes et caractéristiques de la séquence des protéines correspondantes. TM : transmembranaire ; H: hydrophobes ; 0,5 indique la présence d’une ou plusieurs régions hydrophobes. Reproduit de Ariani et al. , sous une licence Creative Commons Attribution 4.0 International42.
Tableau 2 : détails sur les 20 premiers VviATL position du gène dans V. vinifera génome, état de dédoublement et caractéristiques physico-chimiques ATL protéine et emplacement. (a) nombre de sites de phosphorylation prédite par Musite ; (b) des prévisions similaires obtenues avec au moins deux logiciels sont mises en évidence en caractères gras ; ngLOC a été utilisée avec les paramètres par défaut, tandis que TargetP v1.1 et la localisation intracellulaire de la protéine Prowler ont été utilisés avec un seuil de probabilité de 0,5. NUC, noyau ; MIT, mitochondries ; CHL, chloroplaste ; PLA, membrane plasmique ; S, voie de sécrétion (présence d’un peptide signal) ; M, mitochondries ; C, chloroplaste ; O ou -, autres localités ; ND, ne pas déterminé (par exemple, valeur inférieure au seuil). Reproduit de Ariani et al. , sous une licence Creative Commons Attribution 4.0 International42. S’il vous plaît cliquez ici pour télécharger ce fichier.
Une analyse phylogénétique, y compris les séquences nucléotidiques des gènes de codage de ATL vigne identifiés ainsi que les séquences de la famille de gènes de référence a. thaliana ATL a été utilisée pour la nomenclature de vigne ATL, conformément aux directives de le sNCGGa8. Quatre-vingt-seize et 83 des séquences de nucléotides de V. vinifera et a. thaliana, respectivement, ont été soumis à l’oléoduc de Phylogeny.fr pour obtenir un arbre phylogénétique fiable.Les séquences de ce dernier furent ensuite utilisées pour annoter et nommez les gènes de la vigne sur la base de relations solides (Figure 2). Suivant cette approche, 13 des 96 vigne ATLs a reçu un identifiant spécifique compte tenu de leur niveau un à un avec un a. thaliana ATL Les noms des 83 autres gènes ont été assignés basés sur l’arbre phylogénétique, avec un progressif numérotation de haut en bas, à partir d’un nombre de gènes ATL plus élevé que la plus élevée utilisée dans numéro a. thaliana.
Figure 2 : Arbre phylogénétique de V. vinifera et a. thaliana ATL E3 ubiquitine ligase-codage gènes. L’arbre des s’est amorcé à la suite de Phylogeny.fr (V. vinifera (en vert) et les gènes ATL 83 de a. thaliana signalés dans la base de données UniProt (en jaune). Les valeurs de support Branch proviennent de 100 répétitions bootstrap. Les étoiles rouges indiquent la présence d’un domaine de doigt (BZF) de zinc BCA2 en protéines correspondantes. Reproduit de Ariani et al. , sous une licence Creative Commons Attribution 4.0 International42. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Cartographie des gènes codant ATL aux chromosomes vigne ont montré une large distribution dans tout le génome, ce qui suggère de duplication du génome entier comme la plus grande force évolutive dans l’expansion de la famille de gènes ATL à grapevine. En effet, 31 ATLs ont été trouvés dans des régions chromosomiques homologues potentiellement provenant d’évènements de duplication du génome entier ou segmentaire. En outre, la même analyse a souligné 13 gènes dupliqués en tandem, un duplicata proximale et 51 doublons dispersées (Figure 3). Compte tenu du très grand nombre de gènes dupliqués dans la famille ATL, nous avons effectué un test d’enrichissement (test exact de Fisher) pour vérifier la conservation préférentielle des gènes dupliqués lors du fractionnement du génome. Avec une p-valeur < 0,001, cet essai confirmé l’hypothèse selon laquelle dupliqué gènes ATL ont été retenus prévu plus de façon aléatoire, ce qui suggère un rôle pour la famille de gènes ATL pendant l’adaptation de la vigne et de l’évolution.
Figure 3 : Vigne ATL-encodage la distribution des gènes sur les chromosomes de V. vinifera et état de dédoublement. Les gènes ATL 96 vigne avec informations chromosomiques précises disponibles dans la base de données ont été localisés aux 19 V. vinifera chromosomes. Les couleurs indiquent l’événement original de la duplication. Les lignes noires verticales et des lignes rouges identifient des paires de dérivés de duplications en tandem et duplications du génome entier, respectivement. Reproduit de Ariani et al. , sous une licence Creative Commons Attribution 4.0 International42. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Afin d’étudier les fonctions biologiques putatives de l’ATLs à grapevine, une méta-analyse a été effectuée sur le CV de V. vinifera l’expression des gènes global Corvina Atlas12. Le dataset comprend des valeurs de l’expression du génome entier de 54 vigne différents organes et stades de développement et a été utilisé pour effectuer une analyse hiérarchique de bi-groupé. Résultats non seulement confirment que tous les 96 ATLs étaient exprimés dans au moins un des tissus 54/étapes, mais faits aussi remarquer la présence de cinq grands groupes de profils d’expression (Figure 4 a). Brièvement, groupes A et E ont montré face à des comportements, en particulier le premier est caractérisé par une régulation générale négative des gènes ATL dans des échantillons de juvéniles, y compris les débuts berry, jeunes feuilles, vrilles, inflorescence et la plupart des stades bourgeon. En revanche, dans le même groupe A, matures échantillons tels que les baies à maturité et post-récolte flétrissement stades, tissus ligneux et stades de développement de semences ATL gènes ont montré une augmentation prédominante. Gènes en Cluster C étaient principalement diminué dans la plupart des échantillons, tandis que les gènes ATL du groupe D ont été souvent surexprimés aux derniers stades de développement de la baie. Enfin, cluster B ne montrent aucune variation significative dans les profils d’expression.
Une approche similaire a été appliquée à l’étude de l’expression de vigne ATL membres de la famille en réponse aux stress biotiques et abiotiques, à l’aide d’ensembles de données spécifique, construit à cet effet. Il existe une énorme quantité de données d’expression dérivant de microarray et expériences de RNA-seq de bases de données public access comme Gene Expression Omnibus (GEO) et ArrayExpress. Une fois collectées et idéalement normalisé, l’information a été exploitée pour encore mieux comprendre la fonction potentielle de ATLs dans la réponse des plantes aux stress. Analyser les profils d’expression de la vigne ATLs en réponse aux stress biotiques a révélé que 62 sur 96 transcriptions ont montré une modulation importante (log2 pli-changement (FC) > | 0,5 |) au moins deux conditions, avec un taux de fausse découverte (FDR) < () 0,05 Figure 4 b). Le nombre atteint 81 ne considérant que le seuil FDR à une seule condition. Ces résultats suggèrent fortement une participation directe de la famille de gènes ATL dans la réponse aux agents pathogènes aussi dans la vigne. En particulier, un groupe de 12 gènes (VviATL3-27-54b-55-90-97-123-144-148-149-156) ont fortement augmenté en réponse à la plupart des agents pathogènes, y compris biotrophe et champignons nécrotrophe et herbivores et donc, méritent l’attention des plus fonctionnelles analyses.
Figure 4 : expression des gènes ATL classification hiérarchique à grapevine Atlas et vigne biotiques liés au stress DataSet. (A) l’expression journal transformé valeurs des gènes ATL vigne dans la vigne Atlas12 ont été utilisées pour l’analyse de groupement hiérarchique basée sur distance métrique de Pearson. La couleur échelle représente plus élevé (rouge) ou bas (vert) expression niveaux en ce qui concerne l’abondance de transcription médian de chaque gène dans l’ensemble de tous les échantillons. Lettres de A à E du côté droit indiquent les différents clusters identifiés.AB : après l’éclatement ; B: rafale ; bourgeon-w : bourgeon d’hiver ; F: floraison ; FB : début de la floraison ; FS : nouaison ; G : vert ; MR : mi-maturation ; PFS : après nouaison ; PHWI-II-III : après récolte, dépérissement 1, 2 et 3 mois ; R : maturation ; S: sénescentes ; tige-w : tige ligneuse ; V : véraison ; WD : bien développées ; Y: le jeune. Échelle (B) la couleur représente une augmentation (rouge) ou diminue (bleu) pli changements vigne ATL d’expression de gène dans les échantillons infectés par rapport aux témoins pour chaque condition. Les astérisques indiquent l’expression différentielle importante (FDR < 0,05) de chaque ATL dans les conditions correspondantes. Reproduit de Ariani et al. , sous une licence Creative Commons Attribution 4.0 International42. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.
Supplémentaire tableau 1 : candidats gènes ATL à l’épissage alternatif. (un) ATL ID gène selon la prédiction de raisin gène V1 et l’annotation, (b), ATL gène ID selon la V2 raisin gène prédiction et annotation43, (c) nombre de présumés ATL épissage variantes, (d) informations sur la séquence de chaque variante ATL putatif de codage. S’il vous plaît cliquez ici pour télécharger ce fichier.
Supplémentaires Tableau 2 : S’il vous plaît cliquez ici pour télécharger ce fichier.
Fichier supplémentaire 1 : S’il vous plaît cliquez ici pour télécharger ce fichier.
Dans l’ère de la génomique, de nombreuses familles de gènes ont été profondément caractérisés chez plusieurs espèces de plantes. Cette information est préliminaire à des études fonctionnelles et fournissent un cadre pour étudier davantage le rôle des différents membres d’une famille. Dans ce contexte, il y a également un besoin pour un système de nomenclature permettant d’identifier de manière unique chaque membre d’une famille, en évitant la redondance et les confusions qui peuvent survenir lorsque les noms sont attribués indépendamment de différents gènes par différents groupes de recherche.
Après un examen réfléchi, la communauté scientifique de la vigne a accepté de gènes de vigne de nom dans une famille basée sur les similitudes avec les gènes de l’Arabidopsis et établi une série de règles qui doivent être appliquées pour décrire de nouvelles familles de gènes dans la vigne, essentiellement à partir de la comparaison phylogénétique des séquences de nucléotides entre vigne et Arabidopsis membres de la famille8. Par conséquent, seuls gènes qui se trouvent déjà annotés et nommés correctement chez Arabidopsis peuvent être utilisés dans la nomenclature de la vigne. La procédure appliquée pour l’identification de vigne ATL orthologues chez Arabidopsis décrit ici a été réalisée par conséquent uniquement pour combler le besoin d’assigner la nomenclature famille de gène de vigne correct. Néanmoins, pour les autres espèces de plantes, approches alternatives pourraient être une option. Par exemple, niveau pouvait être déduite en utilisant un hits BLAST bidirectionnel (BBH), où les orthologues sont définis sous forme de paires de gènes chez les deux espèces qui sont plus proches (c'est-à-direavec le meilleur score de l’alignement) les uns que pour n’importe quel autre gène dans l’autre espèces,44. Toutefois, cette méthode pourrait manquer plusieurs orthologues dans le cas de taux élevé de la duplication de gènes, tels que dans les plantes et les animaux45. En outre, dans le cas de gènes codant ATL, BBH peut récupérer des gènes manquent la structure précise de ATL-type anneau-H2 (y compris les résidus de proline) ou des gènes qui ne sont pas annotées et nommés comme ATLs dans Arabidopsis. Bien que du point de vue évolutif, cette recherche peut être pertinente, la récupération des orthologues qui ne sont pas annotés n'aurait pas répondu à la portée de vigne ATL gène familiale annotation et nomenclature et orthologues qui ne sont pas annotées comme ATLs ne peut servir à des membres de la famille nom vigne. Une autre possibilité consiste à déduire le niveau issu des acides aminés au lieu des séquences de nucléotides à l’aide de InParanoid46, ou le plus récent de 2 Hieranoid47, quoique ces flux de travail n’est pas expressément recommandés par la communauté scientifique.
Meta-analyse de l’expression, qui peut être définie comme une approche systématique pour étudier et combiner différents référentiels de données accessibles au public des données d’expression, permet en soulignant partagés et différents mécanismes moléculaires dans une variété de conditions. Ainsi, l’intégration des informations d’expression de gène de multiples expériences de transcriptomique à grande échelle peut améliorer la caractérisation d’une famille de gènes, en définissant les profils d’expression des membres de la famille à travers des expériences, minimisant ainsi la impact des facteurs propres à expérience et soutenir une hypothèse plus robuste de la fonction des gènes putatifs dans des procédés particuliers. Cependant, l’utilisation de données microarray nécessite l’intégration de données d’expression obtenues avec différentes plates-formes, compte tenu de leurs propres limites. Par exemple, dans la plateforme microarray Nimblegen de vigne, une proportion importante des probesets pour les gènes correspondants représentées sur le tableau (~ 13 000 gènes) ont potentiellement hybridation croisée questions48. Dans le cas de la famille ATL vigne, 15 gènes peuvent être affectées par ce phénomène. Néanmoins, comme nous l’avons par Cramer et al. 48, la croix-identification des proches très similaires de gène par la même sonde pourrait fournir des informations intéressantes concernant l’expression, dans des conditions particulières, non seulement d’un seul gène, mais de deux à plus de gènes partage séquence très similitudes et donc potentiellement partage les objectifs et fonctions. Un autre problème potentiel lié aux ensembles de données microarray est la limite de détection d’expression des plates-formes de microarray, qui ne sont pas très sensibles. Pour résoudre les deux préoccupations, i.e., hybridation croisée et de signal, une solution possible consisterait à envisager seulement RNAseq expression datasets. Toutefois, la méta-analyse des données de RNAseq de très grands ensembles de données de plusieurs études différentes peut devenir très fastidieux et peut nécessiter beaucoup de ressources de calcul et d’une expertise de haut.
Bien que l’approche présentée ici vise à être exhaustive, elle peut être certainement encore complétée par d’autres analyses. Tout d’abord, pour réaliser d’autres aperçus de l’évolution moléculaire et les relations phylogénétiques entre les membres de famille de gènes chez les plantes, l’analyse phylogénétique pourrait être étendu construire un arbre phylogénétique en utilisant des alignements de séquences multiples des membres de la famille de plusieurs espèces de plantes. Il est également possible de calculer le temps évolutionnaire des gènes de la famille, une estimation de leur taux de substitutions synonymes et non-synonymes au cours de l’évolution, en déterminant les valeurs Ks (nombre de substitutions synonymes par site synonyme dans une donnée période de temps) et Ka (nombre de substitutions non-synonymes par site non-synonymes dans la même période). Le ratio de Ka/Ks est utilisé pour déduire les mécanismes des évènements de duplication de gène après la divergence de leurs ancêtres. Une valeur de Ka/Ks = 1 suggère la sélection neutre, une valeur de Ka/Ks de < 1 suggère purifiant de sélection et une valeur de Ka/Ks de > 1 suggère une sélection positive,49. En outre, si l’analyse de la structure génétique révèle la présence d’introns, la caractérisation famille de gène peut être étendue à la détection des variantes d’épissage alternatif. En effet, selon une étude profonde de RNA-seq données provenant de différents tissus, des conditions de stress et de génotypes43, 21 (des 96) ATLs sont des candidats pour des événements d’épissage alternatif, avec le nombre potentiel d’isoformes allant de 2 à 16 pour ces ATLs (voir Supplémentaire tableau 1). Autres transcriptions produisent fréquemment des isoformes protéiques qui varient dans les séquences d’acides aminés et ces changements peuvent modifier les propriétés cellulaires des protéines et peuvent provoquer des altérations de la subtile modulation à la perte de la fonction du produit du gène. Pour cette raison, événements d’épissage alternatif ont été impliqués dans les fonctions végétales importantes, y compris la réponse au stress, la résistance aux maladies, la photosynthèse et floraison50,,51.Intégration de l’information du promoteur du gène ATL contenant putatif cis-éléments régulateurs52 ou trouver des molécules (par exemple, micro-ARN et ARN de long non codantes) potentiellement ciblage ATLs53 peut également être complété à révèlent des aperçus de système de la régulation moléculaire complexe et l’interaction de la vigne ATLs.
En conclusion, le choix des analyses à effectuer ainsi que les procédures à appliquer pour caractériser une nouvelle famille de gènes dans une espèce de plante sont alimentées principalement par les règles de la communauté scientifique, ainsi que par l’étendue de l’identification des gènes familiaux. Il est important de garder à l’esprit les étapes de l’enquête ultérieure possible, qui vont exploiter l’ensemble des informations, parmi qui comprend évolution des gènes chez les espèces végétales, description de structure du génome ou candidats fiables pour la sélection dans le fonctionnel études.
Les auteurs n’ont rien à divulguer.
Le travail a été soutenu par l’Université de Vérone, dans le cadre de Joint projet 2014 (caractérisation de la famille de gènes ATL dans la vigne et de son implication dans la résistance au Plasmopara viticola).
Name | Company | Catalog Number | Comments |
Personal computer | |||
Basic Local Alignment Search Tool (BLAST) | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
Molecular Evolutionary Genetics Analysis (MEGA) | http://www.megasoftware.net/ | ||
Motif-based sequence analysis tools (MEME) | http://meme-suite.org/ | ||
Geneious | Biomatters Limited | http://www.geneious.com/ | |
ProtParam Tool | http://web.expasy.org/protparam/ | ||
ngLOC | http://genome.unmc.edu/ngLOC/index.html | ||
TargetP v1.1 Server | http://www.cbs.dtu.dk/services/TargetP/ | ||
Protein Prowler | http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ | ||
MUsite | http://musite.sourceforge.net/ | ||
Pfam | http://pfam.xfam.org/ | ||
TMHMM Server v. 2.0 | http://www.cbs.dtu.dk/services/TMHMM/ | ||
ProtScale | http://web.expasy.org/protscale/ | ||
Grape Genome Database (CRIBI) | http://genomes.cribi.unipd.it/grape/ | ||
PhenoGram | http://visualization.ritchielab.psu.edu/phenograms/plot | ||
MCScanX | http://chibba.pgml.uga.edu/mcscan2/ | ||
Interactive Tree Of Life (iTOL) | http://itol.embl.de/ | ||
UniProt | http://www.uniprot.org/ | ||
Phylogeny.fr | http://www.phylogeny.fr/index.cgi | ||
MUSCLE | http://www.ebi.ac.uk/Tools/msa/muscle/ | ||
Gblocks Server | http://molevol.cmima.csic.es/castresana/Gblocks_server.html | ||
Vitis vinifera cv. Corvina gene expression Atlas datamatrix | https://www.researchgate.net/publication/273383414_54sample_ datamatrix_geneIDs_Fasoli2012 | ||
Multi Experiment Viewer (MeV) | http://mev.tm4.org/#/welcome | ||
Sequence Read Archive (SRA) | https://www.ncbi.nlm.nih.gov/sra | ||
R | https://www.r-project.org/ | ||
EMBOSS Needle (EMBL-EBI) | http://www.ebi.ac.uk/Tools/psa/emboss_needle/ |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon