Method Article
* Ces auteurs ont contribué à parts égales
L’analyse du réseau a été appliquée pour évaluer l’association de diverses communautés microbiennes écologiques, telles que le sol, l’eau et la rhizosphère. Présenté ici est un protocole sur la façon d’utiliser l’algorithme WGCNA pour analyser différents réseaux de co-occurrence qui peuvent se produire dans les communautés microbiennes en raison de différents environnements écologiques.
Le microbiome racinaire joue un rôle important dans la croissance des plantes et l’adaptation environnementale. L’analyse des réseaux est un outil important pour étudier les communautés, qui peut explorer efficacement la relation d’interaction ou le modèle de cooccurrence de différentes espèces microbiennes dans différents environnements. Le but de ce manuscrit est de fournir des détails sur la façon d’utiliser l’algorithme de réseau de corrélation pondéré pour analyser différents réseaux de cooccurrence qui peuvent se produire dans des communautés microbiennes en raison de différents environnements écologiques. Toutes les analyses de l’expérience sont effectuées dans le package WGCNA. WGCNA est un package R pour l’analyse de réseau de corrélation pondérée. Les données expérimentales utilisées pour démontrer ces méthodes étaient des données de communauté microbienne de la base de données NCBI (National Center for Biotechnology Information) pour trois niches du système racinaire du riz (Oryza sativa). Nous avons utilisé l’algorithme du réseau de corrélation pondéré pour construire des réseaux de co-abondance de communauté microbienne dans chacune des trois niches. Ensuite, des réseaux de co-abondance différentielle entre le sol de l’endosphère, du rhizoplan et de la rhizosphère ont été identifiés. En outre, les genres de base en réseau ont été obtenus par le paquet « WGCNA », qui joue un rôle régulé important dans les fonctions de réseau. Ces méthodes permettent aux chercheurs d’analyser la réponse du réseau microbien aux perturbations environnementales et de vérifier différentes théories de la réponse écologique microbienne. Les résultats de ces méthodes montrent que les réseaux microbiens différentiels significatifs identifiés dans le sol de l’endosphère, du rhizoplan et de la rhizosphère du riz.
La recherche sur le microbiome a des implications importantes pour la compréhension et la manipulation des processus écosystémiques1,2. Les populations microbiennes sont interconnectées par des réseaux écologiques en interaction, dont les caractéristiques peuvent affecter la réponse des micro-organismes aux changements environnementaux3,4. De plus, les propriétés de ces réseaux affectent la stabilité des communautés microbiennes et sont étroitement associées à la fonction du sol5. L’analyse pondérée du réseau de corrélation génique a maintenant été largement appliquée à la recherche sur la relation entre les gènes et les communautés microbiennes6. Les études précédentes se sont principalement concentrées sur les associations entre les réseaux de différents gènes ou populations et le monde extérieur7. Cependant, les différences dans les réseaux de corrélation formés par les populations microbiennes dans différentes conditions environnementales ont été à peine étudiées. Le but de la recherche présentée dans cet article est de fournir des informations et des détails sur la mise en œuvre rapide de l’algorithme WGCNA pour construire un réseau de cooccurrence d’échantillons de microbiome collectés dans différentes conditions environnementales. Sur la base des résultats de l’analyse, nous avons évalué la composition et les différences de la population et discuté plus en détail de la relation entre les différentes populations microbiennes. Le flux de base suivant de l’algorithme de réseau de corrélationpondérée 8 a été appliqué. Tout d’abord, une matrice de similitude devait être construite en calculant le coefficient de corrélation de Pearson entre les profils d’expression des unités taxonomiques opérationnelles (OTU). Ensuite, les paramètres des fonctions d’adjacence (les fonctions de puissance ou d’adjacence sigmoïde) ont été adoptés avec un critère de topologie sans échelle, la matrice de similarité a été transformée en matrice d’adjacence, et chaque réseau de cooccurrence correspondait à une matrice d’adjacence. Nous avons utilisé le clustering hiérarchique de liaison moyenne couplé à la dissimilarité basée sur TOM pour regrouper les OTU avec des profils d’expression cohérents en modules. De plus, nous avons calculé la relation entre les statistiques conservatrices et les modules d’analyse des paramètres associés, identifiant enfin l’OTU du hub dans le module. Ces méthodes sont particulièrement adaptées à l’analyse des différences dans les structures de réseau entre diverses populations microbiennes dans des conditions environnementales divergentes. Dans ce manuscrit, nous avons décrit en détail la méthode de développement des réseaux de co-expression, l’analyse des dissemblances entre les modules, et avons fourni un bref aperçu des étapes de la procédure appliquée pour obtenir les espèces centrales dans différents réseaux de modules.
1. Téléchargement des données
2. Détermination optimale de la valeur de puissance
Remarque : Le package WGCNA contient tous les paramètres fonctionnels suivants. WGCNA est un package R pour l’analyse de réseau de corrélation pondérée. Les lignes de commande clés se réfèrent au Supplément S1.
3. Construction d’un réseau de co-expression et identification de module
REMARQUE: Sur la base de la valeur de puissance calculée ci-dessus, le réseau de cooccurrence est construit. Les lignes de commande clés se réfèrent au Supplément S2.
4. Comparaison des modules
REMARQUE: Cette méthode peut être utilisée pour comparer les modules de réseau de deux communautés microbiennes écologiques. Dans cet article, comparez les différences de modules de réseau microbien entre l’endosphère et le rhizoplan, l’endosphère et la rhizosphère, la rhizosphère et le rhizoplan.
5. Analyse du module de réseau différentiel microbien
Les résultats représentatifs de cet article ont été téléchargés à partir des données de 2014 sur le microbiome radiculaire du riz Abaker de Californie dans la base de données NCBI (PRJNA386367)9. Les données comprennent des échantillons de microbiome de la rhizosphère, du rhizoplan et de l’endosphère provenant de plants de riz cultivés pendant 14 semaines dans une rizière submergée. Nous avons utilisé l’algorithme WGCNA pour sélectionner la valeur de puissance qui satisfaisait les trois réseaux proches du réseau sans échelle (Figure 1) et développé trois réseaux de co-expression (Figure 2). Dans le réseau de co-expression microbienne du sol de l’endosphère, du rhizoplan et de la rhizosphère, 23, 22 et 21 modules ont été identifiés, respectivement. Ces résultats indiquent que le nombre de réseaux d’interaction microbienne dans les trois niches était fondamentalement égal.
Nous avons ensuite comparé les différences dans les modules de réseau microbien dans le sol de l’endosphère, du rhizoplan et de la rhizosphère. Les résultats suivants des tests de préservation des modules des trois groupes de niches ont été obtenus. Trois modules extrêmement non conservés existaient entre le sol de la rhizosphère et le rhizoplan(Figure 3a,Tableau 1). De plus, neuf modules extrêmement non conservés étaient présents entre le sol et l’endosphère de la rhizosphère(Figure 3b,Tableau 2)et six modules extrêmement non conservés entre le rhizoplan et l’endosphère (Figure 3c, Tableau 3). En outre, des modules extrêmement non conservés parmi les trois niches ont été trouvés, indiquant la présence de grandes différences dans la composition des micro-organismes entre les trois niches. Les résultats de l’analyse de corrélation des appartenances aux modules obtenus des modules non conservateurs sont illustrés à la figure 4. À partir de la figure, un module significativement différent avec le moins de corrélation entre chacune des deux niches est visible parmi les trois niches, ce qui représente la différence la plus significative entre elles.
Dans le réseau de différence rhizosphère-rhizoplan(figure 5a),le phylum dominant était celui des protéobactéries (72,97 %). Dans le réseau de différence rhizosphère-endosphère (Figure 5b), les phyla dominants étaient les protéobactéries (66,36%), les actinobactéries (10,1%) et les bactéroïdes (10,9%). Dans le réseau de différence rhizoplan-endosphère (Figure 5c), les phyla dominants étaient les protéobactéries (41,41%), les Bacteroidetes (10,10%), les Firmicutes (12,12%) et les Verrucomicrobia.
Trois genres principaux (Figure 5a), dont Rhodobacter et Novosphingobium, six genres de noyau (Figure 5b), dont Blvii28 et Dechloromonas, et cinq genres de noyau (Figure 5c), y compris Cellvibrio et Geobacter, ont exercé d’importantes fonctions de régulation dans les trois réseaux de cooccurrence différentielle. Tous les genres de base, à l’exception de Dechloromonas, n’ont eu d’influence que sur un seul réseau, indiquant la disponibilité de différences considérables dans l’abondance relative des populations et des espèces microbiennes entre les trois niches de racines de riz, ce qui a eu un effet critique sur l’abondance et la diversité des communautés microbiennes racinaires existantes.
Le genre de base Azospirillum,présent dans le réseau de différence rhizosphère-endosphère du riz, a participé à la fixation de l’azote et favorisé la croissance des plantes10. De plus, le genre Geobacter, qui s’est considérablement enrichi dans le réseau de différence rhizoplan-endosphère, peut être le principal facteur induisant la réduction des oxydes insolubles de Fe et de Mn dans de nombreux sols et sédiments11. Ces micro-organismes interagissent avec une gamme de communautés microbiennes dans les niches racinaires et participent activement à la régulation des réseaux microbiens, ce qui pourrait être d’une importance cruciale pour la croissance et le développement des racines de riz.
Graphique 1. Évaluation de powerβ dans les jeux de données. a) Évaluation des β de puissance dans l’ensemble de données ES; b) Évaluation de la puissance β dans l’ensemble de données RS; c) Évaluation de la puissance β dans l’ensemble de données RP, distribution de l’indice sans échelle R2 (à gauche), distribution de la connectivité moyenne (à droite) le long de différents indices de puissance douce. La valeur de la meilleure puissance a été obtenue lorsque R2 avait tendance à saturation et n’était pas inférieure à 0,8. Les trois réseaux de co-expression devaient être réglés sur la même valeur de puissance pour assurer leur comparabilité. (RS : sol de la rhizosphère, RP : rhizoplan et ES : endosphère). Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 2. Dendrogramme OTU obtenu par regroupement hiérarchique de liaison moyenne. a)dendrogramme OTU du réseau ES; b) Dendrogramme OTU du réseau RS; c) Dendrogramme OTU du réseau RP. La ligne de couleur sous le dendrogramme indique l’affectation de module déterminée par l’algorithme Dynamic Tree Cut. (RS : sol de la rhizosphère, RP : rhizoplan et ES : endosphère) Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 3. Résultats du test de conservation. a) Les résultats de l’analyse sont fondés sur l’allocation du module réseau de co-expression RS en tant que groupe de référence et les résultats de l’allocation du module réseau de co-expression RP en tant que groupe d’essai; b) Les résultats de l’analyse sont fondés sur l’allocation du module réseau de co-expression ES en tant que groupe de référence et les résultats de l’allocation du module réseau de co-expression RS en tant que groupe d’essai; c) Les résultats de l’analyse sont fondés sur l’allocation du module réseau de co-expression ES en tant que groupe de référence et les résultats de l’allocation du module réseau de co-expression RP en tant que groupe d’essai. Z_summary > 10 indique que deux modules sont très conservés, tandis que Z_summary < 2 désigne des modules non conservés. medianRank exprime la préservation relative du module évalué par classement. Des valeurs medianRank plus élevées indiquent des modules non conservés. (RS : sol de la rhizosphère, RP : rhizoplan et ES : endosphère) Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 4. Analyse de corrélation des appartenances aux modules. a) Corrélation modulaire de la valeur kME entre le réseau RS et RP; b) Corrélation modulaire de la valeur kME entre le réseau RS et RP; c) Corrélation modulaire de la valeur kME entre rp et réseau ES (RS : sol de la rhizosphère, RP : rhizoplan, ES : endosphère et KME : appartenance au module). Veuillez cliquer ici pour voir une version agrandie de cette figure.
Graphique 5. Réseau de cooccurrence de population microbienne différentielle dans la racine de riz. a)Réseau de cooccurrence de populations microbiennes différentielles dans la RP-RS; b) Réseau de cooccurrence de populations microbiennes différentielles dans l’ES-RS; c) Réseau de cooccurrence de populations microbiennes différentielles dans l’ES-RP. L’analyse a été réalisée à l’aide du logiciel Cytoscape. Différentes couleurs représentent différentes portes dans la figure. (RS: Sol de la rhizosphère, RP: rhizoplan et ES: endosphère). Veuillez cliquer ici pour voir une version agrandie de cette figure.
module | medianRank | Zsummary | module | medianRank | Zsummary |
jaune vert | 2 | 14 | jaune | 13 | 5.2 |
rose | 2 | 17 | gris60 | 14 | 3.1 |
bleu nuit | 3 | 10 | royalblue | 15 | 2.1 |
Marron | 4 | 18 | noir | 16 | 2.7 |
lightcyan | 6 | 8.5 | tanner | 17 | 3.2 |
pourpre | 7 | 10 | saumon | 18 | 1.3 |
bleu | 7 | 22 | magenta | 18 | 2.2 |
vert | 8 | 12 | sombre | 20 | -0.24 |
cyan | 10 | 4.8 | or | 20 | 14 |
vert clair | 11 | 5.1 | vert foncé | 22 | -1.1 |
jaune clair | 12 | 5.3 | gris | 22 | 0.21 |
rouge | 12 | 6.1 |
Tableau 1. Résultat de Zsummary et medianRank entre le sol de la rhizosphère et le rhizoplan.
module | medianRank | Zsummary | module | medianRank | Zsummary |
saumon | 1 | 19 | lightcyan | 13 | 1.1 |
noir | 3 | 5.3 | rouge | 15 | 0.95 |
jaune | 4 | 5.8 | bleu nuit | 15 | -0.0016 |
vert clair | 5 | 0.27 | royalblue | 16 | 0.83 |
jaune vert | 7 | 3 | magenta | 16 | 0.52 |
turquoise foncée | 7 | 1.2 | vert foncé | 17 | 0.16 |
gris60 | 9 | 1.1 | tanner | 18 | 0.64 |
bleu | 10 | 3.9 | jaune clair | 19 | 0.52 |
pourpre | 10 | 2.3 | sombre | 19 | -0.18 |
Marron | 12 | 2.3 | rose | 19 | -0.71 |
cyan | 12 | 0.78 | or | 21 | 11 |
vert | 13 | 1.7 |
Tableau 2. Résultat de Zsummary et medianRank entre le sol de la rhizosphère et l’endosphère.
module | medianRank | Zsummary | module | medianRank | Zsummary |
noir | 1 | 15 | turquoise foncée | 13 | 1.7 |
saumon | 2 | 27 | bleu nuit | 13 | 1.6 |
jaune | 3 | 13 | vert clair | 13 | 0.64 |
cyan | 4 | 5.4 | vert foncé | 14 | 1.5 |
bleu | 8 | 3.9 | sombre | 16 | 1.5 |
lightcyan | 9 | 2.6 | pourpre | 17 | 2.3 |
rose | 10 | 3.6 | jaune vert | 18 | 0.8 |
royalblue | 10 | 1.5 | jaune clair | 18 | 0.42 |
Marron | 12 | 2.9 | magenta | 19 | 0.2 |
vert | 12 | 1.9 | or | 21 | 18 |
rouge | 12 | 1.9 | gris60 | 21 | -0.21 |
tanner | 13 | 2.5 |
Tableau 3. Résultat de Zsummary et medianRank entre le rhizoplane et l’endosphère.
Supplément S1: Veuillez cliquer ici pour télécharger ce fichier.
Supplément S2 : Veuillez cliquer ici pour télécharger ce fichier.
Supplément S3: Veuillez cliquer ici pour télécharger ce fichier.
Supplément S4: Veuillez cliquer ici pour télécharger ce fichier.
Les réseaux de corrélation sont de plus en plus utilisés dans les applications bioinformatiques. WGCNA est une méthode de biologie des systèmes pour l’analyse descriptive des relations entre divers éléments d’un système biologique12. Le progiciel R a été utilisé dans des travaux antérieurs sur WGCNA13,14,15. Le package comprend des fonctions pour la construction de réseaux, la détection de modules, le calcul des propriétés topologiques, la simulation de données, la visualisation et la capacité d’interfaçage avec un logiciel externe. WGCNA a été largement utilisé pour analyser les données d’expression génique du cancer du cerveau16, du cycle cellulaire de levure17, de la génétique de la souris18,19, du tissu cérébral primate20,21, du diabète22et des plantes23. Utiliser l’analyse pondérée du réseau de corrélation génique pour construire le réseau doit inclure au moins 8 échantillons. Dans cet article, nous nous sommes concentrés sur les réseaux de co-expression génique qui décrivent les interactions entre les populations microbiennes dans différents environnements. Nous avons obtenu des réseaux différentiels entre les populations microbiennes dans des environnements divergents et identifié les espèces clés dans chaque réseau. L’idée que les espèces clés sont importantes pour la communauté a été largement utilisée dans la recherche sur le réseautrophique 24. Certaines espèces d’une communauté microbienne complexe peuvent être essentielles pour maintenir la stabilité et la fonctionnalité de la communauté, comme les Bacteroides dans la flore intestinale25. L’analyse des communautés microbiennes peut être considérablement simplifiée en ciblant des espèces spécifiques d’importance potentielle.
Nos résultats représentatifs mettent en évidence les différences dans les communautés microbiennes, qui peuvent être identifiées à l’aide de la méthode décrite ci-dessus. Ici, les micro-organismes dans différentes niches du système racinaire du riz ont été soumis à WGCNA. La différence entre les trois créneaux a été identifiée à l’aide d’analyses conservatrices et d’analyses de l’appartenance aux modules. Nous avons déterminé les espèces clés dans les modules de différence et obtenu des informations sur les différences dans la composition des communautés microbiennes dans les trois niches. Pendant ce temps, le réseau de cooccurrence a révélé la présence d’une interaction significative entre les micro-organismes changeants dans les racines du riz. Nos résultats fournissent des preuves directes de l’importance et de la faisabilité de WGCNA dans l’évaluation des différences de communauté microbienne dans divers environnements.
Les auteurs n’ont rien à divulguer.
Le développement de ce manuscrit a été soutenu par des fonds de la Fondation nationale des sciences naturelles du projet de centre de recherche sur les sciences karstiques du gouvernement populaire de Chine-Guizhou (U1812401), du projet de recherche doctorale de l’Université normale du Guizhou (GZNUD [2017]1), du projet de soutien scientifique et technologique de la province du Guizhou (QKHZC [2021] YB459) et du projet scientifique et technologique du Guiyang ([2019]2-8).
Les auteurs tiennent à remercier Edwards J.A et al pour avoir fourni des données sur le microbiome du riz dans des bases de données publiques et le soutien de TopEdit (www.topeditsci.com) pour son assistance linguistique lors de la préparation de ce manuscrit.
Name | Company | Catalog Number | Comments |
R | The University of Auckland | version 4.0.2 | R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS. |
RStdio | JJ Allaire | version 1.4.1103 | The RStudio IDE is a set of integrated tools designed to help you be more productive with R and Python. |
Cytoscape | version 3.7.1 | Cytoscape is an open source software platform for visualizing complex networks and integrating these with any type of attribute data. | |
NCBI database | The National Center for Biotechnology Information advances science and health by providing access to biomedical and genomic information. |
Demande d’autorisation pour utiliser le texte ou les figures de cet article JoVE
Demande d’autorisationThis article has been published
Video Coming Soon