Method Article
* Questi autori hanno contribuito in egual misura
L'analisi della rete è stata applicata per valutare l'associazione di varie comunità microbiche ecologiche, come suolo, acqua e rizosfera. Qui è presentato un protocollo su come utilizzare l'algoritmo WGCNA per analizzare diverse reti di co-occorrenza che possono verificarsi nelle comunità microbiche a causa di diversi ambienti ecologici.
Il microbioma radicale svolge un ruolo importante nella crescita delle piante e nell'adattamento ambientale. L'analisi di rete è uno strumento importante per lo studio delle comunità, che possono esplorare efficacemente la relazione di interazione o il modello di co-occorrenza di diverse specie microbiche in ambienti diversi. Lo scopo di questo manoscritto è quello di fornire dettagli su come utilizzare l'algoritmo della rete di correlazione ponderata per analizzare diverse reti di co-occorrenza che possono verificarsi nelle comunità microbiche a causa di diversi ambienti ecologici. Tutte le analisi dell'esperimento vengono eseguite nel pacchetto WGCNA. WGCNA è un pacchetto R per l'analisi ponderata della rete di correlazione. I dati sperimentali utilizzati per dimostrare questi metodi erano dati della comunità microbica dal database NCBI (National Center for Biotechnology Information) per tre nicchie del sistema radicale del riso (Oryza sativa). Abbiamo usato l'algoritmo della rete di correlazione ponderata per costruire reti di co-abbondanza di comunità microbica in ciascuna delle tre nicchie. Quindi, sono state identificate reti di co-abbondanza differenziale tra endosfera, rizopiano e suolo rizosfera. Inoltre, i generi principali in rete sono stati ottenuti dal pacchetto "WGCNA", che svolge un importante ruolo regolato nelle funzioni di rete. Questi metodi consentono ai ricercatori di analizzare la risposta della rete microbica ai disturbi ambientali e verificare diverse teorie di risposta ecologica microbica. I risultati di questi metodi mostrano che le significative reti microbiche differenziali identificate nel suolo dell'endosfera, del rizopiano e della rizosfera del riso.
La ricerca sul microbioma ha importanti implicazioni per la comprensione e la manipolazione dei processiecosistemici 1,2. Le popolazioni microbiche sono interconnesse da reti ecologiche interagenti, le cui caratteristiche possono influenzare la risposta dei microrganismi ai cambiamenti ambientali3,4. Inoltre, le proprietà di queste reti influenzano la stabilità delle comunità microbiche e sono strettamente associate alla funzione delsuolo 5. L'analisi ponderata della rete di correlazione genica è stata ora ampiamente applicata per la ricerca sulla relazione tra geni e comunità microbiche6. Studi precedenti si sono concentrati principalmente sulle associazioni tra reti di geni o popolazioni diverse e il mondo esterno7. Tuttavia, le differenze nelle reti di correlazione formate da popolazioni microbiche in diverse condizioni ambientali sono state scarsamente studiate. Lo scopo della ricerca presentata in questo documento è quello di fornire approfondimenti e dettagli sulla rapida implementazione dell'algoritmo WGCNA per costruire una rete di co-occorrenza di campioni di microbioma raccolti in diverse condizioni ambientali. Sulla base dei risultati dell'analisi, abbiamo valutato la composizione e le differenze della popolazione e discusso ulteriormente la relazione tra le diverse popolazioni microbiche. È stato applicato il seguente flusso di base dell'algoritmo di rete di correlazione ponderata8. In primo luogo, era necessario costruire una matrice di somiglianza calcolando il coefficiente di correlazione di Pearson tra i profili di espressione OTU (Operational Taxonomic Units). Quindi, i parametri delle funzioni di adiacenza (le funzioni di adiacenza di potenza o sigmoide) sono stati adottati con un criterio di topologia senza scala, la matrice di somiglianza è stata trasformata in una matrice di adiacenza e ogni rete di co-occorrenza corrispondeva a una matrice di adiacenza. Abbiamo utilizzato il clustering gerarchico di collegamento medio abbinato alla dissomiglianza basata su TOM per raggruppare le OTA con profili di espressione coerenti in moduli. Inoltre, abbiamo calcolato la relazione tra le statistiche conservative e i relativi moduli di analisi dei parametri, identificando infine l'OTU dell'hub nel modulo. Questi metodi sono particolarmente adatti per l'analisi delle differenze nelle strutture di rete tra varie popolazioni microbiche in condizioni ambientali divergenti. In questo manoscritto, abbiamo descritto in dettaglio il metodo di sviluppo della rete di co-espressione, l'analisi delle differenze tra i moduli e abbiamo fornito una breve panoramica dei passaggi della procedura applicata per ottenere le specie principali in diverse reti di moduli.
1. Download dei dati
2. Determinazione ottimale del valore di potenza
NOTA: il pacchetto WGCNA contiene tutti i seguenti parametri funzionali. WGCNA è un pacchetto R per l'analisi ponderata della rete di correlazione. Le righe di comando chiave si riferiscono al Supplemento S1.
3. Costruzione di una rete di co-espressione e identificazione del modulo
NOTA: in base al valore di potenza calcolato sopra, viene costruita la rete di co-occorrenza. Le righe di comando chiave si riferiscono al Supplemento S2.
4. Confronto dei moduli
NOTA: Questo metodo può essere utilizzato per confrontare i moduli di rete di due comunità microbiche ecologiche. In questo articolo, confronta le differenze dei moduli di rete microbica tra endosfera e rizopiano, endosfera e rizosfera, rizosfera e rizopiano.
5. Analisi del modulo di rete differenziale microbica
I risultati rappresentativi in questo articolo sono stati scaricati dai dati del microbioma della radice di riso California Abaker del 2014 nel database NCBI (PRJNA386367)9. I dati includono i campioni di microbioma rizosfera, rizoplano ed endosfera da piante di riso coltivate per 14 settimane in un campo di riso sommerso. Abbiamo utilizzato l'algoritmo WGCNA per selezionare il valore di potenza che soddisfaceva le tre reti che erano vicine alla rete senza scala (Figura 1) e sviluppato tre reti di co-espressione (Figura 2). Nella rete di co-espressione microbica del suolo dell'endosfera, del rizopiano e della rizosfera, sono stati identificati rispettivamente 23, 22 e 21 moduli. Questi risultati indicano che il numero di reti di interazione microbica nelle tre nicchie era fondamentalmente uguale.
Abbiamo ulteriormente confrontato le differenze nei moduli della rete microbica all'interno dell'endosfera, del rizopiano e del suolo della rizosfera. Sono stati ottenuti i seguenti risultati dei test di conservazione dei moduli dei tre gruppi di nicchie. Tre moduli estremamente non conservati esistevano tra il suolo della rizosfera e il rizopiano (Figura 3a, Tabella 1). Inoltre, nove moduli estremamente non conservati erano presenti tra il suolo e l'endosfera della rizosfera (Figura 3b, Tabella 2) e sei moduli estremamente non conservati tra il rizopiano e l'endosfera (Figura 3c, Tabella 3). Inoltre, sono stati trovati moduli estremamente non conservati tra le tre nicchie, indicando la presenza di grandi differenze nella composizione dei microrganismi tra le tre nicchie. I risultati dell'analisi di correlazione dell'appartenenza al modulo dei moduli non conservativi ottenuti sono illustrati nella Figura 4. Dalla figura, un modulo significativamente diverso con la minima correlazione tra ciascuna delle due nicchie è visibile tra le tre nicchie, che rappresenta la differenza più significativa tra loro.
Nella rete di differenza rizosfera-rizopiano (Figura 5a), il phylum dominante era Proteobacteria (72,97%). Nella rete di differenza rizosfera-endosfera (Figura 5b), i phyla dominanti erano Proteobacteria (66,36%), Actinobacteria (10,1%) e Bacteroidetes (10,9%). Nella rete di differenza rizoplano-endosfera (Figura 5c), i phyla dominanti erano Proteobacteria (41,41%), Bacteroidetes (10,10%), Firmicutes (12,12%) e Verrucomicrobia.
Tre generi principali (Figura 5a), tra cui Rhodobacter e Novosphingobium, sei generi principali (Figura 5b), tra cui Blvii28 e Dechloromonas, e cinque generi principali (Figura 5c), tra cui Cellvibrio e Geobacter, hanno esercitato importanti funzioni regolatorie nelle tre reti di co-occorrenza differenziale. Tutti i generi principali, ad eccezione di Dechloromonas,hanno avuto influenza su una sola rete, indicando la disponibilità di notevoli differenze nell'abbondanza relativa di popolazioni microbiche e specie tra le tre nicchie di radici di riso, che hanno influenzato in modo critico l'abbondanza e la diversità delle comunità microbiche di radice esistenti.
Il genere principale Azospirillum,presente nella rete di differenza rizosfera-endosfera del riso, ha partecipato alla fissazione dell'azoto e ha promosso la crescita delle piante10. Inoltre, il genere Geobacter, che è stato significativamente arricchito nella rete di differenza rizoplano-endosfera, può essere il principale fattore che induce la riduzione degli ossidi di Fe e Mn insolubili in molti terreni e sedimenti11. Questi microrganismi interagiscono con una serie di comunità microbiche nelle nicchie delle radici e partecipano attivamente alla regolazione delle reti microbiche, che potrebbero essere di fondamentale importanza per la crescita e lo sviluppo delle radici di riso.
Figura 1. Valutazione di powerβ nei set di dati. a) valutazione dei β di potenza nell'set di dati ES; b) Valutazione dei β di potenza nel set di dati RS; (c) Valutazione della potenza β nel set di dati RP, distribuzione dell'indice privo di scala R2 (a sinistra), distribuzione della connettività media (a destra) lungo diversi indici di soft power. Il valore della migliore potenza è stato raggiunto quando R2 tendeva alla saturazione e non era inferiore a 0,8. Le tre reti di co-espressione dovevano essere impostate sullo stesso valore di potenza per garantirne la comparabilità. (RS: suolo rizosfera, RP: rizopiano ed ES: endosfera). Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 2. Dendrogramma OTU ottenuto mediante clustering gerarchico di collegamento medio. a)dendrogramma OTU dalla rete ES; b) dendrogramma OTU dalla rete RS; c) Dendrogramma OTU dalla rete RP. La riga di colore sotto il dendrogramma indica l'assegnazione del modulo determinata dall'algoritmo Dynamic Tree Cut. (RS: suolo rizosfera, RP: rizopiano ed ES: endosfera) Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 3. Risultati del test di conservazione. a) i risultati dell'analisi si basano sull'allocazione del modulo di rete di coespressione RS come gruppo di riferimento e sui risultati dell'allocazione del modulo di rete di coespressione RP come gruppo di prova; b) i risultati dell'analisi si basano sull'assegnazione del modulo di rete di coespressione ES come gruppo di riferimento e sui risultati dell'allocazione del modulo di rete di coespressione RS come gruppo di prova; c) I risultati dell'analisi si basano sull'allocazione del modulo di rete di coespressione ES come gruppo di riferimento e sui risultati dell'allocazione del modulo di rete di coespressione RP come gruppo di prova. Z_summary > 10 indica che due moduli sono altamente conservati, mentre Z_summary < 2 indica moduli non conservati. medianRank esprime la conservazione relativa del modulo valutato per classifica. Valori medianRank più elevati indicano moduli non conservati. (RS: suolo rizosfera, RP: rizopiano ed ES: endosfera) Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 4. Analisi di correlazione delle appartenenze al modulo. a) correlazione del modulo del valore kME tra la rete RS e RP; b) correlazione del modulo del valore kME tra la rete RS e RP; (c) Correlazione del modulo del valore kME tra la rete RP ed ES (RS: suolo rizosfera, RP: rizopiano, ES: endosfera e KME: appartenenza al modulo). Fare clic qui per visualizzare una versione più grande di questa figura.
Figura 5. Rete di co-occorrenza di popolazione microbica differenziale nella radice del riso. a)rete di co-occorrenza di popolazioni microbiche differenziali in RS-RP; b) rete di co-occorrenza di popolazioni microbiche differenziali in ES-RS; c) Rete di co-occorrenza di popolazioni microbiche differenziali in ES-RP. L'analisi è stata eseguita utilizzando il software Cytoscape. Colori diversi rappresentano porte diverse nella figura. (RS: Suolo della rizosfera, RP: rizopiano ed ES: endosfera). Fare clic qui per visualizzare una versione più grande di questa figura.
modulo | medianRank | Zsummary · | modulo | medianRank | Zsummary · |
greenyellow | 2 | 14 | giallo | 13 | 5.2 |
rosa | 2 | 17 | grigio60 | 14 | 3.1 |
midnightblue | 3 | 10 | royalblue | 15 | 2.1 |
marrone | 4 | 18 | nero | 16 | 2.7 |
lightcyan | 6 | 8.5 | abbronzatura | 17 | 3.2 |
porpora | 7 | 10 | salmone | 18 | 1.3 |
blu | 7 | 22 | magenta | 18 | 2.2 |
verde | 8 | 12 | darkred | 20 | -0.24 |
ciano | 10 | 4.8 | oro | 20 | 14 |
verde chiaro | 11 | 5.1 | verde scuro | 22 | -1.1 |
lightyellow | 12 | 5.3 | grigio | 22 | 0.21 |
rosso | 12 | 6.1 |
Tabella 1. Risultato di Zsummary e medianRank tra il suolo della rizosfera e il rizopiano.
modulo | medianRank | Zsummary · | modulo | medianRank | Zsummary · |
salmone | 1 | 19 | lightcyan | 13 | 1.1 |
nero | 3 | 5.3 | rosso | 15 | 0.95 |
giallo | 4 | 5.8 | midnightblue | 15 | -0.0016 |
verde chiaro | 5 | 0.27 | royalblue | 16 | 0.83 |
greenyellow | 7 | 3 | magenta | 16 | 0.52 |
darkturquoise | 7 | 1.2 | verde scuro | 17 | 0.16 |
grigio60 | 9 | 1.1 | abbronzatura | 18 | 0.64 |
blu | 10 | 3.9 | lightyellow | 19 | 0.52 |
porpora | 10 | 2.3 | darkred | 19 | -0.18 |
marrone | 12 | 2.3 | rosa | 19 | -0.71 |
ciano | 12 | 0.78 | oro | 21 | 11 |
verde | 13 | 1.7 |
Tabella 2. Risultato di Zsummary e medianRank tra il suolo della rizosfera e l'endosfera.
modulo | medianRank | Zsummary · | modulo | medianRank | Zsummary · |
nero | 1 | 15 | darkturquoise | 13 | 1.7 |
salmone | 2 | 27 | midnightblue | 13 | 1.6 |
giallo | 3 | 13 | verde chiaro | 13 | 0.64 |
ciano | 4 | 5.4 | verde scuro | 14 | 1.5 |
blu | 8 | 3.9 | darkred | 16 | 1.5 |
lightcyan | 9 | 2.6 | porpora | 17 | 2.3 |
rosa | 10 | 3.6 | greenyellow | 18 | 0.8 |
royalblue | 10 | 1.5 | lightyellow | 18 | 0.42 |
marrone | 12 | 2.9 | magenta | 19 | 0.2 |
verde | 12 | 1.9 | oro | 21 | 18 |
rosso | 12 | 1.9 | grigio60 | 21 | -0.21 |
abbronzatura | 13 | 2.5 |
Tabella 3. Risultato di Zsummary e medianRank tra il rizopiano e l'endosfera.
Supplemento S1: Fare clic qui per scaricare questo file.
Supplemento S2: Fare clic qui per scaricare questo file.
Supplemento S3: Fare clic qui per scaricare questo file.
Supplemento S4: Fare clic qui per scaricare questo file.
Le reti di correlazione sono state sempre più utilizzate nelle applicazioni bioinformatiche. WGCNA è un metodo di biologia dei sistemi per l'analisi descrittiva delle relazioni tra vari elementi di un sistema biologico12. Il pacchetto software R è stato utilizzato in lavori precedenti su WGCNA13,14,15. Il pacchetto include funzioni per la costruzione di reti, il rilevamento di moduli, calcoli di proprietà topologiche, simulazione dei dati, visualizzazione e capacità di interfacciamento con software esterno. WGCNA è stato ampiamente impiegato per analizzare i dati di espressione genica dal cancro al cervello16,ciclo cellulare del lievito17,genetica del topo18,19,tessuto cerebrale dei primati20,21,diabete22e piante23. Utilizzare l'analisi ponderata della rete di correlazione genica per costruire la rete deve includere almeno 8 campioni. In questo articolo, ci siamo concentrati sulle reti di co-espressione genica che descrivono le interazioni tra popolazioni microbiche in ambienti diversi. Abbiamo ottenuto reti differenziali tra popolazioni microbiche in ambienti divergenti e identificato le specie chiave in ciascuna rete. L'idea che le specie chiave siano importanti per la comunità è stata ampiamente utilizzata nella ricerca sul food-web24. Alcune delle specie in una comunità microbica complessa possono essere essenziali per mantenere la stabilità e la funzionalità della comunità, come Bacteroides nella flora intestinale25. L'analisi delle comunità microbiche può essere sostanzialmente semplificata prendendo di mira specie specifiche di potenziale importanza.
I nostri risultati rappresentativi evidenziano le differenze nelle comunità microbiche, che possono essere identificate utilizzando il metodo sopra descritto. Qui, i microrganismi in diverse nicchie del sistema delle radici di riso sono stati sottoposti a WGCNA. Il differenziale tra le tre nicchie è stato identificato utilizzando analisi conservative e di appartenenza al modulo. Abbiamo determinato le specie chiave nei moduli di differenza e ottenuto informazioni sulle differenze nella composizione delle comunità microbiche nelle tre nicchie. Nel frattempo, la rete di co-occorrenza ha rivelato la presenza di un'interazione significativa tra i microrganismi che cambiano nelle radici del riso. I nostri risultati forniscono prove dirette del significato e della fattibilità del WGCNA nella valutazione delle differenze della comunità microbica in vari ambienti.
Gli autori non hanno nulla da rivelare.
Lo sviluppo di questo manoscritto è stato supportato da fondi della National Natural Science Foundation of China-Guizhou Provincial People's Government Karst Science Research Center Project (U1812401), del Doctoral Research Project della Guizhou Normal University (GZNUD[2017]1), del Science and Technology Support Project della provincia di Guizhou (QKHZC[2021]YB459) e del Science and Technology Project of the Guiyang([2019]2-8).
Gli autori desiderano ringraziare Edwards J.A et al per aver fornito dati sul microbioma del riso in database pubblici e il supporto di TopEdit (www.topeditsci.com) per la sua assistenza linguistica durante la preparazione di questo manoscritto.
Name | Company | Catalog Number | Comments |
R | The University of Auckland | version 4.0.2 | R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS. |
RStdio | JJ Allaire | version 1.4.1103 | The RStudio IDE is a set of integrated tools designed to help you be more productive with R and Python. |
Cytoscape | version 3.7.1 | Cytoscape is an open source software platform for visualizing complex networks and integrating these with any type of attribute data. | |
NCBI database | The National Center for Biotechnology Information advances science and health by providing access to biomedical and genomic information. |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon