Method Article
L'obiettivo del presente protocollo è quello di sviluppare un riferimento per le proteine divergenti in un gruppo che non dispone di criteri coerenti per la nomenclatura e classificazione. Questo riferimento faciliterà l'analisi e la discussione del gruppo nel suo complesso e può essere utilizzato in aggiunta nomi affermati.
Proteine correlate che sono state studiate in diversi laboratori utilizzando diversi organismi potrebbero non avere un sistema uniforme di nomenclatura e classificazione, rendendo difficile per discutere il gruppo nel suo complesso e di inserire nuove sequenze nel contesto appropriato. Lo sviluppo di un riferimento che la funzionalità importante sequenza di priorità relative alla struttura e/o attività può essere utilizzata oltre a nomi affermati per aggiungere qualche coerenza a un gruppo eterogeneo di proteine. Questa carta utilizza la superfamiglia di cisteina-stabilizzato alfa-elica (CS-αβ) come un esempio per mostrare come un riferimento generato nel software di foglio di calcolo può chiarire le relazioni tra proteine esistenti nella superfamiglia, nonché facilitare l'aggiunta di nuovi sequenze. Viene inoltre illustrato come il riferimento può contribuire a perfezionare gli allineamenti di sequenza generati in software comunemente usato, che compromette la validità delle analisi filogenetiche. L'utilizzo di un riferimento sarà probabilmente più utile per i gruppi di proteine che includono sequenze altamente divergenti da un ampio spettro di taxa, con caratteristiche che non vengono adeguatamente acquisite dalle analisi molecolari.
Nome di una proteina dovrebbe riflettere è caratteristiche e rapporto ad altre proteine. Purtroppo, i nomi vengono generalmente assegnati al momento della scoperta e, mentre la ricerca continua, la comprensione del contesto più ampio potrebbe cambiare. Questo può portare a più nomi se una proteina è stata identificata in modo indipendente da più di un laboratorio, ai cambiamenti nella nomenclatura o nelle caratteristiche pensate per essere definitiva quando si assegna il nome e il nome non è più sufficientemente differenziando la proteina dagli altri.
Invertebrati marini defensine forniscono un buon esempio di degenerazione nella nomenclatura e classificazione. Le defensine invertebrate prime sono state segnalate dagli insetti, e il nome "insetto defensine" è stato proposto basato sull'omologia percepita a mammiferi defensine1,2. Il termine defensine è ancora usata, anche se è ormai chiaro che defensine invertebrate e mammiferi non condividono un antenato comune3,4. A seconda della specie, un invertebrato "defensine" può avere sei o otto cisteine (che formano tre o quattro ponti disolfuro) e una varietà di attività antimicrobica. A complicare la situazione, proteine con le stesse caratteristiche come defensine non vengono sempre chiamate "defensine," come la cremycins recentemente identificato da Caenorhabditis remanei5. Inoltre, defensine grande invertebrati marini sono più probabili essere evolutivamente correlato a vertebrati β-defensine rispetto a altri invertebrati defensine6. Nonostante questo, i ricercatori si affidano a volte il nome "defensine" quando si determina quali sequenze devono essere inclusi nelle analisi.
Gli studi strutturali hanno rivelato la somiglianza tra insetto defensine e Scorpione tossine7, e la piega di CS-αβ successivamente è stata stabilita come la caratteristica strutturale di defensine insetto8. Questo ovile definisce la superfamiglia di scorpione tossina-come (CS-αβ) nella classificazione strutturale delle proteine (SCOP) database9, che attualmente include cinque famiglie: insetto defensine, catena corta Scorpione tossine, tossine dello Scorpione lungo-catena, MGD-1 (da un mollusco) e pianta defensine. Questa superfamiglia è sinonima di cis-defensine recentemente descritto4 e superfamiglia 3.30.30.10 in CATH/Gene database 3D10,11. Studi da una varietà di taxa di invertebrati, piante e funghi show che i nomi delle proteine che contengono questa piega non sono chiaramente correlati al numero di cisteina o modello di incollaggio, attività antimicrobica o storia evolutiva12.
La mancanza di coerenza e criteri chiari rendono impegnativo per denominare e classificare le sequenze più recentemente identificati di questa superfamiglia. Un ostacolo importante al confronto di proteine in questa superfamiglia è che cisteine sono numerate rispetto ogni sequenza individuale (il prima cisteina in ogni sequenza è C1), con nessun modo per rappresentare il ruolo strutturale. Ciò significa che possono essere paragonate solo sequenze con lo stesso numero di cisteine. C'è poco sequenza conservazione tranne le cisteine che formano la piega di CS-αβ, che rende difficile allineamenti e analisi filogenetiche. Attraverso lo sviluppo di un sistema di numerazione che dà priorità caratteristiche strutturali, sequenze di superfamiglia possono essere più facilmente rispetto e allineati. Caratteristiche conservate, così come quelle che definiscono i sottogruppi, possono essere fruiti rapidamente, e nuove sequenze possono essere più facilmente collocati nel contesto appropriato.
Questo documento utilizza un software di foglio di calcolo (ad esempio, Excel) per generare un sistema per la superfamiglia CS-αβ di numerazione di riferimento. Essa mostra come questo chiarisce i confronti tra le sequenze e le applica nuove sequenze di CS-αβ identificati dai tardigradi. Utilizzando la superfamiglia CS-αβ come esempio, il protocollo è stato scritto per fornire una guida quando si utilizza sequenze di interesse; Tuttavia, non è inteso per essere specifici di questa superfamiglia o sequenze ricche di cisteina. Questo metodo sarà probabilmente più utile per i gruppi di proteine che sono state studiate in modo indipendente in taxa divergenti e/o hanno poca omologia di sequenza complessiva, con discrete caratteristiche che non possono essere facilmente riconosciuti dal software di analisi molecolare. Questo metodo richiede alcune decisioni a priori per quanto riguarda caratteristiche importanti, quindi sarà di limitata utilità se non importanti caratteristiche sono state identificate. L'obiettivo primario è quello di mostrare come una semplice visualizzazione delle relazioni di sequenza può essere raggiunto. Questo quindi può essere utilizzato per informare l'allineamento di sequenza e l'analisi, ma se l'allineamento e l'analisi sono gli obiettivi primari, un metodo di codice a barre sarebbe una valida alternativa che ha più capacità per automazione13. Il metodo corrente Visualizza le funzioni di ciascun peptide in una forma lineare, quindi non sarà disponibile per la visualizzazione diretta della struttura 3D.
1. determinare le caratteristiche di definizione del gruppo di proteine di interesse
2. Raccogliere rilevanti sequenze
3. Generare un riferimento in un foglio di calcolo basato sulle importanti caratteristiche che sono state identificate
4. Utilizzare il riferimento per perfezionare gli allineamenti dell'amminoacido
Nota: ci sono molti programmi che possono essere utilizzati per allineamenti multipli di sequenza, ma questa dimostrazione verrà utilizzata l'analisi di genetica evolutiva molecolare (MEGA6) 19 perché è disponibile per il download gratuito.
5. Confrontare i gruppi identificati utilizzando il riferimento con risultati da analisi filogenetiche
Gruppi di sequenze nella superfamiglia delle CS-αβ segnalato nella letteratura sono mostrati in Figura 4. Gli abbinamenti di cisteina basati sulla numerazione per ogni sequenza suggeriscono cinque gruppi di base (tabella 1, colonna centrale). Il gruppo 1 ha sei cisteine che da bisolfuro di tre legami e include sequenze da insetti, aracnidi, molluschi, nematodi e funghi. Gruppi 2, 3 e 4 hanno 8 cisteine che formano quattro ponti disolfuro. Gruppo 2 comprende insetti, aracnidi e sequenze di impianto; gruppo 3 comprende aracnidi, molluschi e sequenze di nematodi; e gruppo 4 include sequenze da cnidari, anellidi, molluschi e funghi. Gruppo 5 include il 10 macins di cisteina. Alcune sequenze non ha fatto abbastanza bene questi modelli ma erano generalmente più vicini ad un gruppo rispetto agli altri.
Gruppi 1 e 2 sembrano condividere due legami: C2-C5 e C3-C6; Tuttavia, cominciando la numerazione di ogni sequenza con la sua prima cisteina non riconosce il contesto strutturale delle obbligazioni. C2-C5 nel gruppo 1 sequenze di forme uno dei due obbligazioni nel motivo di CSH, mentre C2-C5 nel gruppo 2 sequenze forma il legame finale necessario per stabilizzare la piega di CS-αβ. Il legame di omologo per il gruppo 1 C2-C5 è Group2 C3-C6, che non è evidente dalla numerazione. Inoltre non è ovvio che nel gruppo 3, il legame C2-C6 svolge lo stesso ruolo strutturale.
Utilizzo di sequenze dalla letteratura generato un riferimento con un totale di dieci cisteine. Il motivo CSH è formato da obbligazioni C3-C8 e C4-C9, con C2-C6 completando la piega di CS-αβ. Le coppie di cisteina in base ai numeri di riferimento di rinumerazione chiarisce i legami presenti in ogni sequenza (tabella 1, colonna di destra). Ora è ovvio che tutte le sequenze hanno C2-C6, C3-C8 e C4-C9, riflettendo la piega strutturale che definisce la superfamiglia. L'utilizzo di un riferimento consente per un facile confronto tra sequenze che hanno la nomenclatura incoerente e criteri di classificazione ambigua. Può anche aiutare a identificare le caratteristiche che definiscono un sottogruppo delle sequenze. Ad esempio, il legame di C1-C7 può differenziare macins da altri membri della superfamiglia, rende opportuno classificare le sequenze con questo legame come "macins" piuttosto che "defensine" (tabella 1 e Figura 4).
Ricerche nelle banche dati online pubblici ha rivelato sedici sequenze dai tardigradi che hanno chiaramente il CS-αβ piegare, otto da Hypsibius dujardini e Milnesium tardigradum. Quattro delle nuove sequenze hanno sei cisteine, nove hanno otto, uno ha nove e due hanno dieci. Questo dà informazioni molto poco, ma allineando le sequenze al riferimento, diventa chiaro che tardigrade sequenze con lo stesso numero di cisteine non abbia sempre le cisteine strutturalmente importante allo stesso posto all'interno della sequenza ( Figura 5 e Figura 6). L'allineamento con il riferimento consente inoltre per l'inferenza delle dinamiche (tabella 2, dedotto dinamiche di vincolo indicati tra parentesi). Alcune delle sequenze tardigrade rientrano chiaramente modelli 1-4. Altri sono più simili all'antenato batterica proposto, Scorpione Cl-tossina o una famiglia di peptidi di simil-defensina fungine. Modello 2 può avere due sottogruppi, uno rappresentato da Scorpione Na + tossine, drosomycin e pianta defensine e l'altra da Scorpione Cl-tossine. Ulteriore lavoro indagando la funzione delle proteine tardigrade è necessario per determinare se alcuni devono essere considerate le tossine, piuttosto che defensine.
Le analisi filogenetiche sono spesso utilizzate per studiare come potrebbe essersi evoluto un gruppo di proteine. Le sequenze della superfamiglia CS-αβ sono generalmente brevi e altamente divergenti; alberi risultanti sono spesso mal risolti e offrono poca comprensione. Alberi ML sia bayesiani per il sottoinsieme delle sequenze analizzate qui erano mal risolti, con scarso sostegno per molti cladi (Figura 10, complementare file 1 - 4). È pratica comune per mostrare solo bootstrap livelli oltre 70 (o probabilità a posteriori sopra 0,7), ma nella figura 10 conserva tutti i numeri per dimostrare il generale bassi livelli di sostegno. Cinque gruppi sono stati sostenuti sopra 70/0,7 in almeno uno dei due alberi: (a) un 6C e una tossina dello Scorpione di 8C; (b) macins; (c) tick e defensine Scorpione; (d) pianta defensine; e (e) 6C defensine da insetti, aracnidi e molluschi. Nella struttura della ML, clade e include anche una tossina di 8C e un 8C tardigrade defensine, ma il supporto era molto basso (Figura 10A). In generale, questi riflettono le categorie individuate utilizzando la numerazione di riferimento cisteina, ma mostrano anche che le sequenze con numeri di cisteina differenti all'interno di un grande gruppo tassonomico possono essere più strettamente collegati che sequenze con lo stesso modello da diversi gruppi. Mentre solo un piccolo numero di sequenze sono stato utilizzato in questo studio, è possibile che un'analisi più grande di 250 sequenze non ha eliminato la mancanza di risoluzione (complementare Files 5 - 8)12. L'allineamento di riferimento del foglio di calcolo può offrire più facile visualizzazione delle somiglianze con rilevanza strutturale o funzionale rispetto agli alberi filogenetici.
Figura 1: Definizione di sequenza e caratteristiche strutturali della superfamiglia CS-αβ. Struttura 3D e gli amminoacidi sono codificati a colori: loop (blu), alfa-elica (verde), beta-fogli (oro) e legami disolfuro (rosa). Clicca qui per visualizzare una versione più grande di questa figura.
Figura 2: Sei-cisteina pregiudiziale basato sulla sequenza di insetto defensine. Colonne indicano le conservato cisteine (C1-C6) e, per il motivo CSH, il numero di conserva ammino acidi tra le cisteine. Le caselle piene indicano che la sequenza ha determinato la cisteina e i numeri indicano gli amminoacidi tra le cisteine. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 4 : Riepilogo delle CS-αβ superfamiglia sequenze allineate con riferimento di gruppo caratteristiche. Le colonne indicano conservati cisteine e gli aminoacidi tra di loro. Cisteine che contribuiscono per il motivo CSH (C3, C4, C8 e C9) e per la piega di CS-αβ (C2 e C6) sono etichettati. Sequenze sono color-coded di gruppo tassonomico: anellidi (rosso scuro), Arachnida (luce arancione), batteri (nero), cnidari (grigio), funghi (verde chiaro), Hexapoda (arancione), molluschi (blu), Nematoda (viola) e Plantae (verde). Numeri separati da un trattino indicano un intervallo di aminoacidi intermedi; numeri separati da una barra rappresentano o / o. Una "C" indica una cisteina aggiuntiva che non si verifica con sufficiente frequenza da giustificare aggiunta al riferimento. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 5 : Aggiunta di sequenze di Tardigrade CS-αβ per allineamento superfamiglia con riferimento di gruppo caratteristiche. Le colonne indicano conservati cisteine e gli aminoacidi tra di loro. Cisteine che contribuiscono per il motivo CSH (C3, C4, C8 e C9) e per la piega di CS-αβ (C2 e C6) sono etichettati. Sequenze sono color-coded di gruppo tassonomico: anellidi (rosso scuro), Arachnida (luce arancione), batteri (nero), cnidari (grigio), funghi (verde chiaro), Hexapoda (arancione), molluschi (blu), Nematoda (viola), Plantae (verde) e Tardigrada (giallo). Numeri separati da un trattino indicano un intervallo di aminoacidi intermedi; numeri separati da una barra rappresentano o / o. Una "C" indica una cisteina aggiuntiva che non si verifica con sufficiente frequenza da giustificare aggiunta al riferimento. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 6: Aggiunta di sequenze di Tardigrade CS-αβ per allineamento superfamiglia con riferimento di gruppo tassonomico. Le colonne indicano conservati cisteine e gli aminoacidi tra di loro. Cisteine che contribuiscono per il motivo CSH (C3, C4, C8 e C9) e per la piega di CS-αβ (C2 e C6) sono etichettati. Sequenze sono color-coded di gruppo tassonomico: anellidi (rosso scuro), Arachnida (luce arancione), batteri (nero), cnidari (grigio), funghi (verde chiaro), Hexapoda (arancione), molluschi (blu), Nematoda (viola), Plantae (verde) e Tardigrada (giallo). Numeri separati da un trattino indicano un intervallo di aminoacidi intermedi; numeri separati da una barra rappresentano o / o. Una "C" indica una cisteina aggiuntiva che non si verifica con sufficiente frequenza da giustificare aggiunta al riferimento. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 7: Sequenza disallineato con automatizzati allineamento. Conservato in tutte le sequenze di aminoacidi sono indicati da * nella riga sopra la prima sequenza (evidenziata in scatole rosa). AlCRP non è allineato. Il divario deve essere rimosso per allineare correttamente la C (freccia rosa). Clicca qui per visualizzare una versione più grande di questa figura.
Figura 8: Manuale raffinatezza dell'allineamento conserva le caratteristiche strutturalmente importante delle sequenze. AlCRP è ora allineato correttamente (freccia rosa), ed il motivo CXXXC è completamente conservato per le sequenze (scatole rosa). Clicca qui per visualizzare una versione più grande di questa figura.
Figura 9 : Sequenze ridondanti in un allineamento. Se ci sono coppie di sequenze quasi identiche (scatole rosa), uno può essere rimosso, dal momento che questi saranno probabilmente sempre raggruppano e contribuiscono poco alla topologia complessiva dell'albero. Clicca qui per visualizzare una versione più grande di questa figura.
Figura 10 : Confronto degli alberi generati da analisi filogenetiche. Massimo (A) analisi della probabilità in MEGA, con 1.000 bootstrap replica utilizzando il WAG + G + modello. (B) l'analisi bayesiana con 1.000.000 generazioni utilizzando l'impostazione del modello misto. Cladi supportati alle 70/0,7 sono mostrati in linee continue di rosa; linee tratteggiate rosa Visualizza cladi supportati alle 70/0,7 all'altro albero. (a) un 6C e una tossina dello Scorpione di 8C; (b) macins; (c) tick e defensine Scorpione; (d) pianta defensine; e (e) 6C defensine da insetti, aracnidi e molluschi. Clicca qui per visualizzare una versione più grande di questa figura.
Tabella 1: gruppi all'interno della superfamiglia CS-αβ basano su modelli di cisteina-pairing. Cinque modelli di base della formazione del legame sono mostrati usando i numeri interni (colonna centrale) o numeri di riferimento (colonna destra). Scorpion Cl - tossine, ASABF 6Cys-alfa e un gruppo di peptidi fungine vengono inseriti con il pattern che mOST si avvicina. Una cisteina non inclusa nella Guida di riferimento è indicata da un apice delle cisteine prima/dopo il (ad es., C3/4 è compreso tra C3 e C4).
Tabella 2: aggiunta di Tardigrade CS-αβ sequenze a cisteina-associazione gruppi Pattern. Tardigrade defensine e macins (grassetto) sono messi nei gruppi precedentemente stabiliti, ove possibile. Alcune sequenze di tardigrade possono mostrare un modello di gruppo-specifici. Una cisteina non inclusa nella Guida di riferimento è indicata da un apice delle cisteine prima/dopo il (ad es., C3/4 è compreso tra C3 e C4). La notazione "2C1" indica che ci sono due cisteine a Monte di riferimento C1.
Complementare File 1 (S1): allineamento di questo Dataset in MEGA. Per favore clicca qui per scaricare questo file.
File supplementari 2 (S2): albero di massima verosimiglianza MEGA File per questo Dataset. Per favore clicca qui per scaricare questo file.
File supplementari 3 (S3): allineamento di questo set di dati in formato di Nexus per MrBayes. Per favore clicca qui per scaricare questo file.
File supplementari 4 (S4): File di consenso dall'analisi di questo Dataset MrBayes. Per favore clicca qui per scaricare questo file.
File supplementari 5 (S5): allineamento di 250 CS-αβ sequenze in MEGA. Per favore clicca qui per scaricare questo file.
Complementare File 6 (S6): albero di probabilità massima di 250 CS-αβ sequenze. Per favore clicca qui per scaricare questo file.
File supplementari 7 (S7): allineamento di 250 CS-αβ sequenze in Nexus formato per MrBayes. Per favore clicca qui per scaricare questo file.
File supplementari 8 (S8): File di consenso dall'analisi MrBayes di 250 CS-αβ sequenze. Per favore clicca qui per scaricare questo file.
I criteri per la denominazione di una proteina all'interno di un gruppo dovrebbero essere chiari, ma questo non è sempre il caso. Sequenze che hanno il CS-αβ piegare sono state studiate in molti laboratori utilizzando una varietà di organismi, risultante in diversi sistemi di nomenclatura, nonché a diversi livelli di caratterizzazione. Tentando di imporre una completamente nuova nomenclatura non è ragionevole e si tradurrebbe in una grande quantità di confusione durante la consultazione letteratura precedente. Un sistema di numerazione di riferimento può essere utilizzato oltre al nome di una proteina per chiarire le sue caratteristiche rispetto alla superfamiglia.
Gruppi di proteine con criteri chiari per denominazione e classificazione sarà probabilmente non beneficiano generando un riferimento in un foglio di calcolo, anche se può essere utile per riepilogare grandi quantità di sequenze e visualizzazione di caratteristiche importanti. Loghi e allineamenti di sequenza sono utili per indagare il livello di conservazione in ogni sito, ma non attivamente la priorità importanti per struttura o funzione di caratteristiche di sequenza. L'esempio di CS-αβ focalizzata sulla struttura, ma gli aminoacidi specifici che costituiscono un sito di legame potrebbe essere anche incorporati come una caratteristica di definizione. Quando vengono identificate le caratteristiche di sequenza che conferiscono specifici antimicrobici/tossico attività dei peptidi CS-αβ, questi potrebbe aggiungersi al riferimento per chiarire gruppi basati su attività. Anche se solo i predetti maturi peptidi sono stati utilizzati in questo esempio, se è importante la presenza di un peptide segnale o Pro-peptide, che informazioni possono essere aggiunte per ogni sequenza. Inserimento specifico o eventi eliminazione, nonché posizioni introne, anche possibile includere se sono pensati per essere informativo. Un vantaggio dell'utilizzo di MrBayes per l'analisi filogenetica è che non è limitato ai dati molecolare-it può analizzare dati codifica per altre caratteristiche che possono avere importanza evolutiva. Questi possono essere codificati come presente o assente, fornendo maggiori informazioni rispetto alla sequenza da solo.
Raccogliendo le sequenze rilevanti è un passaggio fondamentale del protocollo. A seconda l'ambito dello studio e la distribuzione dei membri del gruppo, questo può estendersi su vasti gruppi tassonomici. Se l'obiettivo è quello di comprendere un intero gruppo di proteine, considerare che alcune sequenze possono essere trovate di fuori della specie che di solito vengono segnalati da. Se un taxon è già ben rappresentato e sequenze aggiuntive sono improbabile o ridondanti, escludendoli dalla ricerca potrebbe essere appropriato. Una regola base del pollice per il recupero di colpi in una ricerca BLAST consiste nell'utilizzare un taglio di -05 per il valore di e. Il valore di e è il numero di colpi previsto per caso. Mentre questo è adatto per alcune situazioni, se c'è un gruppo di sequenze che è altamente divergente ma azioni specifiche caratteristiche, può essere meno affidabile-it può recuperare sequenze che sono simili ma non fare hanno caratteristiche specifiche voluto, e non può restituire le sequenze che hanno le caratteristiche chiave, ma che sono altamente divergenti. Ci sono alcuni potenziali modi di affrontare questo problema. Il primo è quello di guardare le sequenze identificate nella ricerca del cut-off-05 per vedere se essi soddisfano i criteri di inclusione. In secondo luogo, se ci sono sufficienti informazioni, utilizzare Position-Specific iterato BLAST (PSI-BLAST)22 o Pattern-Hit avviato BLAST (PHI-BLAST)23. PSI-BLAST utilizza i risultati di una ricerca iniziale per generare un nuovo modello per il prossimo turno e possono a volte trovare sequenze divergenti che non ha identificato la ricerca iniziale. PHI-BLAST richiede un modello deve essere presentata insieme con la sequenza di query. Questo limita le sequenze di estratto contenente il modello di interesse. Questo strumento è particolarmente utile se un motivo unico al gruppo possa essere chiaramente identificato.
Un allineamento accurato è fondamentale per l'analisi filogenetica; interpretazioni degli alberi sono validi solo se sono generati utilizzando buon allineamento. Utilizzando il riferimento di informare l'allineamento può contribuire ad per evitare gli errori che sono evidenti solo quando la struttura o l'attività sono considerati. Ridondanza di sequenza dovrà essere definito per il progetto. Due sequenze che sembrano ridondanti non possono essere per scopi filogenetici se sono da taxa ampiamente divergenti o sono quasi identici in sequenza, ma hanno differenti proprietà strutturali o funzionali. Se c'è ambiguità per quanto riguarda cui sequenze devono essere incluse, allineamenti multipli possono essere generati e analizzati separatamente per vedere come allineamento cambia inferenze filogenetiche di impatto. Il metodo presentato qui non elimina la necessità per la regolazione manuale degli allineamenti, ma può aiutare a chiarire come le sequenze devono essere allineati e potrebbero essere utilizzate in combinazione con una tecnica più sofisticata di codici a barre che è stato descritto in precedenza13.
Per il riferimento di essere utili, è importante identificare caratteristiche distintive che non sono attualmente evidenti dalla sequenza da solo. Si consideri ad esempio l'impossibilità di confrontare cisteina incollaggio modelli tra sequenze con diversi numeri di cisteine quando ogni sequenza è numerata rispetto a sé. L'obiettivo è quello di facilitare il confronto e la discussione, non per aggiungere un ulteriore livello di confusione. Questo può comportare diverse iterazioni del riferimento e sentenza chiama nel decidere quali caratteristiche includere. Si spera che l'adozione di un metodo comune di sequenze divergenti in un gruppo di discussione aumenterà la comprensione del gruppo nel suo complesso.
L'autore non ha nulla di divulgare.
Ricerca in corso tardigrade peptide antimicrobico è supportato da finanziamenti intramurale dalla Midwestern University Office of Research e sponsorizzato programmi (ORSP). Il ORSP non aveva alcun ruolo nel disegno dello studio, raccolta dati, analisi, interpretazione o preparazione del manoscritto.
Name | Company | Catalog Number | Comments |
BLAST webpage | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
EditSeq (Lasergene suite) | DNASTAR | https://www.dnastar.com/t-allproducts.aspx | |
Excel 2013 | Microsoft | ||
FigTree | http://tree.bio.ed.ac.uk/software/figtree/ | ||
MEGA | www.megasoftware.net | ||
MrBayes | http://mrbayes.sourceforge.net/ | ||
SCOP database | http://scop.mrc-lmb.cam.ac.uk/scop/ |
Richiedi autorizzazione per utilizzare il testo o le figure di questo articolo JoVE
Richiedi AutorizzazioneThis article has been published
Video Coming Soon