Method Article
* Estes autores contribuíram igualmente
Este artigo descreve o procedimento para a identificação e caracterização de uma família de gene em videira aplicada à família de Arabidopsis Tóxicos em Levadura (ATL) E3 ubiquitina ligases.
Classificação e nomenclatura dos genes em uma família podem contribuir de forma significativa para a descrição da diversidade das proteínas codificadas e a previsão da família funções com base em diversas características, tais como a presença de motivos de sequência ou de particular sites para modificação pós-traducional e o perfil de expressão dos membros da família em diferentes condições. Este trabalho descreve um protocolo detalhado para a caracterização de família do gene. Aqui, o procedimento é aplicado para a caracterização da Arabidopsis Tóxicos em Levadura (ATL) E3 ubiquitina ligase família na videira. Os métodos incluem a identificação de todo o genoma dos membros da família, a caracterização da localização do gene, estrutura e duplicação, a análise dos motivos da proteína conservada, a previsão dos sites de localização e fosforilação de proteínas, bem como Gene expressão perfila através da família em diferentes conjuntos de dados. Tal procedimento, que poderia ser alargado a novas análises dependendo fins experimentais, poderia ser aplicado a qualquer família de gene em quaisquer espécies de plantas para as quais dados genomic estão disponíveis, e fornece informações valiosas para identificar candidatos interessantes para estudos funcionais, dando insights sobre os mecanismos moleculares de adaptação da planta para seu ambiente.
Durante a última década, muita pesquisa realizada na genômica de videira. Videira é uma reconhecida cultura economicamente relevante, que se tornou um modelo para a investigação sobre o desenvolvimento do fruto e sobre as respostas de plantas lenhosas a estresses bióticos e abióticos. Neste contexto, o lançamento do genoma Vitis vinifera CV. PN40024 em 2007-1 e sua versão atualizada em 20112 levou a uma rápida acumulação de dados "Omics"-escala e a uma explosão de estudos de alto rendimento. Baseado nos dados de sequência publicada, a análise abrangente de uma família de determinado gene (geralmente composta por proteínas partilha motivos conservados, semelhanças estruturais e/ou funcionais e as relações evolutivas), agora pode ser realizada para descobrir sua perfis de expressão genética, evolução e funções moleculares. Essas análises podem contribuir para a compreensão de como as famílias gene controlam processos fisiológicos em um nível de todo o genoma.
Muitos aspectos do ciclo de vida da planta são regulados pela mediada por ubiquitina de degradação de proteínas chaves, que requerem um volume de negócios de aperfeiçoá-lo para assegurar o regulares processos celulares. Importantes componentes do processo de degradação mediada por ubiquitina são os E3 ubiquitina ligases, que são responsáveis pela flexibilidade do sistema, graças ao recrutamento de alvos específicos3. Por conseguinte, estas enzimas representam uma família enorme de gene, com cerca de 1.400 E3 ligase-codificação genes previstos em Arabidopsis thaliana genoma4, cada ligase de ubiquitina E3 atuando para o ubiquitination de proteínas alvo específico. Apesar da importância da ubiquitination substrato específico no Regulamento celular em plantas, pouco se sabe sobre como o caminho da ubiquitination é regulamentado e proteínas alvo foram identificadas somente em alguns casos. O deciframento de tais mecanismos de especificidade e regulamentação depende primeiramente a identificação e caracterização das diferentes componentes do sistema, em particular as ligases E3. Entre ubiquitina ligases, subfamília ATL é caracterizada por 91 Membros identificados em a. thaliana , exibindo um anel-H2 dedo domínio5,6, alguns deles desempenhando um papel na defesa e hormônio respostas7.
O primeiro passo crucial para definir os membros de uma família nova do gene é a definição precisa das características familiares, tais como motivos de consenso, domínios-chave e características da sequência da proteína. Com efeito, a recuperação confiável de todos os membros da família gene com base na análise de explosão requer algumas características de sequência obrigatória, em domínios de particular da proteína responsáveis pela proteína função/atividade, servindo como assinatura de proteína. Isto pode ser facilitado pela caracterização anterior da mesma família gene em outras espécies de plantas ou alcançado através da análise de diferentes genes presumidamente pertencentes à família mesma em diferentes espécies de plantas, para isolar as sequências comuns. Os membros da família podem então ser individualmente nomeados seguindo regras comuns colonizadas por consórcios internacionais para uma espécie de determinada planta. Em videira, por exemplo, tal procedimento é submetido às recomendações do Comité de nomenclatura super para anotação de Gene de uva (sNCGGa), que estabelece a construção de uma árvore filogenética, incluindo V. vinifera e a. thaliana membros da família para permitir a anotação de gene gene baseiam em sequências de nucleotídeos8.
Localização de cromossomo de membros da família e pesquisa de duplicação do gene permitir destacando a presença de genes duplicados do inteiro-genoma ou em tandem. Essa informação aparece útil para desvendar as funções do gene putativo, desde que pode mostrar a redundância funcional ou revelar situações diferentes, ou seja, não-functionalization, neo-functionalization ou functionalization sub9. Ambos os neo - e sub - functionalization é eventos importantes que criam novidade genética, fornecendo novos componentes celulares para adaptação da planta às mudanças ambientes10. Em particular, as duplicações de genes ancestrais e produção de novos genes eram muito frequentes durante a evolução do genoma de videira e recém-formado genes originários de duplicações em tandem e proximais em videira eram mais propensos a produzir novos funções de11.
Outro fator chave em decifrar a função dos genes familiares é o perfil de transcriptomic. A disponibilidade de bases de dados públicas, dando acesso a uma enorme quantidade de dados de transcriptomic pode ser explorada, assim, para atribuir funções putativos para membros da família gene usando análises de expressão em larga escala em silico . Com efeito, a expressão peculiar de alguns genes em órgãos da planta específica ou em resposta a certas tensões pode dar algumas dicas sobre os putativos papéis das proteínas correspondentes em condições definidas e dar suporte a hipóteses sobre possíveis sub functionalization dos genes duplicados para responder aos desafios diferentes. Para esse efeito, é importante considerar os vários conjuntos de dados: estas podem ser gene já disponível matrizes de expressão, tais como o atlas transcriptomic de todo o genoma da videira órgãos e estádios de desenvolvimento,12, ou podem ser construídas ad hoc por recuperação de conjuntos de dados transcriptomic para as espécies de planta particular sujeitados a tensões definidas. Além disso, uma abordagem simples, usando duas matrizes, uma com dados de similaridade emparelhadas e outro com os coeficientes emparelhadas expressão co podem ser aplicados para avaliar as relações entre padrões de semelhança e a expressão de sequência dentro de uma família de gene.
O objetivo deste trabalho é apresentar uma abordagem global, definindo a estrutura do gene, motivos de proteína conservada, localização cromossômica, duplicações do gene e padrões de expressão, como também a previsão de sites localização e fosforilação da proteína, para atingir uma caracterização exaustiva de uma família de genes em plantas. Uma abordagem abrangente é aplicada aqui, para a caracterização da família ATL E3 ubiquitina ligase em videira. De acordo com o papel emergente de membros da subfamília ATL na regulação de processos celulares chave7, este trabalho pode também auxiliar a identificação dos fortes candidatos para estudos funcionais e eventualmente a desvendar os mecanismos moleculares que regem o adaptação desta cultura importante para seu ambiente.
1. identificação da família do Gene ATL putativo membro (s)
2. manual inspeção dos membros da família PSI-BLAST-identificado
3. análise dos parâmetros físicos de proteína e domínios
4. cromossômica distribuição, duplicações e organização intron-Exon
5. nomenclatura e análise filogenética
6. grapevine órgão e fase de criação de perfil de expressão
7. expressão de criação de perfil em resposta a estresses bióticos e abióticos
8. análise das relações entre a sequência parólogo divergência e expressão de Gene co
O gene VIT_05s0077g01970, identificado como o mais parecido com a. thaliana ATL2 (At3g16720), através de uma pesquisa BLASTp, foi usado como sonda para inspeccionar os membros da família ATL no genoma da videira (V. vinifera cv Pinot Noir PN40024). A análise de PSI-BLAST convergiu depois de alguns ciclos, revelando uma lista de putativos genes pertencentes à família de gene videira ATL (figura 1A). A presença do anel-H2 domínio canônico para cada candidato foi avaliada pelo inspeção visual do alinhamento muscular de todas as entradas identificados na análise (figura 1B). Apenas os genes contendo os aminoácidos conservados corretamente espaçados, os dois resíduos de histidina, bem como os resíduos de prolina antes o terceiro cisteína foram considerados como ATLs de acordo com a definição original de ATL em Arabidopsis5. Um total de 96 genes videira cumprido os requisitos e foram considerados para a caracterização mais. Cada membro da família ATL foi analisado para definir as características específicas do gene e a correspondente proteína codificada, ou seja, a presença de outros domínios conhecidos além do anel-H2, transmembranares ou hidrofóbicas regiões ricas, subcellular localização e sítios de fosforilação putativo (tabela 1 e tabela 2).
Figura 1: pesquisa PSI-BLAST e alinhamento de videira putativo ATLs. (A) Screenshot dos hits top 10 da primeira pesquisa PSI-BLAST iteração usando a sequência de proteínas VIT_05s0077g01970 como isca. (B) parte do alinhamento da videira selecionados 96 ATLs putativos, mostrando seu domínio de anel-H2 e o logotipo correspondente obtidos usando um conjunto de biologia molecular (ver Tabela de materiais). Reproduzido de Ariani et al . licenciado sob uma licença Creative Commons Attribution 4.0 internacional42.Por favor clique aqui para ver uma versão maior desta figura.
Nome | Identificação do gene | Comprimento do gene (bp) | Número de intron | UniProt ID | Comprimento de proteínas (aa) | Motivo de anel-H2 | Número de domínio TM/H | Outros domínios | ||
VviATL3 | VIT_09s0002g00220 | 1245 | 0 | F6HXK6 | 304 | PxC | 1 | |||
VviATL4 [VviRHX1A] | VIT_15s0021g00890 | 1827 | 3 | D7SM36 | 203 | PxC | 0 | |||
VviATL18 | VIT_11s0118g00780 | 1113 | 2 | F6HCI8 | 193 | PC | 0 | |||
VviATL23a | VIT_18s0001g01060 | 935 | 0 | F6H0E4 | 114 | PxC | 0,5 | |||
VviATL23b | VIT_18s0001g01050 | 399 | 0 | E0CQX3 | 132 | PxC | 1 | |||
VviATL24 | VIT_17s0000g06460 | 4466 | 4 | D7SI89 | 217 | PxC | 1 | |||
VviATL27 | VIT_00s0264g00020 | 2554 | 4 | D7T1R5 | 235 | PxC | 1 | |||
VviATL43 | VIT_11s0052g00530 | 1576 | 2 | D7SQD9 | 457 | PxC | 3 | |||
VviATL54a | VIT_18s0001g06640 | 3221 | 1 | F6H0Y5 | 405 | PxC | 1 | |||
VviATL54b | VIT_03s0017g00670 | 2774 | 1 | F6HTI0 | 427 | PxC | 1 | |||
VviATL55 [VviRING1] | VIT_07s0191g00230 | 1844 | 0 | F6HRP9 | 372 | PxC | 1 | |||
VviATL63 | VIT_06s0004g06930 | 804 | 0 | D7SJU6 | 267 | PxC | 1 | |||
VviATL65 | VIT_03s0063g01890 | 2068 | 0 | F6HQI8 | 396 | PxC | 1 | |||
VviATL82 | VIT_01s0026g02540 | 820 | 0 | F6HPQ9 | 233 | PC | 0,5 | |||
VviATL83 | VIT_17s0000g08400 | 1887 | 0 | F6GSQ4 | 143 | PC | 0 | |||
VviATL84 | VIT_06s0004g00120 | 1853 | 0 | F6GUP5 | 368 | PC | 0,5 | ZF-RING_3 | ||
VviATL85 | VIT_12s0034g01400 | 786 | 0 | F6H965 | 261 | PC | 0,5 | |||
VviATL86 | VIT_12s0034g01390 | 1434 | 1 | D7T016 | 451 | PC | 0,5 | |||
VviATL87 | VIT_18s0001g03270 | 1002 | 0 | F6H0T2 | 333 | PC | 0,5 | ZF-RING_3 | ||
VviATL88 | VIT_08s0040g00590 | 1320 | 0 | F6HQR2 | 314 | PC | 0 | ZF-RING_3 |
Tabela 1: primeira 20 VviATL de genes e características da sequência das proteínas correspondentes. TM: transmembrana; H: hidrofóbicos; 0,5 indica a presença de uma ou mais regiões hidrofóbicas. Reproduzido de Ariani et al . licenciado sob uma licença Creative Commons Attribution 4.0 internacional42.
Tabela 2: detalhes sobre o primeiro 20 VviATL posição do gene no V. vinifera genoma, estado de duplicação e as características físico-químicas de proteínas ATL e localização. (um) número de sítios de fosforilação predito por Musite; (b) predições similares obtidas pelo menos dois software são destacadas em negrito; ngLOC foi usado com configurações padrão, Considerando que TargetP v 1.1 e proteína Prowler localização Subcellular foram usados com um corte de probabilidade de 0,5. NUC, núcleo; MIT, mitocôndrias; CHL, cloroplasto; PLA, a membrana plasmática; S, via secretora (presença de um peptídeo sinal); M, mitocôndria; C, cloroplasto; Ó ou -, outros locais; nd, não determinado (ou seja, valor abaixo do limiar). Reproduzido de Ariani et al . licenciado sob uma licença Creative Commons Attribution 4.0 internacional42. Clique aqui para baixar este arquivo.
Uma análise filogenética, incluindo as sequências de nucleotídeos dos genes de ATL-codificação de videira identificados em conjunto com as sequências de referência a. thaliana ATL gene da família foi usada para a nomenclatura ATL de videira, de acordo com as diretrizes do o sNCGGa8. Noventa e seis e 83 sequências nucleotídicas de V. vinifera e a. thaliana, respectivamente, foram submetidas ao pipeline de Phylogeny.fr para obter uma árvore filogenética confiável.As último sequências foram usadas mais tarde para anotar e nomear os genes de videira com base em relacionamentos sólidos (Figura 2). Seguindo esta abordagem, a 13 de 96 videira ATLs recebeu um identificador específico, considerando sua homologia-para-um com um a. thaliana ATL. Os nomes dos outros 83 genes foram atribuídos com base na árvore filogenética, com um progressivo numeração de cima para baixo, a partir de um número de gene ATL mais elevado do que o usado no número mais alto a. thaliana.
Figura 2: Árvore filogenética de V. vinifera a. thaliana ATL E3 ubiquitina ligase-codificação genes e. A árvore não enraizada foi gerada com a suite de Phylogeny.fr (V. vinifera (em verde) e 83 genes ATL de a. thaliana relatado no banco de dados UniProt (em amarelo). Foram obtidos valores de apoio de filial 100 repetições de inicialização. As estrelas vermelhas indicam a presença de um domínio de dedo (BZF) zinco BCA2 as proteínas correspondentes. Reproduzido de Ariani et al . licenciado sob uma licença Creative Commons Attribution 4.0 internacional42. Clique aqui para ver uma versão maior desta figura.
Mapeamento de genes ATL-codificação para os cromossomos de videira mostrou uma ampla distribuição em todo o genoma, sugerindo que a duplicação do inteiro-genoma como a principal força evolutiva na expansão da família do gene ATL em videira. Com efeito, 31 ATLs foram encontradas em regiões cromossômicas homólogas potencialmente provenientes de eventos de duplicação do genoma inteiro ou segmentar. Além disso, a mesma análise destacou 13 tandemly de duplicação de genes, uma duplicata proximal e 51 duplicatas dispersas (Figura 3). Considerando o grande número de genes duplicados da família ATL, realizamos um teste de enriquecimento (teste exato de Fisher) para verificar a retenção preferencial dos genes duplicados durante o fracionamento do genoma. Com um p-valor < 0.001, este teste confirma a hipótese de que a duplicação de genes ATL foram retidos aleatoriamente mais do que esperado, sugerindo um papel para a família do gene ATL durante videira adaptação e evolução.
Figura 3: Distribuição de gene Grapevine ATL-codificação na V. vinifera cromossomos e a duplicação estado. Os genes ATL 96 videira com informação cromossômica exata disponível no banco de dados foram mapeados para os 19 cromossomos de V. vinifera . As cores indicam o evento original de duplicação. Linhas pretas verticais e linhas vermelhas identificam pares derivados de duplicações em tandem e duplicações de genoma inteiro, respectivamente. Reproduzido de Ariani et al . licenciado sob uma licença Creative Commons Attribution 4.0 internacional42. Clique aqui para ver uma versão maior desta figura.
Para investigar as funções biológicas putativos dos ATLs em videira, foi realizada uma meta-análise sobre o V. vinifera CV Corvina global expressao Atlas12. O conjunto de dados inclui valores de expressão de todo o genoma de 54 órgãos diferentes videira e estádios de desenvolvimento e foi usado para executar uma análise bi-cluster hierárquica. Resultados não só confirmaram que todos os 96 ATLs foram expressos em pelo menos um dos tecidos 54/estágios, mas também apontou a presença de cinco grupos principais de perfis de expressão (Figura 4A). Brevemente, grupos A e E mostraram-se em frente de comportamentos, em particular o primeiro é caracterizado por um general downregulation de genes ATL em amostras juvenis, incluindo estágios iniciais de baga, folha jovem, gavinhas, inflorescência e maioria das etapas do broto. Por outro lado, no mesmo cluster A, maduras amostras tais como bagas no amadurecimento e pós-colheita murchando estágios, tecidos lenhosas e estágios finais de sementes desenvolvimento ATL genes mostrou um upregulation predominante. Genes em Cluster C foram principalmente ativador na maioria das amostras, enquanto os genes ATL em cluster D eram frequentemente upregulated em estágios finais do desenvolvimento da baga. Finalmente, cluster B não apresentaram qualquer variação relevante nos perfis de expressão.
Uma abordagem similar foi aplicada para estudar a expressão da videira ATL familiares em resposta a estresses bióticos e abióticos, usando conjuntos de dados específicos, construídos para este fim. Uma enorme quantidade de dados de expressão derivando de microarray e RNA-seq experiências estão disponíveis a partir de bancos de dados de acesso público como Gene Expression Omnibus (GEO) e ArrayExpress. Uma vez coletados e convenientemente normalizada, a informação foi explorada durante mais insights sobre a função potencial do ATLs na resposta da planta ao estresse. Analisar os perfis de expressão de videira ATLs em resposta a estresses bióticos revelou que 62 de 96 transcrições mostraram uma significativa modulação (mudança de dobra log2 (FC) > | 0.5 |) pelo menos duas condições, com uma taxa falsa da descoberta (FDR) < (0.05 Figura 4B). O número aumenta para 81, considerando somente o limiar do FDR em uma única condição. Estes resultados sugeriram um envolvimento direto da família do gene ATL na resposta aos agentes patogénicos, também em videira. Em particular, um grupo de 12 genes (VviATL3-27-54b-55-90-97-123-144-148-149-156) foram fortemente upregulated em resposta a maioria dos patógenos, incluindo biotrófica e necrotrophic e outros herbívoros e assim, merece atenção para ainda mais funcional análises.
Figura 4: expressão de gene ATL clusteringof hierárquica em videira Atlas e no dataset videira de estresse biótico. (A) a expressão log transformada valores de genes ATL videira em videira Atlas12 foram usados para análise de cluster hierárquica com base na métrica de distância de Pearson. A cor escala representa a mais elevada (vermelho) ou inferior (verde) expressão níveis com respeito para a abundância de transcrição mediana de cada gene em todas as amostras. Letras de À E do lado direito indicam os diferentes clusters identificados.AB: depois da explosão; B: estouro; broto-w: broto de inverno; F: floração; FB: floração começa; FS: conjunto de frutas; G: verde; Senhor: meados-maturação; PFS: pós-fruta conjunto; PHWI-II-III: pós-colheita minguante 1, 2 e 3 meses; R: maturação; S: senescentes; haste-w: caule lenhoso; V: veraison; WD: bem desenvolvido; Y: jovens. (B) a cor escala representa aumento (vermelho) ou diminuído (azul) prega mudanças videira ATL da expressão do gene em amostras infectadas comparado com controles para cada condição. Asteriscos indicam a expressão diferencial significativa (FDR < 0,05) de cada ATL nas condições correspondentes. Reproduzido de Ariani et al . licenciado sob uma licença Creative Commons Attribution 4.0 internacional42. Clique aqui para ver uma versão maior desta figura.
Suplementares tabela 1: candidatos de genes ATL por splicing alternativo. (um) ATL gene ID de acordo com a previsão de uva gene V1 e anotação, identificação do gene (b), ATL de acordo com o V2 gene uva previsão e anotação43, (c) número de putativo ATL alternativas emenda variantes, (d) informações sobre a sequência de cada variante ATL putativo de código. Clique aqui para baixar este arquivo.
Suplementares tabela 2: Clique aqui para baixar este arquivo.
Arquivo complementar 1: Clique aqui para baixar este arquivo.
Na era genômica, muitas famílias de gene foram caracterizadas profundamente em várias espécies de plantas. Esta informação é preliminar do estudos funcionais e fornecer um quadro para investigar mais profundamente o papel dos diferentes membros de uma família. Neste contexto, há também a necessidade de um sistema de nomenclatura que permite para identificar exclusivamente cada membro de uma família, evitando a redundância e confusões que podem surgir quando os nomes são atribuídos de maneira independente de diferentes genes por grupos de pesquisa diferentes.
Após a consideração pensativa, a comunidade científica de videira concordou com genes de videira nome em uma família com base em semelhanças com os genes de Arabidopsis e estabeleceu uma série de regras que devem ser aplicados para descrever novas famílias de genes em videira, Basicamente a partir de comparação filogenética das sequências nucleotídicas entre videira e membros da família de Arabidopsis8. Portanto, apenas os genes que já são anotados e nomeados corretamente em Arabidopsis podem ser usados na nomenclatura de videira. O procedimento aplicado para a identificação de videira ATL orthologues em Arabidopsis descrito aqui foi realizado, portanto, unicamente para cumprir a exigência de atribuição de nomenclatura correta videira gene familiar. No entanto, para outras espécies de plantas, abordagens alternativas poderiam ser uma opção. Por exemplo, homologia pode ser inferida utilizando um sucessos de explosão bidirecional (BBH), onde os orthologues são definidos como pares de genes em duas espécies que são mais semelhantes (ou seja, com maior pontuação de alinhamento) um ao outro do que para qualquer outro gene no outro espécie de44. No entanto, esse método poderia faltar muitos orthologues no caso de alta taxa de duplicação de genes, tais como em plantas e animais45. Além disso, no caso de genes codificação de ATL, BBH pode recuperar genes falta a estrutura exacta de ATL-tipo anel-H2 (incluindo o resíduo prolina) ou genes que não são anotados e nomeados como ATLs em Arabidopsis. Embora sob uma perspectiva evolucionista, essa busca pode ser relevante, a recuperação de orthologues que não são anotados não teria cumprido o escopo de videira ATL gene familiar anotação e nomenclatura e orthologues que não são anotadas como ATLs Não pode ser usado para os membros da família nome videira. Outra possibilidade é inferir homologia com base em aminoácidos em vez de sequências nucleotídicas usando InParanoid46, ou o mais recente Hieranoid 247, embora tais fluxos de trabalho não são expressamente recomendados pela comunidade científica.
Meta-análise de expressão, que pode ser definida como uma abordagem sistemática para estudar e combinar diferentes repositórios de dataset publicamente disponível de dados de expressão, permite destacar compartilhados e diferentes mecanismos moleculares em uma variedade de condições. Assim, a integração de informações de expressão do gene de múltiplas experiências transcriptomic em grande escala pode melhorar a caracterização de uma família de gene, definindo os perfis de expressão dos membros da família através de experimentos, minimizando assim o impacto de fatores específicos do experimento e apoiar uma suposição mais robusta da função do gene putativo em processos particulares. No entanto, a utilização de dados de microarray exige a integração de dados de expressão obtidos com diferentes plataformas, considerando suas próprias limitações. Por exemplo, na plataforma de microarray de Nimblegen de videira, uma proporção significativa de probesets para os genes correspondentes representados na matriz (~ 13.000 genes) têm problemas potencialmente Cruz-hibridação48. No caso da família ATL de videira, 15 genes podem ser afetados por tal fenômeno. No entanto, como discutido por Cramer et al 48, a Cruz-identificação dos membros da família gene altamente similar pela mesma sonda poderia fornecer informações interessantes sobre a expressão, em condições específicas, não apenas de um único gene, mas de dois genes mais compartilhamento sequência de alta semelhanças e, portanto, potencialmente compartilhamento de metas e funções. Outro problema potencial relacionado a conjuntos de dados microarray é o limite de detecção da expressão de plataformas microarray, que não são muito sensíveis. Para resolver os dois diz respeito, isto é., Cruz-hibridação e a sensibilidade do sinal, uma solução possível seria a considerar apenas RNAseq expressão de conjuntos de dados. No entanto, a meta-análise de dados RNAseq de muito grandes conjuntos de dados de muitos estudos diferentes pode tornar-se altamente demorada e pode exigir muitos recursos computacionais e alta especialização.
Embora a abordagem aqui apresentada pretende ser exaustiva, pode ser certamente mais complementado com outras análises. Em primeiro lugar, para alcançar ainda mais insights sobre a evolução molecular e a relação filogenética entre membros da família gene em plantas, a análise filogenética poderia ser estendida construindo uma árvore filogenética usando alinhamentos múltiplos da sequência dos membros da família de várias espécies de plantas. Também é possível calcular o tempo evolutivo de genes de família, uma estimativa das suas taxas de sinônimos e não-sinônimo de substituição durante a evolução, determinando os valores de Ks (número de substituições sinônimas por sinônimo local em um determinado período de tempo) e Ka (número de substituições nonsynonymous por site não-sinônimos no mesmo período). O rácio de Ka/Ks é usado para inferir os mecanismos de eventos de duplicação de gene após divergência dos seus antepassados. Um valor de Ka/Ks = 1 sugere seleção neutra, um valor de Ka/Ks de < 1 sugere purificando a seleção e um valor de Ka/Ks de > 1 sugere selecção positiva49. Além disso, se a análise da estrutura genética revela a presença de intrões, a caracterização de família do gene pode ser novamente prorrogada para a detecção de alternativa variantes de emenda. De fato, baseado em uma pesquisa profunda de RNA-seq dados de diferentes tecidos, condições de estresse e genótipos43, 21 (da 96) ATLs são fortes candidatos para eventos splicing alternativos, com potencial número de isoformas variando de 2 a 16 para estes ATLs (ver Complementar tabela 1). Transcrições alternativas frequentemente produzem isoformas de proteínas que variam em sequências de aminoácidos e essas mudanças podem alterar as propriedades de celulares das proteínas e podem causar alterações da modulação sutil à perda da função do produto do gene. Por esse motivo, eventos de splicing alternativos estiveram envolvidos em funções de vegetais importantes, incluindo a resposta ao estresse, resistência a doenças, fotossíntese e floração50,51.Integração de informações de promotor do gene ATL que contém putativo cis-elementos reguladores52 ou encontrar moléculas (por exemplo, microRNA e tempo não-codificantes do RNA) potencialmente alvo ATLs53 também pode ser complementado para revelam insights de sistema sobre o complexo molecular regulamento e interação de videira ATLs.
Em conclusão, a escolha das análises a serem executadas, bem como os procedimentos a aplicar para caracterizar uma nova família de gene em uma espécie de planta são impulsionados principalmente pelas regras da comunidade científica, bem como pelo escopo da identificação de família de gene. É importante ter em mente os passos de possível investigação subsequente, que irão explorar o conjunto de informações, entre que inclui a evolução de genes entre espécies de plantas, descrição de estrutura do genoma ou candidatos confiáveis para seleção em funcional estudos.
Os autores não têm nada para divulgar.
O trabalho foi apoiado pela Universidade de Verona, dentro do quadro de comum projeto 2014 (caracterização da família do gene ATL em videira e da sua participação na resistência à Plasmopara viticola).
Name | Company | Catalog Number | Comments |
Personal computer | |||
Basic Local Alignment Search Tool (BLAST) | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
Molecular Evolutionary Genetics Analysis (MEGA) | http://www.megasoftware.net/ | ||
Motif-based sequence analysis tools (MEME) | http://meme-suite.org/ | ||
Geneious | Biomatters Limited | http://www.geneious.com/ | |
ProtParam Tool | http://web.expasy.org/protparam/ | ||
ngLOC | http://genome.unmc.edu/ngLOC/index.html | ||
TargetP v1.1 Server | http://www.cbs.dtu.dk/services/TargetP/ | ||
Protein Prowler | http://bioinf.scmb.uq.edu.au:8080/pprowler_webapp_1-2/ | ||
MUsite | http://musite.sourceforge.net/ | ||
Pfam | http://pfam.xfam.org/ | ||
TMHMM Server v. 2.0 | http://www.cbs.dtu.dk/services/TMHMM/ | ||
ProtScale | http://web.expasy.org/protscale/ | ||
Grape Genome Database (CRIBI) | http://genomes.cribi.unipd.it/grape/ | ||
PhenoGram | http://visualization.ritchielab.psu.edu/phenograms/plot | ||
MCScanX | http://chibba.pgml.uga.edu/mcscan2/ | ||
Interactive Tree Of Life (iTOL) | http://itol.embl.de/ | ||
UniProt | http://www.uniprot.org/ | ||
Phylogeny.fr | http://www.phylogeny.fr/index.cgi | ||
MUSCLE | http://www.ebi.ac.uk/Tools/msa/muscle/ | ||
Gblocks Server | http://molevol.cmima.csic.es/castresana/Gblocks_server.html | ||
Vitis vinifera cv. Corvina gene expression Atlas datamatrix | https://www.researchgate.net/publication/273383414_54sample_ datamatrix_geneIDs_Fasoli2012 | ||
Multi Experiment Viewer (MeV) | http://mev.tm4.org/#/welcome | ||
Sequence Read Archive (SRA) | https://www.ncbi.nlm.nih.gov/sra | ||
R | https://www.r-project.org/ | ||
EMBOSS Needle (EMBL-EBI) | http://www.ebi.ac.uk/Tools/psa/emboss_needle/ |
Solicitar permissão para reutilizar o texto ou figuras deste artigo JoVE
Solicitar PermissãoThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. Todos os direitos reservados