Nosso protocolo é significativo porque pode ser usado para identificar sequências genômicas que não podem ser isoladas de sequências de co-purificação, que podem ser apenas parcialmente conhecidas. As principais vantagens dessa técnica é que ela é barata, usando principalmente software livre que pode ser baixado, bem como flexível. Você pode aplicá-lo a muitas questões biológicas.
As aplicações potenciais incluem identificar alvos de vacinas bacterianas e identificar vírus cujas sequências são extremamente diferentes dos micróbios conhecidos. Este método pode ser aplicado a qualquer sistema no qual o desconhecido não possa ser separado experimentalmente, desde que a sequência de referência sem o alvo genômico esteja disponível. Esta técnica requer alguma tentativa e erro, por isso a paciência é importante.
Você pode precisar de problemas para filmar os programas. Você pode usar programas diferentes dos que descrevemos aqui. Use os manuais do usuário o máximo possível.
A demonstração visual deste método é útil porque o trabalho computacional depende de uma compreensão básica de como a programação da linha de comando é estruturada. Para começar, use Trimmomatic 0.32 para remover adaptadores de illumina e bases de baixa qualidade. Use a versão Pear 0.9.11 para criar leituras mescladas de alta qualidade a partir de leituras emparelhadas de saída trimmomática usando parâmetros padrão.
Em seguida, use a versão 1.1 do Réptil para corrigir as leituras produzidas através da Pera. Por fim, use a versão 2.4.0 do Trinity no modo padrão para montar as sequências corrigidas. Para bibliotecas específicas de fios, use o parâmetro SS_lib_type.
A saída é um arquivo FASTA que será colocado em um novo diretório chamado trinity_output. Faça um banco de dados BLAST da sequência de referência nucleotide_reference. fasta na linha de comando.
O BLAST correspondeu à consulta montada ao banco de dados de referência. Para obter um arquivo de saída, use BLAST_results. txt Para gerar saída tabular necessária para etapas de processamento de subsequence com scripts Python, use outfmt 6 Para aumentar a stringency, use sequências proteicas do conjunto como a consulta BLAST com blast nucleotídeo traduzido, que realiza a tradução de seis vias do banco de dados nucleotídeo.
Para obter sequências proteicas para a consulta, execute o TransDecoder. Comando Long0rfs para identificar os quadros de leitura abertos mais longos de sequências de consulta montadas. Agora corra tblastn.
Se necessário, certifique-se de que o código genético correto seja selecionado para o organismo que está sendo estudado usando o db_gencode com opção de código apropriada. Se houver uma referência proteica de alta qualidade disponível, use proteína-proteína correspondente com blastp em vez de tblastn Faça um banco de dados BLAST da referência à proteína. Certifique-se de salvar o resultado como um arquivo para processamento a jusante e use a saída tabular para garantir que os scripts Python possam analisá-los corretamente.
Agora, use o script Python subtrativo para remover quaisquer sequências correspondentes. Para mapear as leituras no conjunto, use bwa-MEM Versão 0.7.12 ou bowtie 2 para mapear as leituras brutas baixadas no conjunto de consulta. Primeiro, indexe a montagem, depois mapeie as leituras.
A saída será o formato SAM. Execute o script Python removendoInmapped. py usando o arquivo SAM como entrada.
Isso identifica os nomes das sequências de consulta sem leituras correspondentes e as salva em um novo arquivo de texto. A saída da etapa anterior é uma lista de nomes de sequências em um arquivo txt. Extrair um arquivo FASTA com essas sequências.
A saída será um arquivo fasta. Use genius para determinar sequências de primer ideais manualmente. Destaque uma sequência de candidatos de 21 a 28 pares de base para o primer dianteiro, evitando corridas de quatro ou mais de qualquer base.
Tente atingir uma região com uma combinação bastante uniforme de todos os pares de base. Um único G ou C em três Prime End é benéfico, ajudando a ancorar o primer. Clique na guia Estatísticas no lado direito da tela para ver a temperatura estimada de fusão dessa sequência à medida que a região do candidato é destacada.
Aponte para uma temperatura de fusão entre 55 e 60 graus Celsius, evitando repetições, e longas corridas de G C.Escolha uma cartilha reversa da mesma maneira, situada de 150 a 250 pares de base três prime da cartilha dianteira. Embora os comprimentos do primer não precisem coincidir, a temperatura de fusão prevista deve ser o mais próxima possível da do primer dianteiro. Certifique-se de reverter o complemento da sequência clicando com o botão direito do mouse em Genius enquanto uma sequência é destacada em uma opção de menu.
Um método alternativo é usar a função Primer Design, que é encontrada na barra de ferramentas superior na janela Sequência. Insira a região para amplificar sob a Região Alvo. Sob a guia características, insira o tamanho desejado, a temperatura de fusão e por cento G C, em seguida, clique em OK para ter primers gerados.
Para realizar a validação quantitativa do PCR da sequência restante, primeiro prepare uma mistura de reação para cada modelo em triplicado, com nosso SYBR Green Master Mix, primers avançados e reversos, e água, para um volume total de 25 microlitros. Execute um programa qPCR informado pelo tempo de temperatura e extensão previamente validado. As curvas finais de desnaturação devem ser geradas pelo menos na primeira vez que os primers são empregados em qPCR para validar a amplificação de um único produto de DNA.
Meça os sinais qPCR SYBR Green relativos ao Actin por Ct Para todos os casos, calcule a média e o desvio padrão de dois para o TC relativo ao Actin. Realize a eletroforese de gel de ponto final, para confirmar a detecção correta do tamanho do produto por qPCR. Aqui, execute 25 microlitres do produto qPCR misturado com cinco microlitres de corante Glitterol 6X em um gel de 2%TAE Agarose a 200 volts por 20 minutos.
Se o seu qPCR mostrar que você não identificou as sequências de destino, repita todo o ciclo com uma nova referência, que pode ser obtida a partir de um banco de dados on-line. O projeto subtrativo, neste caso, começou com o sequenciamento do RNA a partir de tecido forrado de germes de tentilhões de zebra adultos machos e fêmeas. Em última análise, foram identificados 935 genes somatics que não foram incluídos anteriormente em toda a anotação do genoma.
Após a filtragem computacional, o PCR quantitativo pode produzir um resultado negativo no qual não houve diferença na detecção entre os tecidos das aves. Por outro lado, um resultado positivo representando a identificação de uma Sequência de Alvos Verdadeira é confirmado quando o DNA genômico qPCR mostra detecção estatisticamente maior no tecido de interesse, em relação à referência. Aqui, o gene alfa snap foi validado para ser restringido por ser esgotado em tecido somático em relação ao DNA de testes onde estava presente que os níveis equivalentes a Actin.
É importante lembrar de usar as entradas corretas durante cada uma das etapas computacionais. Você pode ter que passar pela subtração do ciclo várias vezes para obter a sequência de destino ou sequências. Uma variedade de análises filogenéticas, estruturais e funcionais pode ser realizada nos genes descobertos.
Esses métodos adicionais fornecem uma visão dos papéis evolutivos e funcionais dos genes. Identificamos o primeiro gene em um cromossomo de pássaro-canção restrito a germina, o que ampliou o interesse neste elemento genômico surpreendente. Trabalhos subsequentes mostraram cromossomos semelhantes em muitas espécies de pássaros-canção contendo muitos genes adicionais.