Наш протокол имеет важное значение, поскольку он может быть использован для определения геномных последовательностей, которые не могут быть изолированы от соочищающих последовательностей, которые сами по себе могут быть известны лишь частично. Основными преимуществами этой техники является то, что она недорогая, используя в основном свободные программы, которые могут быть загружены, а также гибкие. Вы можете применить его ко многим биологическим вопросам.
Потенциальные применения включают выявление целей бактериальной вакцины и выявление вирусов, последовательности которых чрезвычайно отличаются от известных микробов. Этот метод может быть применен к любой системе, в которой неизвестное не может быть экспериментально разделено, до тех пор, пока доступна эталонная последовательность без геномной цели. Этот метод требует некоторых проб и ошибок, поэтому терпение имеет важное значение.
Возможно, вам придется беспокоить стрелять программ. Вы можете использовать программы, отличается от тех, которые мы описываем здесь. Используйте руководства пользователя как можно больше.
Визуальная демонстрация этого метода полезна, поскольку вычислительная работа зависит от базового понимания структуры программирования командной строки. Для начала используйте Trimmomatic 0.32 для удаления адаптеров illumina и низкого качества оснований. Используйте грушевую версию 0.9.11 для создания высококачественных объединенных считывает из тримоматических выходных парных считых с помощью параметров по умолчанию.
Затем используйте рептилий версия 1.1, чтобы исправить ошибку читает производится через грушу. Наконец, используйте версию 2.4.0 Trinity в режиме по умолчанию для сборки исправленных последовательностей. Для конкретных библиотек для нитей используйте SS_lib_type параметры.
Выходом является файл FASTA, который будет помещен в новый каталог под названием trinity_output. Сделайте базу данных BLAST эталонной последовательности nucleotide_reference. поста на командной линии.
BLAST соответствует запросу, собранного в справочную базу данных. Чтобы получить выходной файл, используйте BLAST_results. txt Для генерации табликулярного вывода, необходимого для подсекции этапов обработки скриптов Python, используйте outfmt 6 Для увеличения строки, используйте белковые последовательности из сборки в качестве запроса BLAST с переведенным нуклеотидом BLAST, который выполняет шестигорный перевод нуклеотидной базы данных.
Чтобы получить белковые последовательности для запроса, запустите TransDecoder. Команда Long0rfs определяет самые длинные открытые кадры чтения из собранных последовательностей запросов. Теперь запустите tblastn.
При необходимости убедитесь, что правильный генетический код выбран для изучаемого организма с помощью db_gencode с соответствующим вариантом кода. Если высокое качество белка ссылка доступна, используйте белок-белок соответствия с бласп, а не tblastn Сделать BLAST базы данных белка ссылки. Убедитесь в том, чтобы сохранить результат в качестве файла для обработки вниз по течению, и использовать таблейный выход для обеспечения Python скрипты могут разобрать их правильно.
Теперь используйте скрипт вычитания Python, чтобы удалить все соответствующие последовательности. Чтобы сопоставить считываемые на сборку, используйте BWA-MEM Версию 0.7.12 или bowtie 2 для карты загруженных необработанных считываемых на сборку запросов. Сначала индексировать сборку, а затем картировать чтения.
Выход будет форматом SAM. Вы запустите скрипт Python removeUnmapped. py с использованием файла SAM в качестве ввода.
Это определяет имена последовательностей запросов без соответствующих считывай и сохраняет их в новом текстовом файле. Выходом предыдущего шага является список имен последовательностей в файле txt. Извлекайте файл FASTA с помощью этих последовательностей.
Выход будет файлом fasta. Используйте Genius для определения оптимальных последовательностей грунтовки вручную. Выделите последовательность кандидатов от 21 до 28 базовых пар для форварда грунтовка, избегая пробегов из четырех или более любой базы.
Попробуйте нацелиться на регион с достаточно равномерной комбинацией всех базовых пар. Один G или C в трех Prime End является полезным, помогая якорь грунтовка. Нажмите на вкладку Статистика на правой стороне экрана, чтобы просмотреть предполагаемую температуру плавления этой последовательности по мере выделения региона-кандидата.
Цель для плавления температуры между 55 и 60 градусов по Цельсию, избегая при этом повторов, и длинные пробеги G C.Выберите обратный грунтовка таким же образом, расположенный от 150 до 250 базовых пар три премьер вперед грунтовки. В то время как длины грунтовки не должны соответствовать, прогнозируемая температура плавления должна быть как можно ближе к температуре вперед грунтовки. Не забудьте обратить вспять дополнение последовательности правого нажатия в Genius в то время как последовательность выделена в варианте меню.
Альтернативным методом является использование функции Primer Design, которая находится в верхней панели инструментов в окне последовательности. Вставьте область для усиления в рамках Целевого региона. В соответствии с вкладкой характеристики, вставьте желаемый размер, температуру плавления, и процент G C, а затем нажмите OK, чтобы иметь грунтовки генерируется.
Для выполнения количественной проверки ПЦР оставшейся последовательности, сначала подготовьте смесь реакции для каждого шаблона в тройном, с нашим SYBR Green Master Mix, вперед и обратной грунтовки, и воды, для общего объема 25 микролитров. Запустите программу qPCR, проинформированную о ранее проверенном времени температуры и продления. Окончательные кривые денатурации должны быть созданы по крайней мере в первый раз праймеры используются в qPCR для проверки усиления одного продукта ДНК.
Измерьте qPCR SYBR Зеленые сигналы по отношению к Actin Ct Для всех случаев, рассчитать среднее, и стандартное отклонение от двух Ct по отношению к Actin. Выполните электрофорез геля конечной точки, чтобы подтвердить правильное обнаружение размера продукта с помощью qPCR. Здесь, запустить 25 микролитров продукта qPCR смешивается с пятью микролитров 6X Glitterol красителя на 2%TAE агарозный гель на 200 вольт в течение 20 минут.
Если ваш qPCR показывает, что вы не определили целевые последовательности, повторите весь цикл с новой ссылкой, которая может быть получена из онлайн-базы данных. Вычитательный проект в данном случае начался с секвенирования РНК из зародышевой ткани самца и самки взрослого зяблика зебры. В конечном счете, было выявлено 935 соматических генов, которые ранее не были включены во всю аннотацию генома.
После вычислительной фильтрации количественный ПЦР может дать отрицательный результат, при котором не было никакой разницы в обнаружении тканей птиц. И наоборот, положительный результат, представляющий идентификацию True Target Sequence, подтверждается, когда геномная ДНК qPCR показывает статистически большее обнаружение в ткани, представляющей интерес, по отношению к ссылке. Здесь ген альфа-оснастки был проверен на зародышевой ограничен, потому что он был истощен в соматической ткани по отношению к тестируемой ДНК, где он присутствовал, что уровни, эквивалентные Actin.
Важно помнить, чтобы использовать правильные входы во время каждого из вычислительных шагов. Возможно, вам придется пройти через цикл вычитания несколько раз для того, чтобы получить целевую последовательность или последовательности. Разнообразие филогенетического, структурного и функционального анализа может быть выполнено на обнаруженных генах.
Эти дополнительные методы дают представление об эволюционной и функциональной роли генов. Мы определили первый ген на хромосоме, ограниченной зародышами, которая расширила интерес к этому удивительному геномного элемента. Последующая работа показала аналогичные хромосомы во многих видах певчих птиц, содержащих много дополнительных генов.