Благодаря развитию новых технологий секвенирования затраты на секвенирование значительно снизились с 2008 по 2012 год, что сделало сборку транскриптома идеальным выбором для исследований. В прошлом стоимость секвенирования генома не позволяла уделять достаточного внимания многим немодельным организмам, но все изменилось с появлением высокопроизводительной технологии секвенирования (т. е. технологии секвенирования следующего поколения). Развитие этих технологий не только снизило затраты, но и повысило эффективность работы, позволив расширить объекты исследования на более широкий круг немодельных организмов. Например, были собраны и проанализированы транскриптомы мозга нута, плоских червей, гавайских синих крабов, нильских крокодилов, кукурузных змей, бородатых агам и красноухих черепах. р>
Изучение немодельных организмов может дать новое представление о механизмах «удивительных морфологических инноваций», которые позволяют жизни на Земле процветать. р>
В растительном и животном мире многие «новшества», такие как мимикрия, симбиоз, паразитизм и бесполое размножение, невозможно проверить на обычных модельных организмах. Поскольку транскриптомные сборки, как правило, дешевле и проще геномов, этот подход часто является наилучшим выбором для изучения немодельных организмов. Транскриптомы этих организмов могут выявить новые белки и их вариантные формы, связанные с этими уникальными биологическими явлениями. р> Сравнение транскриптомных и геномных сборок
Собранный набор транскриптов необходим для начальных исследований экспрессии генов. До разработки вычислительных программ для сборки транскриптома данные транскриптома в основном анализировались путем сопоставления с референтным геномом. Хотя выравнивание генома является надежным методом характеристики транскрибированных последовательностей, его ограничением является невозможность учета структурных изменений в транскриптах мРНК, таких как альтернативный сплайсинг. Поскольку геном содержит все интроны и экзоны, которые могут появиться в транскрипте, варианты сплайсинга с прерывистыми выравниваниями могут быть пропущены как фактические варианты белка. Даже если доступен референтный геном, необходимо выполнить сборку de novo, поскольку это позволяет восстановить транскрипты из фрагментов, отсутствующих в основном геноме. р>
После того, как РНК извлечена и очищена из клеток, ее отправляют на установку высокопроизводительного секвенирования, где сначала проводят обратную транскрипцию для создания библиотеки кДНК. Затем эти кДНК можно фрагментировать на фрагменты различной длины в зависимости от используемой платформы секвенирования. Следующие платформы используют различные типы технологий для секвенирования миллионов коротких прочтений, включая секвенирование 454, Illumina и SOLiD. р>
Сгенерированные выше считывания последовательности кДНК будут собраны в транскрипты с помощью программы сборки транскриптов с коротким считыванием. Часто можно обнаружить несколько вариаций аминокислот, которые могут отражать различные варианты белков или могут представлять различные гены в одном и том же семействе генов или даже гены, которые имеют только общие консервативные домены. Хотя эти программы в целом успешно справляются со сборкой геномов, они сталкиваются с особыми трудностями при сборке транскриптома. В отличие от высокого покрытия последовательностей генома, для транскриптома высокое покрытие последовательностей может подразумевать обильные, а не повторяющиеся последовательности. Кроме того, секвенирование транскриптома может быть цепочечно-специфичным, в этом случае присутствуют как смысловые, так и антисмысловые транскрипты. В конечном итоге реконструкция и анализ всех вариантов сплайсинга может оказаться сложной задачей. р>
Функциональная аннотация собранных транскриптов дает представление о конкретных молекулярных функциях предполагаемых белков, клеточных компонентов и биологических процессов. Blast2GO (B2G) может аннотировать данные о последовательностях, которые еще не имеют аннотаций GO, путем выравнивания собранных фрагментов контигов с неизбыточной базой данных белков NCBI. Это инструмент, часто используемый в функциональных геномных исследованиях немодельных видов. р>
Поскольку качественные референсные геномы редко доступны, качество вычислительных сборок можно проверить, сравнив собранные последовательности с прочтениями, использованными для их генерации (без референса), или сравнив консервативные последовательности доменов генов с транскриптомом или геномом близкородственного вида (на основе референса). Такие инструменты, как Transrate и DETONATE, выполняют статистический анализ с помощью этих методов для оценки качества сборки. р>
В этой быстро развивающейся области геномных исследований сборка транскриптома, несомненно, является одним из основных инструментов для понимания разнообразия жизни. При таком богатом биоразнообразии как мы можем применить эти результаты в будущих биотехнологиях и усилиях по охране природы? р>