새로운 시퀀싱 기술이 개발되면서 2008년부터 2012년까지 시퀀싱 비용이 엄청나게 떨어져 전사체 조립이 연구에 이상적인 선택이 되었습니다. 과거에는 게놈 시퀀싱 비용 때문에 모델이 아닌 생물에 대한 관심이 부족했지만, 고처리량 시퀀싱 기술(차세대 시퀀싱 기술)의 도입으로 이러한 상황은 모두 바뀌었습니다. 이러한 기술의 발달로 비용이 절감되었을 뿐만 아니라 업무 효율성도 향상되어, 연구 대상을 더 광범위한 비모델 생물로 확장할 수 있었습니다. 예를 들어, 병아리콩, 편형동물, 하와이 파란 게, 나일악어, 옥수수뱀, 수염도마뱀, 붉은귀거북의 뇌 전사체가 조립되어 분석되었습니다.
비모델 생물을 조사하면 지구상의 생명이 번성할 수 있도록 하는 "매혹적인 형태학적 혁신"의 메커니즘에 대한 새로운 통찰력을 얻을 수 있습니다.
식물계와 동물계에서 모방, 공생, 기생 및 무성생식과 같은 많은 "혁신"은 일반적인 모델 생물에서 테스트할 수 없습니다. 전사체 조립은 일반적으로 유전체 조립보다 저렴하고 간단하기 때문에 이 접근법은 비모델 생물을 연구하는 데 가장 좋은 선택인 경우가 많습니다. 이들 생물체의 전사체는 이 독특한 생물학적 현상과 관련된 새로운 단백질과 그 변이 형태를 보여줄 수도 있습니다.
전사체와 게놈 어셈블리의 비교조립된 전사본 세트는 초기 유전자 발현 연구에 필수적입니다. 전사체 조립을 위한 계산 프로그램이 개발되기 전에는 전사체 데이터는 주로 참조 유전체에 매핑하여 분석되었습니다. 유전체 정렬은 전사된 시퀀스를 특성화하는 강력한 방법이기는 하지만 대체 스플라이싱과 같은 mRNA 전사본의 구조적 변화를 설명할 수 없다는 한계가 있습니다. 유전체에는 전사본에 나타날 수 있는 모든 인트론과 엑손이 포함되어 있으므로, 불연속적인 정렬을 보이는 스플라이스 변이체는 실제 단백질 변이체로 간과될 수 있습니다. 참조 게놈이 사용 가능한 경우에도 마스터 게놈에서 누락된 단편으로부터 전사본을 복구할 수 있으므로 de novo 조립을 수행해야 합니다.
세포에서 RNA를 추출하고 정제한 후, 고처리량 시퀀싱 시설로 보내어 먼저 역전사 과정을 거쳐 cDNA 라이브러리를 만듭니다. 이러한 cDNA는 사용된 시퀀싱 플랫폼에 따라 다양한 길이로 분할될 수 있습니다. 다음의 다양한 플랫폼은 454 시퀀싱, Illumina, SOLiD를 포함하여 수백만 개의 짧은 판독을 시퀀싱하기 위해 서로 다른 유형의 기술을 활용합니다.
위에서 생성된 cDNA 시퀀스 판독은 단편 판독 전사본 조립 프로그램을 통해 전사본으로 조립됩니다. 종종 몇 가지 아미노산 변형이 감지될 수 있는데, 이는 다른 단백질 변형을 반영하거나 같은 유전자 계열의 다른 유전자를 나타내거나 심지어 보존된 도메인만 공유하는 유전자를 나타낼 수도 있습니다. 이러한 프로그램은 일반적으로 유전체 조립에는 성공하지만, 전사체 조립에서는 고유한 과제에 직면합니다. 유전체의 높은 시퀀스 커버리지와 달리 전사체의 높은 시퀀스 커버리지는 반복적인 시퀀스보다는 풍부한 시퀀스를 의미할 수 있습니다. 또한 전사체 시퀀싱은 가닥별로 이루어질 수 있는데, 이 경우 센스 전사본과 안티센스 전사본이 모두 존재합니다. 결국, 모든 스플라이스 변종을 재구성하고 분석하는 것은 어려울 수 있습니다.
조립된 전사본의 기능적 주석은 추정 단백질, 세포 구성 요소 및 생물학적 과정의 특정 분자 기능에 대한 통찰력을 제공합니다. Blast2GO(B2G)는 조립된 콘티그 조각을 NCBI의 비중복 단백질 데이터베이스에 맞춰서 아직 GO 주석이 없는 시퀀스 데이터에 주석을 달 수 있습니다. 이는 비모델 종의 기능적 유전체 연구에 자주 사용되는 도구입니다.
좋은 참조 유전체는 거의 구할 수 없기 때문에 계산 어셈블리의 품질은 어셈블리를 생성하는 데 사용된 판독 결과와 조립된 시퀀스를 비교하거나(참조 없이) 보존된 유전자 도메인 시퀀스를 밀접한 관련이 있는 종의 전사체나 유전체에 맞춰서(참조 기반) 검증할 수 있습니다. Transrate와 DETONATE와 같은 도구는 이러한 방법을 통해 통계적 분석을 수행하여 조립품의 품질을 평가합니다.
빠르게 발전하고 있는 게놈 연구 분야에서 전사체 조립은 의심할 여지 없이 생명의 다양성을 이해하는 핵심 도구 중 하나입니다. 이렇게 풍부한 생물다양성을 고려하면, 이러한 연구 결과를 미래의 생명공학과 보존 활동에 어떻게 적용할 수 있을까?