새로운 시퀀싱 기술의 발달로 전사체 연구는 새로운 시대로 접어들었습니다. 특히 2008년에서 2012년 사이에 시퀀싱 비용이 크게 감소하면서 많은 비모델 생물의 전사체를 조립하고 분석하는 것이 가능해졌습니다. 이러한 변화는 특정 유기체의 표현형 변이를 발견하는 것을 넘어서 지구상 생명의 다양성과 생물학적 메커니즘을 더욱 완벽하게 이해할 수 있게 해줍니다.
"전사체 조립의 가장 큰 이점은 특정 생물학적 현상에서 핵심적인 역할을 할 수 있는 새로운 단백질과 그 동형체를 밝혀낼 수 있는 잠재력입니다."
전사체 조립에는 두 가지 주요 방법이 있습니다. 신규 조립과 참조 기반 조립입니다. 아직 완전한 유전체가 확립되지 않은 비모델 생물의 경우, 신규 전사체 조립이 분명히 더 적절한 선택입니다. 이러한 접근 방식은 이전의 유전체 서열에 의존하지 않으므로 연구자들은 알려지지 않은 유전자 전사 정보를 탐구할 수 있습니다.
과거에는 전사체 데이터 분석이 주로 기존 참조 유전체와의 비교에 의존했습니다. 그러나 이러한 접근 방식은 모든 mRNA 구조적 변이를 포괄하지 못할 수 있으며, 특히 대체 스플라이싱이 관련된 경우 더욱 그렇습니다. 또한 유전체에 불연속적으로 매핑할 수 없기 때문에 많은 전사 변이를 놓칠 수도 있습니다. 따라서 참조 유전체가 있는 경우에도 참조 유전체에서 누락된 전사본을 복구할 수 있는 새로운 조립이 필요하므로 여전히 de novo 조립을 수행해야 합니다.
전사체의 적용 범위는 유전자의 발현 수준을 직접적으로 반영할 수 있는 반면, 유전체의 적용 범위는 일반적으로 반복되는 시퀀스의 영향을 받습니다. 또한 전사체 조립에 직면한 가장 큰 과제 중 하나는 동일 유전자에 있는 서로 다른 전사체 변이체가 엑손을 공유할 수 있다는 점으로, 이로 인해 식별이 더욱 복잡해진다.
RNA 추출 및 정제 후, 샘플은 역전사 분석을 통해 cDNA 라이브러리를 얻기 위해 고처리량 시퀀싱 시설로 보내집니다. 플랫폼에 따라 이러한 cDNA는 특정 길이로 절단된 다음 454 시퀀싱, Illumina, SOLiD를 비롯한 다양한 기술을 사용하여 시퀀싱됩니다.
전사본의 시퀀스 데이터는 단문 판독 전사본 조립 프로그램을 사용하여 전사본으로 조립됩니다. 전사본은 유사할 수 있지만 아미노산 차이가 있을 수 있으므로, 이러한 차이는 서로 다른 단백질 동종체를 반영할 수 있습니다. 이 과정을 수행하는 데 여러 가지 어셈블리 프로그램을 사용할 수 있지만, 전사체 어셈블리는 많은 고유한 과제를 안고 있습니다.
"대부분의 단문 판독 어셈블러는 오버랩 그래프와 드 브루인 그래프라는 두 가지 기본 알고리즘을 따릅니다. 드 브루인 그래프는 비교적 계산 요구 사항이 낮아 선호됩니다."
조립된 전사본에 기능적 주석을 달면 잠재적인 생물학적 기능에 대한 심층적인 이해를 얻을 수 있습니다. Blast2GO와 같은 도구를 사용하면 주석이 없는 시퀀스 데이터를 유전자 온톨로지에 기반하여 찾을 수 있습니다. 이 과정은 전사본이 관련된 생물학적 과정과 그 분자적 기능을 식별하는 데 도움이 될 수 있습니다.
좋은 참조 유전체를 갖는 것이 흔치 않기 때문에, 조립된 시퀀스의 품질은 원시 판독 결과와 비교하여 검증할 필요가 있습니다. 짧은 서열의 필터링 또한 필요한데, 이러한 짧은 서열은 일반적으로 기능적 단백질로 효과적으로 접힐 수 없기 때문이다.
시중에는 전사체를 생성하는 데 사용할 수 있는 다양한 어셈블리 소프트웨어가 있습니다. 예를 들어, SOAPdenovo-Trans 및 Trinity와 같은 도구는 고유한 기능을 가지고 있습니다. 이러한 프로그램은 전사본을 효율적으로 조립할 수 있을 뿐만 아니라 다양한 스플라이싱 이벤트와 유전자 발현 수준을 설명할 수도 있습니다.
이 빠르게 발전하는 분야에서 유전체나 전사체 조립 방법의 선택은 궁극적으로 연구자의 필요와 연구 대상 생물의 특성에 달려 있습니다. 각 방법에는 장단점이 있습니다. 연구자들은 자신의 필요에 가장 잘 맞는 연구 경로를 선택했습니까?