Với sự phát triển của các công nghệ giải trình tự mới nổi, nghiên cứu phiên mã đã bước vào một kỷ nguyên mới. Đặc biệt là trong giai đoạn 2008 - 2012, chi phí giải trình tự giảm đáng kể đã giúp việc lắp ráp và phân tích bản sao mã của nhiều sinh vật không phải là mô hình trở nên khả thi. Sự thay đổi này không chỉ dừng lại ở việc tìm ra biến thể kiểu hình ở các sinh vật cụ thể mà còn cho phép chúng ta hiểu rõ hơn về sự đa dạng và cơ chế sinh học của sự sống trên Trái Đất.
"Lợi ích lớn nhất của quá trình lắp ráp phiên mã là khả năng phát hiện ra các protein mới và các dạng đồng phân của chúng có thể đóng vai trò quan trọng trong các hiện tượng sinh học cụ thể."
Có hai phương pháp chính để lắp ráp phiên mã: lắp ráp de novo và lắp ráp dựa trên tham chiếu. Đối với các sinh vật không phải là mô hình mà bộ gen hoàn chỉnh vẫn chưa được thiết lập, thì việc lắp ráp bản sao de novo rõ ràng là lựa chọn phù hợp hơn. Phương pháp này không dựa vào trình tự bộ gen trước đó, cho phép các nhà nghiên cứu khám phá thông tin phiên mã gen chưa biết.
Trước đây, việc phân tích dữ liệu phiên mã chủ yếu dựa vào việc so sánh với các bộ gen tham chiếu hiện có. Tuy nhiên, cách tiếp cận này có thể không bao phủ được tất cả các biến thể cấu trúc mRNA, đặc biệt là khi liên quan đến quá trình ghép nối thay thế và nhiều biến thể bản sao có thể bị bỏ sót vì chúng không thể được lập bản đồ không liên tục vào bộ gen. Do đó, ngay cả với bộ gen tham chiếu, vẫn cần phải thực hiện lắp ráp de novo, vì lắp ráp mới có thể khôi phục lại các bản sao bị thiếu trong bộ gen tham chiếu.
Độ sâu bao phủ của bản sao mã có thể phản ánh trực tiếp mức độ biểu hiện của gen, trong khi độ sâu bao phủ của bộ gen thường bị ảnh hưởng bởi các trình tự lặp lại. Ngoài ra, một trong những thách thức lớn nhất đối với quá trình lắp ráp phiên mã là các biến thể phiên mã khác nhau trong cùng một gen có thể chia sẻ exon, khiến việc xác định chúng trở nên phức tạp hơn.
Sau khi chiết xuất và tinh chế RNA, các mẫu sẽ được gửi đến cơ sở giải trình tự thông lượng cao để phiên mã ngược nhằm thu được thư viện cDNA. Tùy thuộc vào nền tảng, các cDNA này sẽ được cắt thành các độ dài cụ thể và sau đó được giải trình tự bằng các công nghệ khác nhau, bao gồm giải trình tự 454, Illumina và SOLiD.
Dữ liệu trình tự của bản sao sẽ được lắp ráp thành bản sao bằng chương trình lắp ráp bản sao đọc ngắn. Vì các bản sao có thể giống nhau nhưng có sự thay đổi về axit amin nên những thay đổi này có thể phản ánh các dạng protein khác nhau. Có thể sử dụng nhiều chương trình lắp ráp để thực hiện quá trình này, nhưng việc lắp ráp phiên mã lại đặt ra nhiều thách thức riêng.
"Hầu hết các trình biên dịch đọc ngắn đều tuân theo hai thuật toán cơ bản: đồ thị chồng chéo và đồ thị de Bruijn, trong đó đồ thị de Bruijn được ưa chuộng hơn do yêu cầu tính toán tương đối thấp của nó."
Chú thích chức năng của bản sao đã lắp ráp có thể cung cấp hiểu biết sâu sắc về các chức năng sinh học tiềm năng của chúng. Sử dụng các công cụ như Blast2GO, dữ liệu trình tự chưa chú thích có thể được khai thác dựa trên thuật ngữ gen. Quá trình này có thể giúp xác định các quá trình sinh học liên quan đến bản phiên mã và chức năng phân tử của chúng.
Vì hiếm khi có bộ gen tham chiếu tốt nên chất lượng của trình tự đã lắp ráp cần được xác minh bằng cách so sánh với các đoạn đọc thô. Việc lọc các chuỗi ngắn cũng là cần thiết vì các chuỗi ngắn này thường không thể gấp lại thành các protein chức năng một cách hiệu quả.
Có nhiều phần mềm lắp ráp có sẵn trên thị trường có thể được sử dụng để tạo ra bản sao mã. Ví dụ, các công cụ như SOAPdenovo-Trans và Trinity có các tính năng độc đáo riêng. Các chương trình này không chỉ có thể lắp ráp bản sao hiệu quả mà còn tính đến các sự kiện ghép nối và mức độ biểu hiện gen khác nhau.
Trong lĩnh vực đang phát triển nhanh chóng này, việc lựa chọn phương pháp lắp ráp bộ gen hoặc phiên mã cuối cùng phụ thuộc vào nhu cầu của nhà nghiên cứu và đặc điểm của sinh vật đang được nghiên cứu. Mỗi phương pháp đều có ưu và nhược điểm riêng. Các nhà nghiên cứu đã chọn được con đường nghiên cứu phù hợp nhất với nhu cầu của mình chưa?