Trong lĩnh vực nghiên cứu ung thư, tính không đồng nhất của các mẫu khối u mang lại nhiều thách thức cho việc phân tích dữ liệu. Với sự phát triển nhanh chóng của bộ gen, các nhà nghiên cứu đã bắt đầu sử dụng các phương pháp thống kê mới để hiểu sâu hơn về thành phần của các mẫu khối u và cải thiện độ chính xác của các dự đoán. Trong số đó, phương pháp thống kê DeMix nổi lên theo yêu cầu của thời đại và đã trở thành một công cụ quan trọng để giải mã bản sao ung thư.
DeMix là một phương pháp thống kê dự đoán tỷ lệ có thể xảy ra giữa các mẫu khối u và tế bào cơ địa và sử dụng các mô hình hỗn hợp tuyến tính để chống lại sự không đồng nhất của dữ liệu trong các mẫu khối u.
Các mẫu khối u ở trạng thái rắn thường được lấy từ thực hành lâm sàng và bao gồm nhiều quần thể tế bào khối u vô tính, cũng như các mô bình thường lân cận, mô đệm và các tế bào miễn dịch xâm nhập. Cấu trúc phức tạp này làm cho nhiều phân tích dữ liệu gen trở nên khó khăn và đầy sai lệch. Do đó, điều cực kỳ quan trọng là phải ước tính chính xác độ tinh khiết của khối u, tức là tỷ lệ tế bào ung thư trong mẫu khối u, trước khi phân tích.
Vì có sự khác biệt đáng kể giữa tế bào ung thư và tế bào bình thường nên các nhà nghiên cứu có thể ước tính độ tinh khiết của khối u thông qua dữ liệu gen hoặc biểu sinh thông lượng cao. DeMix là một phương pháp được thiết kế để trích xuất tỷ lệ biểu hiện gen tế bào ung thư và hồ sơ biểu hiện của nó từ các mẫu hỗn hợp.
DeMix giả định rằng mẫu hỗn hợp chỉ bao gồm hai loại tế bào: tế bào ung thư (không có hồ sơ biểu hiện gen đã biết) và tế bào bình thường (có dữ liệu biểu hiện gen đã biết).
Hoạt động cốt lõi của DeMix dựa trên các mô hình hỗn hợp tuyến tính, mô hình hóa dữ liệu để nắm bắt biểu hiện gen của hai loại tế bào trong các mẫu hỗn hợp. Điểm mới của phương pháp này là khả năng phân tích dữ liệu không đồng nhất trước khi dữ liệu được chuyển đổi log, cho phép dự đoán hiệu quả hơn về biểu hiện gen và tỷ lệ tế bào ung thư.
Cụ thể, quy trình làm việc của DeMix có thể được chia thành hai bước chính: bước đầu tiên là tối đa hóa hàm khả năng để giải quyết các thông số tỷ lệ khối u và biểu hiện gen chưa biết của các tế bào bình thường dựa trên dữ liệu quan sát được; Bước này là ước tính mức độ biểu hiện của một cặp tế bào bình thường và tế bào khối u đối với từng mẫu và gen dựa trên tỷ lệ khối u thu được ở bước đầu tiên.
Sự phát triển của phương pháp này dựa trên quy trình tối ưu hóa Nelder-Mead, cho phép tích hợp số lượng mật độ mối nối để đạt được độ chính xác tính toán cần thiết.
Phương pháp DeMix điều chỉnh theo nhiều tình huống dữ liệu khác nhau, cho dù là mẫu trùng khớp có gen tham chiếu hay mẫu chưa khớp không có gen tham chiếu. Tính linh hoạt này cho phép DeMix trở nên hữu ích trong nhiều môi trường nghiên cứu khác nhau.
Mặc dù cần có ít nhất một gen tham chiếu trong mọi trường hợp, nhưng nên sử dụng 5 đến 10 gen để giảm tác động của các gen ngoại lệ và xác định bộ ước tính tỷ lệ khối u tối ưu.
DeMix giả định rằng mẫu hỗn hợp chứa tối đa hai thành phần tế bào: tế bào bình thường và tế bào khối u, đồng thời dựa vào dữ liệu có sẵn để ước tính các thông số phân bố của tế bào bình thường.
Khi công nghệ phân tích dữ liệu tiếp tục phát triển, các phương pháp như DeMix sẽ được sử dụng ngày càng nhiều trong nghiên cứu ung thư. Điều này không chỉ giúp các nhà nghiên cứu khám phá những bí mật đằng sau sự không đồng nhất của khối u mà còn có thể dẫn đến những lựa chọn điều trị mới và mang lại hy vọng lớn hơn cho bệnh nhân ung thư.
Trong thời đại dựa trên dữ liệu như vậy, chúng ta cần suy nghĩ về: Làm cách nào để sử dụng tốt hơn các gen tham chiếu sinh học để cải thiện hiệu quả và độ chính xác của phương pháp điều trị lâm sàng trong nghiên cứu ung thư trong tương lai?