암 연구 분야에서 종양 샘플의 이질성은 데이터 분석에 많은 과제를 안겨줍니다. 유전체학의 급속한 발전으로 연구자들은 종양 샘플의 구성을 더 깊이 이해하고 예측의 정확도를 높이기 위해 새로운 통계적 방법을 채택하기 시작했습니다. 그 중 통계적 방법인 DeMix가 등장하여 암 전사체 분해를 위한 중요한 도구가 되었습니다.
DeMix는 샘플에서 종양 세포와 기질 세포의 가능한 비율을 예측하는 통계적 방법으로, 선형 혼합 모델을 사용하여 종양 샘플의 데이터 이질성을 해결합니다.
고형 종양 샘플은 종종 임상 실무에서 유래되며, 여러 클론성 종양 세포 집단과 인접한 정상 조직, 기질 및 침윤성 면역 세포로 구성됩니다. 이러한 복잡한 구조 때문에 많은 유전체학 데이터 분석이 어렵고 편향이 심합니다. 따라서 분석에 앞서 종양의 순도, 즉 종양 샘플 내 암세포의 비율을 정확하게 추정하는 것이 매우 중요합니다.
암세포는 정상세포와 상당히 다르기 때문에 연구자들은 고처리량 게놈 또는 에피게놈 데이터를 사용하여 종양의 순도를 추정할 수 있습니다. DeMix는 혼합된 샘플에서 암세포 유전자 발현 비율과 발현 프로필을 추출하는 방법입니다.
DeMix는 혼합 샘플이 두 가지 세포 유형, 즉 암 세포(알려진 유전자 발현 프로필 없음)와 정상 세포(알려진 유전자 발현 데이터 있음)로만 구성된다고 가정합니다.
DeMix의 핵심 작동은 선형 혼합 모델을 기반으로 하며, 이는 혼합 샘플에서 두 가지 유형의 세포의 유전자 발현을 데이터를 모델링하여 포착하는 것입니다. 이 방법의 혁신적인 점은 데이터를 로그 변환하기 전에 이기종 데이터를 분석하여 암세포의 유전자 발현과 비율을 더욱 효과적으로 예측할 수 있다는 것입니다.
특히 DeMix의 작업 흐름은 두 가지 주요 단계로 나눌 수 있습니다. 첫 번째 단계는 관찰된 데이터를 기반으로 우도 함수를 최대화하여 정상 세포의 알려지지 않은 종양 비율과 유전자 발현 매개변수를 해결하는 것입니다. 두 번째 단계는 관찰된 데이터를 기반으로 우도 함수를 최대화하여 알려지지 않은 종양 비율과 정상 세포의 유전자 발현 매개변수를 해결합니다. 다음 단계는 종양에 기반하여 각 샘플과 유전자에 대한 정상 세포와 종양 세포 쌍의 발현 수준을 추정하는 것입니다. 첫 번째 단계에서 얻은 비율.
이 방법의 개발은 Nelder-Mead 최적화 절차에 기반을 두고 있으며, 이를 통해 관절 밀도의 수치적 적분을 통해 필요한 계산 정확도를 달성할 수 있습니다.
DeMix 방법은 참조 유전자가 있는 매칭된 샘플이든 참조 유전자가 없는 매칭되지 않은 샘플이든 다양한 데이터 시나리오에 맞게 조정됩니다. 이러한 유연성 덕분에 DeMix는 다양한 연구 환경에서 역할을 수행할 수 있습니다.
모든 경우에 최소한 하나의 참조 유전자가 필요하지만, 이상치의 영향을 줄이고 최적의 종양 비율 추정치를 파악하기 위해 5~10개의 유전자를 사용하는 것이 좋습니다.DeMix는 혼합된 샘플에 정상 세포와 종양 세포라는 최대 두 개의 세포 구성 요소가 포함되어 있다고 가정하고, 사용 가능한 데이터에 의존하여 정상 세포의 분포 매개변수를 추정합니다.
데이터 분석 기술이 계속 발전함에 따라 DeMix와 같은 방법이 암 연구에서 더욱 널리 사용될 것입니다. 이를 통해 연구자들은 종양 이질성의 비밀을 밝혀낼 수 있을 뿐만 아니라, 새로운 치료 옵션을 개발하여 암 환자들에게 더 큰 희망을 안겨줄 수도 있습니다.
이렇게 데이터 중심적인 시대에 우리는 다음 사항을 생각해야 합니다. 미래의 암 연구에서 생물학적 참조 유전자를 어떻게 더 잘 활용하여 임상 치료의 효과와 정확성을 개선할 수 있을까요?