En el campo de la investigación del cáncer, la heterogeneidad de las muestras de tumores plantea muchos desafíos para el análisis de datos. Con el rápido desarrollo de la genómica, los investigadores han comenzado a adoptar nuevos métodos estadísticos para obtener una comprensión más profunda de la composición de las muestras de tumores y mejorar la precisión de las predicciones. Entre ellos, surgió el método estadístico DeMix, que se convirtió en una herramienta importante para la deconvolución del transcriptoma del cáncer.
DeMix es un método estadístico que predice la proporción probable de células tumorales y estromales en una muestra y utiliza un modelo mixto lineal para combatir la heterogeneidad de datos en muestras tumorales.
Las muestras de tumores sólidos a menudo se derivan de la práctica clínica y están compuestas de múltiples poblaciones de células tumorales clonales, así como de tejido normal adyacente, estroma y células inmunes infiltradas. Esta estructura compleja hace que muchos análisis de datos genómicos sean difíciles y estén plagados de sesgos. Por lo tanto, antes del análisis, es extremadamente importante estimar con precisión la pureza del tumor, es decir, el porcentaje de células cancerosas en la muestra del tumor.
Dado que las células cancerosas difieren significativamente de las células normales, los investigadores pueden estimar la pureza de un tumor utilizando datos genómicos o epigenómicos de alto rendimiento. DeMix es un método que tiene como objetivo extraer la relación entre la expresión genética de las células cancerosas y su perfil de expresión a partir de muestras mixtas.
DeMix supone que la muestra mixta consta de sólo dos tipos de células: células cancerosas (sin perfil de expresión genética conocido) y células normales (con datos de expresión genética conocidos).
El funcionamiento principal de DeMix se basa en modelos mixtos lineales, que capturan la expresión genética de dos tipos de células en una muestra mixta mediante el modelado de los datos. La innovación de este método es que analiza datos heterogéneos antes de transformarlos logarítmicamente, lo que puede predecir de forma más efectiva la expresión y las proporciones genéticas en las células cancerosas.
En concreto, el flujo de trabajo de DeMix se puede dividir en dos pasos principales: el primer paso es maximizar la función de probabilidad en función de los datos observados para resolver las proporciones desconocidas del tumor y los parámetros de expresión genética de las células normales; el segundo paso es maximizar la función de verosimilitud en función de los datos observados para resolver las proporciones desconocidas del tumor y los parámetros de expresión genética de las células normales; El siguiente paso es estimar el nivel de expresión de un par de células normales y células tumorales para cada muestra y gen en función del tumor. relación obtenida en el primer paso.
El desarrollo de este método se basa en el procedimiento de optimización Nelder-Mead, que permite la integración numérica de la densidad conjunta para lograr la precisión computacional requerida.
DeMix supone que la muestra mixta contiene como máximo dos componentes celulares: células normales y células tumorales, y se basa en los datos disponibles para estimar los parámetros de distribución de las células normales.
A medida que la tecnología de análisis de datos continúa avanzando, métodos como DeMix se utilizarán más ampliamente en la investigación del cáncer. Esto no sólo ayudará a los investigadores a desentrañar los secretos detrás de la heterogeneidad tumoral, sino que también puede dar lugar a nuevas opciones de tratamiento, aportando mayor esperanza a los pacientes con cáncer.
En una era basada en datos, debemos pensar en: en la investigación futura sobre el cáncer, ¿cómo podemos utilizar mejor los genes de referencia biológica para mejorar la eficacia y la precisión del tratamiento clínico?