Hoy en día, con el creciente desarrollo de la biología y la biotecnología, los científicos son cada vez más conscientes de la importancia de la estructura de las proteínas para revelar su función y su historia evolutiva. Aunque la similitud de secuencia se ha considerado tradicionalmente un método principal para inferir la homología de proteínas, los indicadores de similitud estructural han mostrado una mayor confiabilidad, especialmente cuando se trata de la clasificación de superfamilias de proteínas.
Las superfamilias de proteínas son el grupo más grande para inferir un ancestro común, y esta relación a menudo se infiere a través de la alineación estructural, incluso si no hay una similitud obvia en la secuencia.
La identificación de superfamilias de proteínas se basa en diversos métodos. A través de similitudes estructurales, se pueden identificar muchos miembros proteicos evolutivamente similares, e incluso si son completamente diferentes en secuencia, las funciones y mecanismos catalíticos de estas proteínas aún pueden conservarse.
La estructura se conserva más evolutivamente que la secuencia. Esto significa que incluso proteínas con estructuras muy similares que han pasado por un largo proceso evolutivo pueden tener secuencias de aminoácidos completamente diferentes. Esto es de gran interés en biología porque muchos estudios biológicos se basan en el análisis de secuencias para inferir la función y el origen de las proteínas.
Los elementos estructurales secundarios y las características estructurales terciarias de las proteínas a menudo están altamente conservados, y muchos mecanismos catalíticos también se conservan entre las superfamilias de proteínas, aunque la especificidad del sustrato puede variar ampliamente.
Se estima que alrededor del 66% al 80% de las proteínas eucariotas tienen múltiples dominios, y estos dominios a menudo se mezclan para formar la llamada "arquitectura de dominios". Esto significa que, si bien las comparaciones de secuencias simples pueden no revelar cómo se relacionan estas proteínas, las comparaciones estructurales revelan conexiones implícitas entre ellas.
Las superfamilias de proteínas representan los últimos avances en la comprensión y la investigación de los ancestros comunes por parte de los científicos. Estas superfamilias representan el grupo evolutivo más grande que se puede identificar basándose en evidencia directa, y algunos miembros se encuentran en todos los reinos de la vida, lo que sugiere que los antepasados de estas superfamilias residen en el Último Ancestro Común (LUCA) de toda la vida.
La duplicación de genes (paralelismo) es más común entre miembros de superfamilias que entre proteínas dentro de la misma especie, lo que hace más factible estudiar el origen de los genes a través de correlaciones estructurales.
Por supuesto, aunque la similitud estructural proporciona muchas ideas, en algunos casos las proteínas estructuralmente similares no muestran una similitud de secuencia obvia, lo que hace que la estructura de la proteína sea una prioridad más alta que la secuencia.
Con el avance de la tecnología de investigación de la estructura de las proteínas, la comunidad científica se está dando cuenta gradualmente de la importancia de la estructura para explicar la función, la evolución y la interacción de las proteínas, lo que proporciona información complementaria importante para la genómica. De cara al futuro, al estudiar las miles de proteínas diferentes que existen en el mundo, ¿deberíamos centrarnos más en su estructura que en su secuencia?