Oggi, con il crescente sviluppo della biologia e della biotecnologia, gli scienziati sono sempre più consapevoli dell’importanza della struttura delle proteine nel rivelarne la funzione e la storia evolutiva. Sebbene la somiglianza di sequenza sia stata tradizionalmente considerata un metodo primario per dedurre l'omologia delle proteine, gli indicatori di somiglianza strutturale hanno mostrato una maggiore affidabilità, soprattutto quando si tratta della classificazione delle superfamiglie di proteine.
Le superfamiglie proteiche rappresentano il raggruppamento più numeroso da cui dedurre un antenato comune e questa relazione viene spesso dedotta attraverso l'allineamento strutturale, anche se non vi è alcuna somiglianza evidente nella sequenza.
L'identificazione delle superfamiglie proteiche si basa su una varietà di metodi. Attraverso somiglianze strutturali, è possibile identificare molti membri proteici evolutivamente simili e, anche se sono completamente diversi nella sequenza, le funzioni e i meccanismi catalitici di queste proteine possono ancora essere conservati.
La struttura è più conservata evolutivamente della sequenza. Ciò significa che anche proteine con strutture molto simili che hanno subito un lungo processo evolutivo possono avere sequenze di aminoacidi completamente diverse. Ciò è di grande interesse in biologia perché molti studi biologici si basano sull'analisi delle sequenze per dedurre la funzione e l'origine delle proteine.
Gli elementi strutturali secondari e le caratteristiche strutturali terziarie delle proteine sono spesso altamente conservati e molti meccanismi catalitici sono conservati anche nelle superfamiglie di proteine, anche se la specificità del substrato può variare ampiamente.
Si stima che circa dal 66% all'80% delle proteine eucariotiche abbiano più domini e questi domini sono spesso mescolati insieme per formare la cosiddetta "architettura del dominio". Ciò significa che mentre semplici confronti di sequenze potrebbero non rivelare come queste proteine sono correlate, i confronti strutturali rivelano connessioni implicite tra di loro.
Le superfamiglie proteiche rappresentano gli ultimi progressi nella comprensione e nella ricerca degli antenati comuni da parte degli scienziati. Queste superfamiglie rappresentano il più grande gruppo evolutivo che può essere identificato sulla base di prove dirette, con alcuni membri presenti in tutti i regni della vita, suggerendo che gli antenati di queste superfamiglie risiedono nell'Ultimo Antenato Comune (LUCA) di tutta la vita.
La duplicazione dei geni (parallelismo) è più comune tra i membri della superfamiglia che tra le proteine della stessa specie, rendendo più fattibile studiare l'origine dei geni attraverso correlazioni strutturali.
Naturalmente, sebbene la somiglianza strutturale fornisca molte informazioni, in alcuni casi proteine strutturalmente simili non mostrano un'evidente somiglianza di sequenza, il che rende ulteriormente la struttura proteica una priorità più alta rispetto alla sequenza.
Con il progresso della tecnologia di ricerca sulla struttura delle proteine, la comunità scientifica sta gradualmente realizzando l'importanza della struttura nello spiegare la funzione, l'evoluzione e l'interazione delle proteine, il che fornisce importanti informazioni supplementari per la genomica. Andando avanti, quando studieremo le migliaia di proteine diverse nel mondo, dovremmo concentrarci più sulla loro struttura che sulla loro sequenza?