Dans la recherche génomique moderne, le concept de famille de gènes est non seulement fascinant, mais aussi une clé importante pour comprendre la complexité de la vie. Une famille de gènes est composée de plusieurs gènes similaires qui sont dupliqués à partir d’un seul gène d’origine et ont généralement des fonctions biochimiques similaires. En prenant comme exemple les sous-gènes de l'hème humain, nous pouvons voir que les dix gènes sont divisés en deux groupes, qui existent sur des chromosomes différents et sont appelés loci α-hème et β-hème. On pense que la formation de ces deux groupes de gènes est le résultat d’un événement de duplication génétique survenu il y a environ 500 millions d’années.
Les gènes sont regroupés en familles en fonction de séquences de nucléotides ou de protéines partagées.
Les changements dans les familles de gènes peuvent être affectés par des événements aléatoires d’une part, et peuvent également être le résultat de la sélection naturelle d’autre part. Ces expansions ou contractions familiales rendent souvent difficile pour les chercheurs d’en distinguer les causes. Des études récentes ont combiné des modèles statistiques et des techniques algorithmiques pour identifier les familles de gènes affectées par la sélection naturelle.
La composition et la structure des gènes fournissent un contexte diversifié aux familles de gènes. Les membres d’une famille de gènes peuvent être soit des paralogues, soit des orthologues. Les gènes paralogues sont des gènes ayant des séquences similaires au sein de la même espèce, tandis que les gènes orthologues sont des gènes qui conservent des séquences similaires entre différentes espèces. Ces familles de gènes varient considérablement en taille, en diversité de séquence et en disposition.
En raison de la similitude et du chevauchement des fonctions de ces séquences génétiques, les gènes individuels d’une famille partagent souvent des éléments régulateurs.
Les membres de certaines familles de gènes ont des séquences presque identiques, ce qui permet d’exprimer de grandes quantités de produits génétiques sur une courte période de temps. Les familles de gènes contiennent parfois également des pseudogènes, qui sont des séquences d’ADN similaires aux séquences de gènes établies mais qui ne sont pas fonctionnelles. L’existence de pseudogènes révèle de nombreuses complexités dans le processus d’évolution des gènes.
Les familles de gènes se forment à partir de duplications multiples de gènes ancestraux, suivies de mutations et de diversifications. Les duplications peuvent se produire au sein d’une lignée ou à la suite d’une divergence entre espèces. Ce processus peut conduire à l’expansion des familles de gènes ; par exemple, les humains et les chimpanzés peuvent avoir 15 copies d’un gène dérivé d’un ancêtre commun.
Lors de la formation des familles de gènes, il existe plusieurs niveaux de duplication, notamment la duplication d’exons, la duplication de gènes entiers et la duplication de génomes entiers. La duplication complète du génome doublerait le nombre de copies de chaque gène et de chaque famille de gènes.
L'expansion génétique se produit souvent par le biais d'événements de croisement inégaux au cours de la méiose des cellules germinales.
Ces processus, couplés à la relocalisation des gènes, permettent aux membres des gènes de coexister sur de nombreux chromosomes différents, augmentant encore la diversité génétique.
Les mutations peuvent entraîner des substitutions d’acides aminés par le biais de mutations non synonymes, qui permettent aux versions dupliquées d’un gène d’acquérir de nouvelles fonctions sans nuire à l’organisme. Cette mutation permet aux gènes de se développer en réponse aux pressions environnementales, tout comme les organismes s’adaptent à leur environnement extérieur.
Au cours de l’évolution des génomes, les familles de gènes ont démontré leur rôle majeur dans la biodiversité et l’évolution. Certains gènes peuvent être désactivés en raison de changements environnementaux, tandis que d’autres peuvent être préservés grâce à des mutations bénéfiques. Par exemple, lorsque le stress environnemental est intense, l’expansion des gènes aide les espèces à mieux s’adapter aux changements. À l’inverse, la contraction d’une famille de gènes s’accompagne souvent de l’accumulation de mutations perdant la fonction.
En plus de la classification structurelle basée sur l'évolution, HGNC classe également en fonction de la fonction des gènes, formant ainsi un système de dénomination à plusieurs niveaux. Bien que certains gènes n'aient pas de lien évolutif direct, ils peuvent être classés dans le même groupe parce qu'ils remplissent des fonctions similaires. C'est particulièrement évident dans la recherche sur les gènes du cancer.
En résumé, la superfamille de gènes n’est pas seulement une extension de l’unité de base des organismes, mais indique également le rôle clé des gènes dans la domination de la biodiversité et de son évolution. Alors, à mesure que la génomique se développe, comment l’importance des familles de gènes affectera-t-elle notre compréhension de la vie ?