À l’ère actuelle des données, l’analyse de réseau est de plus en plus utilisée. Qu'il s'agisse des médias sociaux, des réseaux d'entreprise ou des écosystèmes, il est important de comprendre les similitudes entre les différents nœuds pour orienter la prise de décision et la gestion. La similarité dans les réseaux se produit généralement lorsque deux nœuds (ou d’autres structures plus complexes) appartiennent à la même classe d’équivalence. Il existe trois approches de base lors de la création de mesures de similarité de réseau : l’équivalence structurelle, l’équivalence d’automorphisme et l’équivalence conventionnelle.
Il existe une relation hiérarchique entre ces trois types d'équivalence : tout ensemble d'équivalences structurelles est également à la fois un automorphisme et une équivalence conventionnelle, et tout ensemble d'équivalences d'automorphismes est également une équivalence conventionnelle.
L'équivalence structurelle signifie que deux nœuds ont les mêmes voisins et que les modèles de connexion entre eux sont exactement les mêmes. L'équivalence d'automorphisme soutient que si en réétiquetant les nœuds, un graphe peut être généré qui est indiscernable de l'original en termes de distance, alors les deux nœuds sont automorphiquement équivalents. Enfin, l’équivalence générale se produit lorsque deux nœuds sont considérés comme équivalents s’ils ont une relation avec d’autres nœuds similaires, bien que ce ne soit pas nécessairement une relation directe.
Dans un réseau, deux sommets sont structurellement équivalents s'ils partagent de nombreux voisins identiques. Par exemple, si le nœud A possède un certain ensemble de connexions à un ensemble particulier de nœuds, alors d’autres nœuds similaires à A doivent également avoir le même modèle de connexion. Voici quelques points clés sur l’équivalence structurelle :
Par exemple, deux banques peuvent être géographiquement proches mais avoir des modèles de liens très différents et ne peuvent donc pas être considérées comme structurellement équivalentes, bien qu'elles présentent une certaine similitude structurelle car elles opèrent toutes deux dans le même secteur financier. degré d'équivalence institutionnelle.
Pour la mesure de l'équivalence structurelle, nous pouvons utiliser plusieurs indicateurs :
Similitude cosinus
: calcule le nombre de voisins communs de deux nœuds et le compare au degré des nœuds. Coefficient de corrélation de Pearson
: mesure la similarité de deux nœuds en les comparant au nombre de voisins communs qui apparaîtraient dans un réseau aléatoire. Distance euclidienne
: bien qu’il s’agisse d’une mesure de dissimilarité, elle fournit une compréhension intuitive des différences entre les nœuds. La définition formelle de l'équivalence d'automorphisme est : si tous les nœuds peuvent être réétiquetés de sorte que l'échange de u et v n'affecte pas les distances de tous les autres nœuds du graphe, alors deux nœuds sont équivalents en automorphisme. Dans un organigramme, cela est important pour les employés qui ont des tâches similaires mais qui ne partagent pas de relation directe.
Dans une organisation d'entreprise, les rôles au sein du bureau central sont automorphiquement équivalents s'ils peuvent être interchangés sans modifier le modèle opérationnel global.
L'équivalence générale est définie comme suit : deux nœuds sont considérés comme équivalents généraux s'ils ont des relations similaires avec d'autres nœuds similaires. Il s’agit d’un jugement plus lâche de similitude, comme la relation entre les mères au sein du SES (structure familiale), même si leurs partenaires et leurs enfants sont différents, elles ont des modèles d’interaction similaires avec la communauté ou d’autres membres de la famille auxquels elles participent ensemble.
L’équivalence générale met l’accent sur la relation avec d’autres nœuds équivalents plutôt que sur la relation d’adjacence directe.
En comprenant l’équivalence structurelle, arithmétique et conventionnelle, nous pouvons acquérir une compréhension plus complète des modèles et des similitudes sous-jacents dans les données du réseau. Cela aide non seulement la recherche universitaire, mais fournit également des orientations pour les applications pratiques. Pouvez-vous imaginer comment les futures analyses de réseau révéleront davantage les significations cachées des données ?