Trong thời đại dữ liệu ngày nay, phân tích mạng ngày càng được sử dụng nhiều hơn. Cho dù trên phương tiện truyền thông xã hội, mạng lưới kinh doanh hay hệ sinh thái, việc hiểu được điểm tương đồng giữa các nút khác nhau đều quan trọng để thúc đẩy việc ra quyết định và quản lý. Sự tương đồng trong mạng thường xảy ra khi hai nút (hoặc các cấu trúc phức tạp hơn) thuộc cùng một lớp tương đương. Có ba cách tiếp cận cơ bản khi xây dựng số liệu đo lường độ tương đồng của mạng: tương đương cấu trúc, tương đương tự động và tương đương thông thường.
Có một mối quan hệ phân cấp giữa ba loại tương đương này: bất kỳ tập hợp các tương đương về cấu trúc nào cũng vừa là một phép tự đẳng cấu vừa là một tương đương thông thường, và bất kỳ tập hợp các tương đương về phép tự đẳng cấu nào cũng là một tương đương thông thường.
Sự tương đương về cấu trúc có nghĩa là hai nút có cùng hàng xóm và mô hình kết nối giữa chúng hoàn toàn giống nhau. Sự tương đương tự đẳng cấu cho rằng nếu bằng cách dán nhãn lại các nút, có thể tạo ra một đồ thị không thể phân biệt được với đồ thị gốc về khoảng cách, thì hai nút đó là tương đương tự đẳng cấu. Cuối cùng, sự tương đương tổng quát là khi hai nút được coi là tương đương nếu chúng có mối quan hệ với các nút tương tự khác, mặc dù không nhất thiết phải là mối quan hệ trực tiếp.
Trong một mạng, hai đỉnh được coi là tương đương về mặt cấu trúc nếu chúng có nhiều đỉnh lân cận giống nhau. Ví dụ, nếu nút A có một tập hợp kết nối nhất định tới một tập hợp các nút cụ thể, thì các nút khác tương tự như A cũng phải có cùng kiểu kết nối. Sau đây là một số điểm chính về sự tương đương về mặt cấu trúc:
Ví dụ, hai ngân hàng có thể ở gần nhau về mặt địa lý nhưng có mô hình liên kết rất khác nhau và do đó không thể được coi là tương đương về mặt cấu trúc, tuy nhiên chúng có một số điểm tương đồng về cấu trúc vì cả hai đều hoạt động trong cùng một lĩnh vực tài chính. mức độ tương đương về mặt thể chế.
Để đo lường sự tương đương về mặt cấu trúc, chúng ta có thể sử dụng một số chỉ số sau:
Độ tương đồng Cosine
: Tính toán số lượng các nút lân cận chung của hai nút và so sánh nó với bậc của các nút. Hệ số tương quan Pearson
: Đo mức độ giống nhau của hai nút bằng cách so sánh chúng với số lượng các nút lân cận chung có thể xuất hiện trong một mạng ngẫu nhiên. Khoảng cách Euclid
: Mặc dù đây là thước đo sự khác biệt, nhưng nó cung cấp sự hiểu biết trực quan về sự khác biệt giữa các nút. Định nghĩa chính thức của sự tương đương tự đẳng cấu là: nếu tất cả các nút có thể được dán nhãn lại sao cho việc hoán đổi u và v không ảnh hưởng đến khoảng cách của tất cả các nút khác trong đồ thị, thì hai nút là tương đương tự đẳng cấu. Trong sơ đồ tổ chức, điều này rất quan trọng đối với những nhân viên có nhiệm vụ tương tự nhưng không có mối quan hệ trực tiếp.
Trong một tổ chức doanh nghiệp, các vai trò ở văn phòng trung tâm được coi là tương đương tự động nếu chúng có thể hoán đổi cho nhau mà không làm thay đổi mô hình hoạt động chung.
Tương đương tổng quát được định nghĩa như sau: hai nút được coi là tương đương tổng quát nếu chúng có mối quan hệ tương tự với các nút tương tự khác. Đây là một phán đoán lỏng lẻo hơn về sự tương đồng, chẳng hạn như mối quan hệ giữa các bà mẹ trong SES (cấu trúc gia đình), ngay cả khi bạn đời và con cái của họ khác nhau, họ vẫn có mô hình tương tác tương tự với cộng đồng hoặc các thành viên gia đình khác mà họ cùng tham gia.
Sự tương đương tổng quát nhấn mạnh mối quan hệ với các nút tương đương khác thay vì mối quan hệ kề trực tiếp.
Bằng cách hiểu được sự tương đương về mặt cấu trúc, số học và thông thường, chúng ta có thể hiểu rõ hơn về các mô hình cơ bản và điểm tương đồng trong dữ liệu mạng. Điều này không chỉ giúp ích cho nghiên cứu học thuật mà còn cung cấp hướng dẫn cho các ứng dụng thực tế. Bạn có thể tưởng tượng được cách phân tích mạng lưới trong tương lai sẽ tiết lộ thêm những ý nghĩa ẩn giấu trong dữ liệu không?