Trong lĩnh vực máy học ngày nay, Mạng lưới niềm tin sâu sắc (DBN) chắc chắn là một khái niệm mang tính cách mạng. Là một mô hình đồ họa tổng quát, hay một loại mạng nơ-ron sâu, DBN bao gồm nhiều lớp biến tiềm ẩn (được gọi là các đơn vị ẩn). Giữa mỗi lớp có các kết nối nhưng các đơn vị trong cùng một lớp không được kết nối với nhau. Tính năng này cho phép DBN tìm hiểu và xây dựng lại phân bố xác suất của dữ liệu đầu vào mà không cần giám sát.
Quá trình học DBN có thể được chia thành hai bước chính. Đầu tiên, thông qua cấu trúc nhiều lớp, DBN đóng vai trò là bộ phát hiện tính năng cho việc học không giám sát; sau đó, các lớp này có thể được đào tạo thêm để đào tạo có giám sát nhằm đạt được mục đích phân loại. Điều đáng chú ý là các thành phần cốt lõi của DBN là một số mạng không được giám sát đơn giản, chẳng hạn như Máy Boltzmann bị hạn chế (RBM) hoặc bộ mã hóa tự động. Lớp ẩn của mỗi mạng con trực tiếp đóng vai trò là lớp Hiển thị.
"Cấu trúc xếp chồng từng lớp này cho phép DBN được điều chỉnh từng lớp một bằng quy trình đào tạo nhanh chóng không cần giám sát."
Phương pháp đào tạo DBN chủ yếu được thực hiện thông qua RBM. Phương pháp đào tạo này được gọi là Phân kỳ tương phản (CD) do Geoffrey Hinton đề xuất. Để xấp xỉ phương pháp khả năng tối đa lý tưởng, CD tìm hiểu và cập nhật các trọng số. Khi huấn luyện một RBM đơn lẻ, độ dốc giảm dần được sử dụng để cập nhật các trọng số và xác suất dựa trên vectơ hiển thị của nó được mô hình hóa theo hàm năng lượng.
"Các trọng số được cập nhật thông qua phương pháp phân kỳ so sánh, phương pháp này đã chứng minh tính hiệu quả trong ứng dụng thực tế."
Trong quá trình huấn luyện, đơn vị hiển thị ban đầu được đặt làm vectơ huấn luyện và sau đó trạng thái của đơn vị ẩn được cập nhật dựa trên đơn vị hiển thị. Sau khi các đơn vị ẩn được cập nhật, các đơn vị hiển thị sẽ được xây dựng lại dựa trên trạng thái của các đơn vị ẩn. Quá trình này được gọi là "bước tái thiết". Sau đó, dựa trên các đơn vị hiển thị được xây dựng lại, các đơn vị ẩn được cập nhật lại để hoàn thành một vòng huấn luyện.
Khi một RBM được huấn luyện, một RBM khác sẽ được xếp chồng lên trên nó và lớp hiển thị mới sẽ được lấy từ đầu ra huấn luyện của lớp trước đó. Chu kỳ này lặp lại cho đến khi đáp ứng được điều kiện dừng đặt trước. Mặc dù phương pháp phân kỳ tương phản có thể không phải là phương pháp xấp xỉ chính xác về khả năng tối đa nhưng nó khá hiệu quả trong thực nghiệm.
Ngày nay, DBN được sử dụng rộng rãi trong nhiều ứng dụng và tình huống trong thế giới thực, bao gồm các lĩnh vực như phân tích điện não đồ và khám phá thuốc. Đặc điểm học sâu của nó cho phép DBN nắm bắt cấu trúc phân cấp trong dữ liệu phức tạp và trích xuất các tính năng có ý nghĩa.
"Sự xuất hiện của mô hình này đã thúc đẩy hơn nữa sự phát triển của công nghệ deep learning và mở rộng phạm vi thực tế của nó."
Nói chung, mạng lưới niềm tin sâu sắc, với cấu trúc và phương pháp đào tạo độc đáo, không chỉ cung cấp cơ chế học tính năng mạnh mẽ mà còn mở đường cho sự phát triển trí tuệ nhân tạo trong tương lai. Khi công nghệ tiếp tục phát triển, công nghệ này sẽ ảnh hưởng như thế nào đến cuộc sống và công việc của chúng ta?