Trong lĩnh vực xử lý video kỹ thuật số, Thuật toán khớp khối (BMA) đóng một vai trò quan trọng. Thuật toán này chủ yếu được sử dụng để định vị các macroblock phù hợp trong chuỗi khung hình video và mục đích cốt lõi của nó là ước tính chuyển động. Ước tính chuyển động giả định rằng các đối tượng và hình nền trong khung hình video di chuyển theo thời gian, từ đó tạo ra các đối tượng tương ứng trong các khung hình tiếp theo.
Quá trình này có thể phát hiện tình trạng dư thừa tạm thời trong chuỗi video, giúp việc nén video giữa các khung hình hiệu quả hơn.
Khi triển khai thuật toán khớp khối, khung hiện tại được chia thành nhiều khối macro và mỗi khối macro được so sánh với khối tương ứng trong khung trước đó và các khối liền kề của nó. Bằng cách này, một vectơ chuyển động được tạo ra đại diện cho chuyển động của một macroblock từ vị trí này sang vị trí khác. Tóm tắt chuyển động cho tất cả các macroblock là ước tính chuyển động của khung.
Trong quá trình nén video, điều quan trọng là phải chọn phạm vi tìm kiếm phù hợp, được xác định bởi "tham số tìm kiếm" p. Cụ thể, p biểu thị số pixel xung quanh macroblock tương ứng trong khung trước đó. Nếu giá trị của p lớn hơn, điều đó có nghĩa là có thể có các chuyển vị lớn hơn, giúp tìm ra kết quả phù hợp dễ dàng hơn, nhưng điều này cũng có thể dẫn đến độ phức tạp tính toán tăng lên. Nói chung, kích thước macroblock là 16 pixel và giá trị p của vùng tìm kiếm được đặt thành 7 pixel.
Trong quá trình ước tính chuyển động, việc tính toán vectơ hành động một mặt có thể mô tả sự chuyển đổi từ hình ảnh 2D này sang hình ảnh 2D khác, mặt khác, nó cũng có thể dự đoán những thay đổi của hình ảnh thông qua bù chuyển động. Công nghệ này là nền tảng của các tiêu chuẩn nén video như MPEG 1, 2 và 4.
Nén video có thể giảm một cách hiệu quả số bit cần thiết để truyền dữ liệu thông qua ước tính chuyển động, vì việc truyền các hình ảnh khác nhau được mã hóa sẽ hiệu quả hơn so với các khung được mã hóa hoàn toàn.
Tuy nhiên, trong toàn bộ quá trình nén, ước tính chuyển động là hoạt động tốn nhiều chi phí tính toán nhất, vì vậy việc tìm kiếm một thuật toán ước tính chuyển động nhanh và đơn giản về mặt tính toán đã trở thành một yêu cầu quan trọng đối với công nghệ nén video.
Các hàm chi phí được sử dụng phổ biến nhất khi so sánh một macroblock này với một macroblock khác là Sự khác biệt tuyệt đối trung bình (MAD) và Sai số bình phương trung bình (MSE). Các chỉ số này có thể giúp thuật toán đánh giá chất lượng của kết quả khớp:
MAD = 1/N^2 * ∑(i=0 đến n-1) ∑(j=0 đến n-1) |C(i,j) - R(i,j)|
MSE = 1/N^2 * ∑(i=0 đến n-1) ∑(j=0 đến n-1) (C(i,j) - R(i,j))^2 p>
Trong số đó, N đại diện cho kích thước của macroblock và C(i,j) và R(i,j) lần lượt là các pixel trong macroblock hiện tại và macroblock tham chiếu.
Kể từ những năm 1980, nghiên cứu về thuật toán khớp khối đã đạt được tiến bộ đáng kể và nhiều thuật toán hiệu quả đã xuất hiện. Sau đây là phần giới thiệu về một số thuật toán phổ biến:
Thuật toán này tính toán hàm chi phí của từng vị trí trong cửa sổ tìm kiếm và có thể tìm thấy macroblock phù hợp nhất trong khung tham chiếu. Tuy nhiên, chi phí tính toán của nó rất lớn và là thuật toán phức tạp nhất trong tất cả các thuật toán khớp khối.
Thuật toán này dựa trên kim tự tháp hình ảnh được tối ưu hóa để tăng tốc quá trình tìm kiếm đầy đủ và nâng cao hiệu quả.
TSS là một trong những thuật toán khớp khối nhanh ban đầu giúp giảm đáng kể số lượng macroblock cần được đánh giá bằng cách tìm kiếm ở nhiều vị trí.
So với TSS, FSS hoạt động tốt hơn về chi phí tính toán và tỷ lệ tín hiệu trên tạp âm (PSNR) cao nhất, đồng thời cũng sử dụng phương pháp tìm kiếm thiên vị trung tâm.
"Với sự tiến bộ của công nghệ video, việc phát triển các thuật toán khớp khối sẽ ảnh hưởng như thế nào đến sự phát triển của công nghệ nén video trong tương lai?"
Hiệu quả và chất lượng nén video phụ thuộc rất nhiều vào độ chính xác và hiệu quả tính toán của ước tính chuyển động, do đó có liên quan chặt chẽ đến thuật toán khớp khối đã chọn. Vì vậy, việc hiểu được ưu và nhược điểm của các thuật toán khác nhau sẽ có tác động quan trọng đến sự phát triển của công nghệ video trong tương lai. Thuật toán khớp khối sẽ ảnh hưởng như thế nào đến những thay đổi trong tương lai của công nghệ video kỹ thuật số?