Tiết lộ thuật toán khớp khối: Tại sao nén video lại hiệu quả đến vậy?

Trong lĩnh vực xử lý video kỹ thuật số, Thuật toán khớp khối (BMA) đóng một vai trò quan trọng. Thuật toán này chủ yếu được sử dụng để định vị các macroblock phù hợp trong chuỗi khung hình video và mục đích cốt lõi của nó là ước tính chuyển động. Ước tính chuyển động giả định rằng các đối tượng và hình nền trong khung hình video di chuyển theo thời gian, từ đó tạo ra các đối tượng tương ứng trong các khung hình tiếp theo.

Quá trình này có thể phát hiện tình trạng dư thừa tạm thời trong chuỗi video, giúp việc nén video giữa các khung hình hiệu quả hơn.

Khi triển khai thuật toán khớp khối, khung hiện tại được chia thành nhiều khối macro và mỗi khối macro được so sánh với khối tương ứng trong khung trước đó và các khối liền kề của nó. Bằng cách này, một vectơ chuyển động được tạo ra đại diện cho chuyển động của một macroblock từ vị trí này sang vị trí khác. Tóm tắt chuyển động cho tất cả các macroblock là ước tính chuyển động của khung.

Trong quá trình nén video, điều quan trọng là phải chọn phạm vi tìm kiếm phù hợp, được xác định bởi "tham số tìm kiếm" p. Cụ thể, p biểu thị số pixel xung quanh macroblock tương ứng trong khung trước đó. Nếu giá trị của p lớn hơn, điều đó có nghĩa là có thể có các chuyển vị lớn hơn, giúp tìm ra kết quả phù hợp dễ dàng hơn, nhưng điều này cũng có thể dẫn đến độ phức tạp tính toán tăng lên. Nói chung, kích thước macroblock là 16 pixel và giá trị p của vùng tìm kiếm được đặt thành 7 pixel.

Động lực

Trong quá trình ước tính chuyển động, việc tính toán vectơ hành động một mặt có thể mô tả sự chuyển đổi từ hình ảnh 2D này sang hình ảnh 2D khác, mặt khác, nó cũng có thể dự đoán những thay đổi của hình ảnh thông qua bù chuyển động. Công nghệ này là nền tảng của các tiêu chuẩn nén video như MPEG 1, 2 và 4.

Nén video có thể giảm một cách hiệu quả số bit cần thiết để truyền dữ liệu thông qua ước tính chuyển động, vì việc truyền các hình ảnh khác nhau được mã hóa sẽ hiệu quả hơn so với các khung được mã hóa hoàn toàn.

Tuy nhiên, trong toàn bộ quá trình nén, ước tính chuyển động là hoạt động tốn nhiều chi phí tính toán nhất, vì vậy việc tìm kiếm một thuật toán ước tính chuyển động nhanh và đơn giản về mặt tính toán đã trở thành một yêu cầu quan trọng đối với công nghệ nén video.

Các chỉ số đánh giá

Các hàm chi phí được sử dụng phổ biến nhất khi so sánh một macroblock này với một macroblock khác là Sự khác biệt tuyệt đối trung bình (MAD) và Sai số bình phương trung bình (MSE). Các chỉ số này có thể giúp thuật toán đánh giá chất lượng của kết quả khớp:

MAD = 1/N^2 * ∑(i=0 đến n-1) ∑(j=0 đến n-1) |C(i,j) - R(i,j)|

MSE = 1/N^2 * ∑(i=0 đến n-1) ∑(j=0 đến n-1) (C(i,j) - R(i,j))^2

Trong số đó, N đại diện cho kích thước của macroblock và C(i,j) và R(i,j) lần lượt là các pixel trong macroblock hiện tại và macroblock tham chiếu.

Thuật toán

Kể từ những năm 1980, nghiên cứu về thuật toán khớp khối đã đạt được tiến bộ đáng kể và nhiều thuật toán hiệu quả đã xuất hiện. Sau đây là phần giới thiệu về một số thuật toán phổ biến:

1. Tìm kiếm toàn diện

Thuật toán này tính toán hàm chi phí của từng vị trí trong cửa sổ tìm kiếm và có thể tìm thấy macroblock phù hợp nhất trong khung tham chiếu. Tuy nhiên, chi phí tính toán của nó rất lớn và là thuật toán phức tạp nhất trong tất cả các thuật toán khớp khối.

2. So khớp khối phân cấp được tối ưu hóa (OHBM)

Thuật toán này dựa trên kim tự tháp hình ảnh được tối ưu hóa để tăng tốc quá trình tìm kiếm đầy đủ và nâng cao hiệu quả.

3. Tìm kiếm ba bước (TSS)

TSS là một trong những thuật toán khớp khối nhanh ban đầu giúp giảm đáng kể số lượng macroblock cần được đánh giá bằng cách tìm kiếm ở nhiều vị trí.

4. Tìm kiếm bốn bước (FSS)

So với TSS, FSS hoạt động tốt hơn về chi phí tính toán và tỷ lệ tín hiệu trên tạp âm (PSNR) cao nhất, đồng thời cũng sử dụng phương pháp tìm kiếm thiên vị trung tâm.

"Với sự tiến bộ của công nghệ video, việc phát triển các thuật toán khớp khối sẽ ảnh hưởng như thế nào đến sự phát triển của công nghệ nén video trong tương lai?"

Hiệu quả và chất lượng nén video phụ thuộc rất nhiều vào độ chính xác và hiệu quả tính toán của ước tính chuyển động, do đó có liên quan chặt chẽ đến thuật toán khớp khối đã chọn. Vì vậy, việc hiểu được ưu và nhược điểm của các thuật toán khác nhau sẽ có tác động quan trọng đến sự phát triển của công nghệ video trong tương lai. Thuật toán khớp khối sẽ ảnh hưởng như thế nào đến những thay đổi trong tương lai của công nghệ video kỹ thuật số?

Trending Knowledge

nan
<Tiêu đề> </Tiêu đề> Trong thế giới xử lý hình ảnh kỹ thuật số, chúng tôi liên tục khám phá cách làm cho hình ảnh sinh động và mượt mà hơn. Công nghệ nội suy song tuyến, là một trong những công cụ c
Sự kỳ diệu của ước tính chuyển động: làm thế nào để theo dõi chính xác chuyển động của từng pixel?
Trong hình ảnh video kỹ thuật số, ước tính chuyển động là một công nghệ quan trọng nhằm tìm ra đường chuyển động chính xác cho các vật thể và nền trong mỗi khung hình ảnh. Công nghệ này cho phép chúng
Thế giới rộng lớn của các khối macro nhỏ: Làm thế nào để giải mã toàn bộ video thành 16x16 pixel?!
Trong bối cảnh nén video kỹ thuật số, thuật toán khớp khối đã trở thành công nghệ cốt lõi của việc ước tính chuyển động. Giả định cơ bản của thuật toán là trong các khung hình video liền kề, các mẫu c
Tại sao thuật toán tìm kiếm đầy đủ lại tốn thời gian như vậy? Khám phá bí mật tính toán của công nghệ nén video!
Trong lĩnh vực nén video kỹ thuật số, việc tìm các macroblock phù hợp là một quá trình cực kỳ quan trọng. Trong quá trình này, các thuật toán tìm kiếm đầy đủ được sử dụng rộng rãi trong nhiệm vụ ước t

Responses