Trong thế giới giao tiếp phát triển nhanh chóng ngày nay, không thể bỏ qua tầm quan trọng của chất lượng cuộc gọi thoại. Khi công nghệ tiến bộ, kỳ vọng của mọi người về cuộc gọi rõ ràng và chất lượng cao cũng tăng theo. Để đáp ứng nhu cầu này, ITU-T đã phát triển một tiêu chuẩn mới vào năm 2011 - POLQA (Đánh giá chất lượng nghe khách quan theo nhận thức). Công nghệ này được sử dụng rộng rãi trong nhiều ứng dụng thoại khác nhau và nhằm mục đích dự đoán chất lượng cuộc gọi bằng cách phân tích tín hiệu giọng nói kỹ thuật số để mang đến cho người dùng trải nghiệm cuộc gọi thuận lợi hơn.
POLQA là một mô hình khách quan để đo lường chất lượng giọng nói, nhằm mục đích tạo ra kết quả đo tự động gần với điểm nghe chủ quan.
Cốt lõi của POLQA nằm ở phạm vi thử nghiệm và khả năng kỹ thuật. Theo tiêu chuẩn, POLQA không chỉ phù hợp với các cuộc gọi thoại truyền thống mà còn mở rộng khả năng xử lý tín hiệu âm thanh băng thông cao, giúp nó có thể thích ứng với môi trường liên lạc phong phú và đa dạng hiện nay. POLQA cho phép đánh giá tín hiệu giọng nói không còn bị giới hạn ở dải tần hẹp (300-3400 Hz) mà còn hỗ trợ dải giọng nói rộng hơn (50-14000 Hz) và đánh giá chất lượng âm thanh của bản ghi, giúp nâng cao hơn nữa tiềm năng ứng dụng của nó .
Là phiên bản kế thừa của PEAQ (Đánh giá cảm nhận về chất lượng âm thanh), ưu thế kỹ thuật của POLQA không chỉ nằm ở việc tránh được những thiếu sót của PESQ mà còn ở khả năng xử lý nhiều loại tín hiệu âm thanh hơn. Không giống như PESQ, thuật toán POLQA được đào tạo tốt hơn để đo lường các vấn đề do sự thay đổi độ trễ và tín hiệu nhạy cảm với thời gian gây ra. Tính linh hoạt này cho phép nó đáp ứng được những thách thức ngày càng phức tạp của công nghệ truyền thông hiện đại.
Quy trình kiểm tra của POLQA sử dụng lời nói thực làm tác nhân kích thích kiểm tra để tiến hành đánh giá thính giác chủ quan toàn diện.
Sự phát triển của POLQA bắt đầu vào năm 2006. Sau khi thu thập ý tưởng của nhiều công ty, tiêu chuẩn này tiếp tục được đưa ra và phát hành vào năm 2011. Ngày nay, POLQA không chỉ là một tiêu chuẩn mà còn là một công cụ đánh giá được vô số chuyên gia kỹ thuật tin cậy. Nó thể hiện sự thay đổi về chất trong công nghệ đánh giá chất lượng giọng nói. Cấu trúc của nó bao gồm nhiều mô-đun phức tạp, bao gồm thuật toán căn chỉnh độ trễ, ước tính tốc độ mẫu và vận hành mô hình lõi.
Theo các định nghĩa có liên quan, POLQA là thuật toán Tham chiếu đầy đủ. Điều này có nghĩa là nó so sánh tín hiệu giọng nói đã bị suy giảm hoặc đã xử lý với tín hiệu gốc. Sự khác biệt trong mỗi mẫu được tính là sự khác biệt về chất lượng âm thanh, giúp đưa ra góc nhìn khách quan về độ rõ ràng và tự nhiên trong bối cảnh cuộc gọi.
Thuật toán của POLQA tập trung vào việc phân tích mối quan hệ về thời gian và tần suất giữa các mẫu và chuyển đổi chúng thành điểm ý kiến trung bình (MOS). Hệ thống đánh giá dao động từ 1 (kém) đến 5 (xuất sắc) giúp nhà cung cấp dịch vụ viễn thông hiểu được cảm nhận của người dùng về chất lượng cuộc gọi.
Kết quả của POLQA mô phỏng xếp hạng chủ quan của người dùng, khiến POLQA trở thành công cụ đánh giá chất lượng giọng nói lý tưởng.
Trong mô hình cốt lõi của POLQA, mô hình nhận thức là một thành phần quan trọng. Mục đích của nó là mô phỏng trải nghiệm thính giác của con người dựa trên tiêu chí chấm điểm chủ quan. Mô hình nhận thức này được thiết kế để tính đến nhiều loại biến dạng và điều chỉnh điểm số dựa trên phản ứng thính giác của người dùng. So với tín hiệu giọng nói thông thường, POLQA có thể lý tưởng hóa các tính năng âm thanh khác nhau để làm cho chúng trở nên chân thực hơn trong quá trình đánh giá.
Với sự phát triển của công nghệ, POLQA cũng đã cho thấy nhiều ứng dụng trong nghiên cứu học thuật. Các nhà nghiên cứu đã sử dụng công cụ này để khám phá mối quan hệ giữa chất lượng giọng nói và người nghe đa ngôn ngữ hoặc không phải người bản xứ, từ đó mở rộng hơn nữa các lĩnh vực ứng dụng của nó.
POLQA không chỉ là tiêu chuẩn kỹ thuật tiên tiến mà còn cung cấp giải pháp đáng tin cậy để cải thiện chất lượng cuộc gọi điện thoại. Thông qua đánh giá chính xác và cải tiến liên tục, POLQA giúp trải nghiệm giao tiếp bằng giọng nói của chúng tôi trở nên rõ ràng hơn. Trong bối cảnh đó, bạn cũng đang nghĩ về những công nghệ tiên tiến nào sẽ có trong tương lai có thể cải thiện hơn nữa chất lượng cuộc gọi thoại của chúng ta?