Kể từ năm 2011, POLQA (Đánh giá chất lượng nghe khách quan về mặt cảm nhận) đã dần trở thành một tiêu chuẩn mới để đánh giá chất lượng giọng nói. Tiêu chuẩn này không chỉ cung cấp phương pháp khách quan để đánh giá chất lượng giọng nói mà còn có thể kết nối với cách chấm điểm chủ quan và có ý nghĩa kỹ thuật và giá trị thị trường quan trọng. Tiêu chuẩn POLQA được tạo ra để đáp ứng nhu cầu ngày càng tăng về giọng nói chất lượng cao, đặc biệt là trong lĩnh vực truyền thông và đa phương tiện. Vậy, bí mật nào ẩn chứa đằng sau thành công của POLQA?
POLQA là mô hình dựa trên phân tích tín hiệu giọng nói kỹ thuật số, có mục đích là dự đoán điểm chất lượng chủ quan một cách chính xác nhất có thể.
Lịch sử phát triển của POLQA có thể bắt nguồn từ năm 2006, khi các chuyên gia IEEE bắt đầu phát triển tiêu chuẩn này. Khi công nghệ truyền thông kỹ thuật số phát triển, các phương pháp đánh giá chất lượng giọng nói cũng đang phát triển. Sự xuất hiện của POLQA bắt nguồn từ sự cải tiến của PESQ (Đánh giá cảm quan về chất lượng giọng nói) tiền nhiệm của nó. So với PESQ, POLQA khắc phục được nhiều nhược điểm về mặt kỹ thuật và mở rộng khả năng xử lý tín hiệu âm thanh băng thông cao hơn.
Theo tiêu chuẩn POLQA mới nhất, nó không chỉ có thể đánh giá chất lượng âm thanh điện thoại thông dụng (300-3400 Hz) mà còn hỗ trợ đánh giá tín hiệu thoại băng thông rộng và băng thông siêu rộng (50-14000 Hz), cải thiện khả năng thích ứng với nhiều loại giọng nói khác nhau.
POLQA được coi là thuật toán tham chiếu đầy đủ, nghĩa là nó yêu cầu phải so sánh với tín hiệu gốc để đánh giá mức độ suy giảm chất lượng giọng nói.
Cốt lõi của công nghệ POLQA nằm ở mô hình nhận thức, tập trung vào độ méo tiếng và tác động của nó đến tai người. Nghiên cứu hiện tại cho thấy POLQA có thể đánh giá chính xác tình trạng mất chất lượng giọng nói do nhiều yếu tố gây ra, chẳng hạn như tiếng ồn xung quanh, tiếng vang hoặc độ méo tần số.
Hoạt động này bắt đầu bằng việc căn chỉnh thời gian ngắn hạn của tín hiệu gốc và tín hiệu bị suy giảm, sau đó là ước tính tốc độ lấy mẫu và lấy mẫu lại khi cần thiết. Quá trình này đảm bảo rằng tất cả các tín hiệu thử nghiệm đều được so sánh trên cùng một cơ sở, giúp cải thiện độ chính xác.
Đầu ra của nó có thể dễ dàng được ánh xạ lên thang đánh giá chất lượng từ 1 đến 5, giúp kết quả dễ hiểu và dễ áp dụng.
POLQA không chỉ phù hợp cho việc thử nghiệm chất lượng trong nhà mà còn có thể được đánh giá trong môi trường thực tế tại chỗ. Những tính năng này làm cho nó trở thành công cụ lý tưởng để kết nối với mạng di động và ứng dụng VoIP. Khi công nghệ truyền thông phát triển theo hướng 5G và tải băng thông cao hơn, phạm vi ứng dụng của POLQA sẽ tiếp tục mở rộng.
Ngoài ra, POLQA còn được sử dụng rộng rãi trong nghiên cứu học thuật để giúp phân tích các đặc tính khách quan của giọng nói và thúc đẩy sự tiến bộ của công nghệ xử lý giọng nói. Nhiều dự án nghiên cứu, đặc biệt là trong lĩnh vực nhận dạng giọng nói và giao tiếp bằng giọng nói, sử dụng POLQA làm chuẩn mực và chứng minh được kết quả tốt.
Phần kết luậnSự phát triển của POLQA không chỉ là bước tiến công nghệ mà còn phản ánh mong muốn của con người về truyền thông chất lượng cao.
Sự xuất hiện của POLQA chắc chắn là sự phát triển của công nghệ đánh giá chất lượng giọng nói. Nó phá vỡ những hạn chế của các phương pháp truyền thống thông qua các tính toán mô hình chính xác. Với sự phát triển hơn nữa của công nghệ và nhu cầu, POLQA thậm chí có thể trở thành tiêu chuẩn đánh giá giọng nói toàn diện hơn trong tương lai. Tuy nhiên, chúng ta nên cân nhắc xem liệu chúng ta có thể tiếp tục đáp ứng được kỳ vọng cao của mọi người về chất lượng âm thanh khi công nghệ truyền thông phát triển nhanh chóng hay không?