Seiring dengan kemajuan ilmu pengetahuan dan teknologi, kualitas komunikasi suara selalu menjadi fokus penelitian. Dengan berkembangnya analisis sinyal digital dan teknologi penilaian kualitas suara, POLQA (Perceptual Objective Listening Quality Assessment) secara resmi ditetapkan pada tahun 2011 sebagai standar revolusioner. Standar ini tidak hanya mewarisi keunggulan PESQ, tetapi juga mengatasi kekurangannya dan mengusulkan solusi penilaian kualitas suara yang lebih efisien dan akurat.
Munculnya POLQA menandai era baru dalam pengujian kualitas suara, yang membawa pengalaman mendengarkan pengguna akhir ke tingkat yang sama sekali baru.
Fungsi utama POLQA adalah untuk memprediksi kualitas suara melalui analisis sinyal suara digital. Model ini bertujuan untuk membawa hasil evaluasi objektif mendekati skor kualitas yang diperoleh melalui uji mendengarkan subjektif, yang biasanya diberikan dalam bentuk Mean Opinion Score (MOS). Evaluasi POLQA mengandalkan sinyal ucapan nyata untuk memastikan keandalan dan keakuratan pengujian.
POLQA tidak hanya mengatasi kelemahan PESQ dalam pemrosesan sinyal frekuensi tinggi, tetapi juga memperluas pemrosesan sinyal untuk berbagai variasi penundaan. Standar ini mendukung pengukuran dalam pita frekuensi telepon tradisional (300–3400 Hz) serta sinyal HD-Voice dalam rentang audio yang lebih tinggi (50–14000 Hz). Selain itu, POLQA juga mengevaluasi sinyal suara yang direkam menggunakan kepala buatan, yang selanjutnya meningkatkan fleksibilitasnya.
Pengembangan POLQA dimulai pada tahun 2006. Setelah beberapa kali uji coba dan kerja sama dengan banyak perusahaan, akhirnya terbentuklah standar ITU-T P.863 yang secara resmi diadopsi pada tahun 2011. Proses ini tidak hanya menunjukkan semangat kompetitif dalam penelitian ilmiah, tetapi juga menyoroti kemampuan untuk mengintegrasikan keahlian semua pihak.
Kemajuan setiap teknologi merupakan hasil dari tabrakan kecerdasan dari banyak pihak. Kelahiran POLQA adalah contoh terbaiknya.
POLQA mirip dengan PESQ. Sebagai algoritme referensi lengkap, POLQA mengevaluasi kualitas ucapan dengan membandingkan sinyal ucapan yang diproses dengan sinyal asli. Proses ini tidak hanya menganalisis setiap sampel sinyal, tetapi juga secara efisien memodelkan dampak perubahan lingkungan.
Dalam algoritma POLQA, dua sinyal audio dimasukkan dalam bentuk vektor data, vektor pertama adalah sinyal referensi yang tidak terdistorsi, dan yang kedua adalah sinyal yang terdistorsi. Setelah serangkaian penyelarasan waktu dan estimasi laju pengambilan sampel, algoritma akhirnya menghitung MOS untuk mengevaluasi kualitas ucapan secara komprehensif.
Model inti POLQA menggunakan model persepsi tingkat lanjut untuk memetakan berbagai jenis distorsi secara akurat ke skala MOS melalui analisis yang komprehensif.
Nilai POLQA tidak terbatas pada pengembangan teknologi. Penelitian terkait telah menunjukkan perannya dalam pengujian kualitas ucapan, seperti menganalisis dampak bahasa nada dari ucapan dan dampaknya pada pengalaman mendengarkan penutur non-asli. Ini memberikan dasar penting untuk pengembangan lebih lanjut teknologi komunikasi suara.
Dari PESQ hingga POLQA, kita telah menyaksikan lahirnya standar evaluasi kualitas suara baru, yang tidak hanya mewakili kemajuan teknologi, tetapi juga pemahaman mendalam dan penekanan pada pengalaman pengguna. Inovasi dan terobosan apa yang dapat kita harapkan dalam teknologi komunikasi masa depan?