Avec les progrès de la science et de la technologie, la qualité de la communication vocale a toujours été au centre de la recherche. Avec le développement de l’analyse du signal numérique et de la technologie d’évaluation de la qualité de la parole, POLQA (Perceptual Objective Listening Quality Assessment) a été officiellement établi en 2011 en tant que norme révolutionnaire. Il hérite non seulement des avantages du PESQ, mais surmonte également ses défauts et propose une solution d’évaluation de la qualité vocale plus efficace et plus précise.
L’émergence de POLQA marque une nouvelle ère dans les tests de qualité vocale, portant l’expérience d’écoute de l’utilisateur final à un tout autre niveau.
La fonction principale de POLQA est de prédire la qualité de la parole grâce à l’analyse du signal vocal numérique. Ce modèle vise à rapprocher les résultats de l'évaluation objective des scores de qualité obtenus via des tests d'écoute subjectifs, qui sont généralement donnés sous la forme de score moyen d'opinion (MOS). L’évaluation de POLQA s’appuie sur des signaux vocaux réels pour garantir la fiabilité et la précision du test.
POLQA surmonte non seulement la faiblesse du PESQ dans le traitement du signal haute fréquence, mais étend également le traitement du signal pour différentes variations de retard. La norme prend en charge les mesures dans la bande de fréquence téléphonique traditionnelle (300–3 400 Hz) ainsi que les signaux HD-Voice dans la gamme audio supérieure (50–14 000 Hz). De plus, POLQA évalue également les signaux sonores enregistrés à l’aide d’une tête artificielle, augmentant encore sa polyvalence.
Le développement de POLQA a commencé en 2006. Après plusieurs tests compétitifs et une coopération avec plusieurs entreprises, il a finalement formé la norme ITU-T P.863 qui a été officiellement adoptée en 2011. Ce processus démontre non seulement l’esprit de compétition dans la recherche scientifique, mais souligne également la capacité d’intégrer l’expertise de toutes les parties.
L'évolution de chaque technologie est le résultat de la collision d'intelligences provenant de multiples parties. La naissance de POLQA en est le meilleur exemple.
POLQA est similaire à PESQ. En tant qu'algorithme de référence complet, il évalue la qualité de la parole en comparant le signal vocal traité avec le signal d'origine. Ce processus analyse non seulement chaque échantillon du signal, mais modélise également efficacement l’impact des changements environnementaux.
Dans l'algorithme POLQA, deux signaux audio sont entrés sous forme de vecteurs de données, le premier vecteur est le signal de référence non déformé et le second est le signal déformé. Après une série d'alignements temporels et d'estimations du taux d'échantillonnage, l'algorithme calcule finalement le MOS pour évaluer de manière exhaustive la qualité de la parole.
Le modèle de base de POLQA utilise des modèles perceptifs avancés pour mapper avec précision plusieurs types de distorsion à l'échelle MOS grâce à une analyse complète.
La valeur de POLQA ne se limite pas au développement technologique. Des recherches connexes ont démontré son rôle dans les tests de qualité de la parole, notamment l'analyse de l'impact du langage tonal sur la parole et son impact sur l'expérience d'écoute des locuteurs non natifs. Cela constitue une base importante pour le développement ultérieur de la technologie de communication vocale.
De PESQ à POLQA, nous avons assisté à la naissance d’une nouvelle norme d’évaluation de la qualité vocale, qui représente non seulement une avancée technologique, mais également une compréhension approfondie et une emphase sur l’expérience utilisateur. À quelles innovations et avancées pouvons-nous nous attendre dans les futures technologies de communication ?