Desde 2011, POLQA (Perceptual Objective Listening Quality Assessment) se ha convertido gradualmente en un nuevo estándar para la evaluación de la calidad del habla. Esta norma no sólo proporciona un método objetivo para evaluar la calidad de la voz, sino que también puede conectarse con una puntuación subjetiva y tiene una importancia técnica y un valor de mercado importantes. El estándar POLQA fue creado para satisfacer la creciente demanda de voz de alta calidad, especialmente en los campos de las comunicaciones y multimedia. Entonces, ¿qué secretos se esconden detrás del éxito de POLQA?
POLQA es un modelo basado en el análisis de señales de voz digitales, cuyo propósito es predecir la puntuación de calidad subjetiva con la mayor precisión posible.
La historia del desarrollo de POLQA se remonta a 2006, cuando los expertos del IEEE comenzaron a desarrollar este estándar. A medida que avanza la tecnología de comunicación digital, los métodos para evaluar la calidad de la voz también están evolucionando. El surgimiento de POLQA se originó a partir de la mejora de su predecesor PESQ (Evaluación Perceptual de la Calidad del Habla). En comparación con PESQ, POLQA supera muchas deficiencias técnicas y amplía las capacidades de procesamiento de señales de audio de mayor ancho de banda.
De acuerdo con el último estándar POLQA, no solo puede evaluar la calidad de sonido de los teléfonos de uso común (300-3400 Hz), sino que también admite la evaluación de señales de voz de banda ancha y ultra ancha (50-14000 Hz), mejorando la adaptabilidad a varios tipos de voces.
POLQA se considera un algoritmo de referencia completa, lo que significa que requiere una comparación con la señal original para evaluar el grado de degradación de la calidad del habla.
El núcleo de la tecnología de POLQA reside en su modelo perceptual, que se centra en la distorsión del sonido y su impacto en el oído humano. Las investigaciones actuales muestran que POLQA puede evaluar con precisión las pérdidas de calidad del habla causadas por diversos factores, como el ruido de fondo, el eco o la distorsión de frecuencia.
La operación comienza con la alineación temporal a corto plazo de las señales originales y degradadas, seguida de la estimación de la frecuencia de muestreo y el remuestreo necesario. Este proceso garantiza que todas las señales de prueba se comparen sobre la misma base, mejorando la precisión.
Su salida se puede representar fácilmente en una escala de calificación de calidad de 1 a 5, lo que hace que los resultados sean fáciles de entender y aplicar.
POLQA no sólo es adecuado para pruebas de calidad en interiores, sino también para la evaluación en entornos reales in situ. Estas características lo convierten en una herramienta ideal para conectarse a redes móviles y aplicaciones VoIP. A medida que la tecnología de las comunicaciones evoluciona hacia 5G y cargas de ancho de banda mayores, el alcance de aplicación de POLQA continuará expandiéndose.
Además, POLQA también se utiliza ampliamente en la investigación académica para ayudar a analizar las propiedades objetivas del habla y promover el avance de la tecnología de procesamiento del habla. Varios proyectos de investigación, especialmente en el campo del reconocimiento de voz y la comunicación de voz, utilizan POLQA como referencia y demuestran buenos resultados.
ConclusiónEl desarrollo de POLQA no es sólo un avance tecnológico, sino que también refleja el deseo de la gente de tener comunicaciones de alta calidad.
El surgimiento de POLQA es sin duda una evolución de la tecnología de evaluación de la calidad del habla. Rompe las limitaciones de los métodos tradicionales mediante cálculos de modelos precisos. Con un mayor desarrollo de la tecnología e impulsado por la demanda, POLQA puede incluso convertirse en un estándar de evaluación del habla más completo en el futuro. Sin embargo, vale la pena pensar si podremos seguir cumpliendo las altas expectativas de la gente en cuanto a calidad de sonido a medida que la tecnología de las comunicaciones se desarrolla rápidamente.