Con il progresso della scienza e della tecnologia, la qualità della comunicazione vocale è sempre stata al centro della ricerca. Con lo sviluppo della tecnologia di analisi del segnale digitale e di valutazione della qualità vocale, nel 2011 è stato ufficialmente istituito il POLQA (Perceptual Objective Listening Quality Assessment) come standard rivoluzionario. Non solo eredita i vantaggi del PESQ, ma ne supera anche i difetti e propone una soluzione di valutazione della qualità vocale più efficiente e precisa.
L'avvento del POLQA segna una nuova era nei test della qualità vocale, portando l'esperienza di ascolto dell'utente finale a un livello completamente nuovo.
La funzione principale del POLQA è quella di prevedere la qualità del parlato attraverso l'analisi del segnale vocale digitale. Questo modello mira ad avvicinare i risultati della valutazione oggettiva ai punteggi di qualità ottenuti attraverso test di ascolto soggettivi, solitamente forniti sotto forma di punteggio medio di opinione (MOS). La valutazione del POLQA si basa su segnali vocali reali per garantire l'affidabilità e l'accuratezza del test.
POLQA non solo supera la debolezza del PESQ nell'elaborazione del segnale ad alta frequenza, ma amplia anche l'elaborazione del segnale per diverse variazioni di ritardo. Lo standard supporta misurazioni nella banda di frequenza telefonica tradizionale (300–3400 Hz) e segnali HD-Voice nella gamma audio più alta (50–14000 Hz). Inoltre, POLQA valuta anche i segnali sonori registrati utilizzando una testa artificiale, aumentando ulteriormente la sua versatilità.
Lo sviluppo di POLQA è iniziato nel 2006. Dopo diversi test competitivi e la cooperazione con diverse aziende, alla fine ha formato lo standard ITU-T P.863 che è stato adottato ufficialmente nel 2011. Questo processo non solo dimostra lo spirito competitivo nella ricerca scientifica, ma evidenzia anche la capacità di integrare le competenze di tutte le parti interessate.
Il progresso di ogni tecnologia è il risultato della collisione di intelligence da più parti. La nascita di POLQA è il miglior esempio.
POLQA è simile a PESQ. Come algoritmo di riferimento completo, valuta la qualità del parlato confrontando il segnale vocale elaborato con il segnale originale. Questo processo non solo analizza ogni campione del segnale, ma modella anche in modo efficiente l'impatto dei cambiamenti ambientali.
Nell'algoritmo POLQA, due segnali audio vengono immessi sotto forma di vettori di dati: il primo vettore è il segnale di riferimento non distorto, mentre il secondo è il segnale distorto. Dopo una serie di allineamenti temporali e stime della frequenza di campionamento, l'algoritmo calcola infine MOS per valutare in modo completo la qualità del parlato.
Il modello di base di POLQA utilizza modelli percettivi avanzati per mappare con precisione molteplici tipi di distorsione sulla scala MOS attraverso un'analisi completa.
Il valore di POLQA non si limita allo sviluppo tecnologico. Ricerche correlate hanno dimostrato il suo ruolo nei test sulla qualità del parlato, come l'analisi dell'impatto del linguaggio tonale del parlato e il suo impatto sull'esperienza di ascolto dei parlanti non madrelingua. Ciò costituisce una base importante per l'ulteriore sviluppo della tecnologia della comunicazione vocale.
Da PESQ a POLQA, abbiamo assistito alla nascita di un nuovo standard di valutazione della qualità vocale, che non rappresenta solo un progresso tecnologico, ma anche una profonda comprensione e un'enfasi sull'esperienza dell'utente. Quali innovazioni e progressi possiamo aspettarci nelle future tecnologie della comunicazione?