在科技的進步中,語音通信的質量一直是研究的重點。隨著數字信號分析和語音質量評估技術的發展,POLQA(Perceptual Objective Listening Quality Assessment)作為一項革命性的標準於2011年正式確立。它不僅繼承了PESQ的優勢,更克服了其不足,提出了更高效、更準確的語音質量評估解決方案。
POLQA的出現標誌著語音質量測試的全新時代,將終端用戶的聆聽體驗提升至全新的高度。
POLQA的主要作用在於通過數字語音信號分析來預測語音質量。這一模型旨在使客觀評估的結果能夠接近通過主觀聆聽測試獲得的質量分數,通常這是以平均意見分數(Mean Opinion Score, MOS)形式給出。POLQA的評估依賴於真實語音信號,以確保測試的可靠性和準確性。
POLQA不僅克服了PESQ在高音域信號處理中的弱點,還對不同延遲變化的信號進行了擴展。該標準支持在傳統電話頻帶(300–3400 Hz)內的測量,也支持更高音頻範圍下的HD-Voice信號(50–14000 Hz)。此外,POLQA還針對使用人工頭錄音的聲音信號進行評估,進一步提升了其應用的廣泛性。
POLQA的開發始於2006年,經過多次競爭測試與多家公司的合作,最終形成了2011年正式通過的ITU-T P.863標準。這一過程不僅展示了科學研究中的競爭精神,也彰顯了各方專業知識的整合能力。
每一項技術的進步,都是多方智力共同碰撞的結果,POLQA的誕生就是最佳例證。
POLQA類似於PESQ,作為一種完整參考(Full Reference)算法,它通過將處理後的語音信號與原始信號進行比較來評估語音質量。這一過程不僅分析信號的每個樣本,還高效地對環境變化的影響進行建模。
在POLQA算法中,兩個音頻信號以數據向量的形式輸入,第一個向量是未失真的參考信號,而第二個則是失真的信號。經過一系列的時間對齊和采樣率估計後,算法最終計算出MOS,以便對語音質量進行全面評價。
POLQA的核心模型利用了先進的知覺模型,通過綜合多種失真類型的分析,精確映射到MOS量表上。
POLQA的價值不僅限於技術開發,相關研究已經展現它在語音品質測試中的作用,例如分析語音的語調語言(tone language)影響,及其對非母語人士的聆聽體驗的影響。這為語音通訊技術的進一步發展提供了重要依據。
從PESQ到POLQA,我們見證了一個新的語音質量測評標準的誕生,它不僅代表了技術的進步,更是對用戶體驗的深刻理解和重視。在未來的通訊技術中,我們又能期待哪些創新與突破呢?