科学技術の進歩に伴い、音声通信の品質は常に研究の焦点となってきました。隨著數字信號分析和語音質量評估技術的發展,POLQA(Perceptual Objective Listening Quality Assessment)作為一項革命性的標準於2011年正式確立。 PESQ の利点を継承するだけでなく、欠点も克服し、より効率的で正確な音声品質評価ソリューションを提案します。
POLQA の登場により、音声品質テストに新たな時代が到来し、エンドユーザーのリスニング体験がまったく新しいレベルに引き上げられました。
POLQA の主な機能は、デジタル音声信号分析を通じて音声品質を予測することです。這一模型旨在使客觀評估的結果能夠接近通過主觀聆聽測試獲得的質量分數,通常這是以平均意見分數(Mean Opinion Score, MOS)形式給出。 POLQA の評価は、テストの信頼性と正確性を確保するために実際の音声信号に依存しています。
POLQA は、高周波信号処理における PESQ の弱点を克服するだけでなく、さまざまな遅延変動に対する信号処理を拡張します。この規格は、従来の電話周波数帯域 (300~3400 Hz) での測定だけでなく、高音域 (50~14000 Hz) での HD-Voice 信号もサポートします。さらに、POLQA は人工頭部を使用して録音された音声信号も評価するため、汎用性がさらに高まります。
POLQA的開發始於2006年,經過多次競爭測試與多家公司的合作,最終形成了2011年正式通過的ITU-T P.863標準。このプロセスは、科学研究における競争心を示すだけでなく、すべての関係者の専門知識を統合する能力も強調します。
あらゆる技術の進歩は、複数の関係者の知恵の衝突の結果です。POLQA の誕生はその最たる例です。
POLQA は PESQ に似ています。完全な参照アルゴリズムとして、処理された音声信号と元の信号を比較して音声品質を評価します。このプロセスでは、信号の各サンプルを分析するだけでなく、環境の変化の影響を効率的にモデル化します。
POLQA アルゴリズムでは、2 つのオーディオ信号がデータ ベクトルの形式で入力されます。最初のベクトルは歪みのない参照信号であり、2 番目のベクトルは歪んだ信号です。一連の時間調整とサンプリング レートの推定の後、アルゴリズムは最終的に MOS を計算して音声品質を総合的に評価します。
POLQA のコア モデルは、高度な知覚モデルを使用して、包括的な分析を通じて複数の歪みタイプを MOS スケールに正確にマッピングします。
POLQA の価値は、技術開発だけにとどまりません。関連研究では、音声のトーン言語の影響や、非ネイティブ話者のリスニング体験への影響の分析など、音声品質テストにおけるその役割が実証されています。これは、音声通信技術のさらなる発展のための重要な基盤となります。
PESQ から POLQA まで、私たちは新しい音声品質評価規格の誕生を目の当たりにしてきました。これは、技術の進歩を表すだけでなく、ユーザー エクスペリエンスに対する深い理解と重視を表しています。将来の通信技術にはどのような革新と進歩が期待できるでしょうか?