В современном быстро меняющемся мире связи нельзя игнорировать важность качества голосовых вызовов. По мере развития технологий растут и ожидания людей в отношении четких и качественных звонков. Чтобы удовлетворить этот спрос, ITU-T в 2011 году разработал новый стандарт — POLQA (перцептивная объективная оценка качества прослушивания). Эта технология широко используется в различных голосовых приложениях и направлена на прогнозирование качества вызова путем анализа цифровых голосовых сигналов, чтобы предоставить пользователям более удобные условия вызова.
POLQA – это объективная модель измерения качества речи, целью которой является приближение результатов автоматизированных измерений к субъективным оценкам прослушивания.
Основой POLQA являются масштабы тестирования и технические возможности. Согласно стандарту, POLQA подходит не только для традиционных голосовых вызовов, но также расширяет возможности обработки широкополосных аудиосигналов, что делает его адаптируемым к современной богатой и разнообразной коммуникационной среде. POLQA позволяет оценку речевых сигналов больше не ограничиваться узкой полосой частот (300–3400 Гц), но также поддерживает более широкий диапазон речи (50–14000 Гц) и оценку качества звука записей, что еще больше расширяет потенциал ее применения. .
Техническое превосходство POLQA, преемника PEAQ (перцептивной оценки качества звука), заключается не только в том, что он позволяет избежать недостатков PESQ, но и в его способности обрабатывать более широкий диапазон аудиосигналов. В отличие от PESQ, алгоритм POLQA лучше приспособлен для измерения проблем, вызванных изменениями задержки и чувствительными ко времени сигналами. Такая гибкость позволяет ему решать все более сложные задачи современных коммуникационных технологий.
В процессе тестирования POLQA в качестве тестовых стимулов используется реальная речь для проведения комплексной субъективной оценки слуха.
Разработка POLQA началась в 2006 году. После объединения идей многих компаний стандарт был запущен и выпущен в 2011 году. Сегодня POLQA — это не только стандарт, но и инструмент оценки, на который полагаются бесчисленные технические эксперты. Он представляет собой качественное изменение в технологии оценки качества голоса. Его структура состоит из множества сложных модулей, включая алгоритм выравнивания задержки, оценку частоты дискретизации и работу базовой модели.
Согласно соответствующим определениям, POLQA представляет собой алгоритм Full Reference. Это означает, что он сравнивает ухудшенный или обработанный речевой сигнал с исходным сигналом. Разница в каждом образце оценивается как разница в качестве звука, что помогает обеспечить объективную оценку ясности и естественности в контексте разговора.
Алгоритм POLQA фокусируется на анализе временных и частотных отношений между выборками и преобразовании их в средние оценки мнений (MOS). Система рейтингов варьируется от 1 (плохо) до 5 (отлично), чтобы помочь поставщикам услуг связи понять восприятие пользователями качества связи.
Результаты POLQA имитируют субъективные оценки пользователей, что делает его идеальным инструментом оценки качества голоса.
В базовой модели POLQA важным компонентом является модель восприятия. Его цель — имитировать слуховой опыт человека на основе субъективных критериев оценки. Эта модель восприятия предназначена для учета нескольких типов искажений и корректировки оценок на основе слуховой реакции пользователя. По сравнению с обычными речевыми сигналами, POLQA может идеализировать различные звуковые характеристики, чтобы сделать их более реалистичными во время оценки.
С развитием технологий POLQA также нашла множество применений в академических исследованиях. Исследователи использовали этот инструмент для изучения взаимосвязи между качеством речи и слушателями, говорящими на нескольких языках или не носителями языка, что еще больше расширило области его применения.
POLQA — это не только передовой технический стандарт, но и надежное решение для улучшения качества телефонных звонков. Благодаря точной оценке и постоянному совершенствованию POLQA делает наш опыт голосовой связи более понятным. На этом фоне задумываетесь ли вы о том, какие инновационные технологии будут доступны в будущем, которые смогут еще больше улучшить качество наших голосовых вызовов?