Jump to content

Перцептивная оценка качества речи

(Перенаправлено с PESQ )

Перцептивная оценка качества речи ( PESQ ) — это семейство стандартов, включающее методологию тестирования для автоматизированной оценки качества речи с точки зрения пользователя телефонной системы. Он был стандартизирован как Рекомендация ITU-T P.862. [1] в 2001 году. PESQ используется для объективного тестирования качества голосовой связи производителями телефонов, поставщиками сетевого оборудования и операторами связи. Для его использования требуется лицензия. Первое издание преемника PESQ POLQA (Рекомендация ITU-T P.863). [2] ) вступило в силу в 2011 году.

Область измерения

[ редактировать ]

PESQ был разработан для моделирования субъективных тестов, обычно используемых в телекоммуникациях (например, Рекомендация МСЭ-Т P.800) для оценки качества голоса, воспринимаемого людьми. Следовательно, в качестве тестовых сигналов он использует настоящие голосовые образцы. Чтобы охарактеризовать качество прослушивания, воспринимаемое пользователями, первостепенное значение имеет загрузка современного телекоммуникационного оборудования речевыми сигналами. Многие системы оптимизированы для работы с речью и могут непредсказуемым образом реагировать на неречевые сигналы (например, тональные сигналы, шум). Рекомендации по правильному использованию образцов голосовых тестов определены в руководстве по применению PESQ, содержащемся в Рекомендации МСЭ-Т P.862.3. [3]

[ редактировать ]

Семейство полных эталонных объективных измерений качества голоса ITU-T началось в 1997 году с Рекомендации ITU-T P.861 (PSQM), которая была заменена ITU-T P.862 (PESQ). [1] в 2001 году. Позже P.862 был дополнен Рекомендациями ITU-T P.862.1. [4] (сопоставление оценок PESQ со шкалой MOS), ITU-T P.862.2 [5] (широкополосные измерения) и ITU-T P.862.3 [3] (руководство по применению). Первое издание ITU-T P.863 ( POLQA ) [2] вступило в силу в 2011 году. Руководство по применению Рекомендации МСЭ-Т P.863 было утверждено в 2019 году и опубликовано как МСЭ-Т P.863.1. [6]

Помимо перечисленных выше полных эталонных методов, список стандартов объективного измерения качества голоса ITU-T также включает ITU-T P.563. [7] (безреферентный алгоритм).

Типология тестирования

[ редактировать ]

В зависимости от информации, предоставляемой алгоритму, алгоритмы тестирования качества речи можно разделить на две основные категории:

  • Алгоритм «полного эталона» (FR) имеет доступ к исходному эталонному сигналу и использует его для сравнения (т. е. анализа различий). Он может сравнивать каждую выборку опорного сигнала (сторона говорящего) с каждой соответствующей выборкой ухудшенного сигнала (сторона слушателя). Измерения FR обеспечивают высочайшую точность и повторяемость, но могут применяться только для специальных тестов в действующих сетях (например, инструменты тестирования для мобильных сетей).
  • Алгоритм «без опорного сигнала» (NR) использует только ухудшенный сигнал для оценки качества и не имеет информации об исходном опорном сигнале. Алгоритмы NR (например, Рекомендация ITU-T P.563 [7] ) являются лишь оценками с низкой точностью, поскольку характеристики исходного голоса (например, говорящий мужчина или женщина, фоновый шум, отсутствие голоса) исходного источника совершенно неизвестны. Распространенный вариант алгоритмов NR даже не анализирует декодированный аудиосигнал, а работает над анализом цифрового потока битов на уровне IP-пакета. Следовательно, измерение ограничивается анализом транспортного потока.

PESQ — это алгоритм полного эталона, который анализирует речевой сигнал по выборке после временного выравнивания соответствующих фрагментов эталонного и тестового сигнала. PESQ может применяться для обеспечения сквозной (E2E) оценки качества сети или для характеристики отдельных сетевых компонентов.

Результаты PESQ в основном моделируют средние оценки мнений (MOS), которые охватывают шкалу от 1 (плохо) до 5 (отлично). Функция преобразования в MOS-LQO описана в Рекомендации МСЭ-Т P.862.1. [4]

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б «P.862: Перцептивная оценка качества речи (PESQ): Объективный метод сквозной оценки качества речи в узкополосных телефонных сетях и речевых кодеках» . www.itu.int . Проверено 20 апреля 2021 г.
  2. ^ Перейти обратно: а б «P.863: Перцептивное объективное прогнозирование качества прослушивания» . www.itu.int . Проверено 11 апреля 2021 г.
  3. ^ Перейти обратно: а б «P.862.3: Руководство по применению для объективного измерения качества на основе Рекомендаций P.862, P.862.1 и P.862.2» . www.itu.int . Проверено 20 апреля 2021 г.
  4. ^ Перейти обратно: а б «P.862.1: Функция преобразования для преобразования необработанных результатов P.862 в MOS-LQO» . www.itu.int . Проверено 11 апреля 2021 г.
  5. ^ «P.862.2: Широкополосное расширение Рекомендации P.862 для оценки широкополосных телефонных сетей и речевых кодеков» . www.itu.int . Проверено 11 апреля 2021 г.
  6. ^ «P.863.1: Руководство по применению Рекомендации МСЭ-Т P.863» . www.itu.int . Проверено 11 апреля 2021 г.
  7. ^ Перейти обратно: а б «P.563: Односторонний метод объективной оценки качества речи в приложениях узкополосной телефонии» . www.itu.int . Проверено 11 апреля 2021 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 9905c38b0091ab61ba54a27de3464845__1722167220
URL1:https://arc.ask3.ru/arc/aa/99/45/9905c38b0091ab61ba54a27de3464845.html
Заголовок, (Title) документа по адресу, URL1:
Perceptual Evaluation of Speech Quality - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)