Индекс качества речи слухового аппарата
Индекс качества речи слухового аппарата ( HASQI ) — это показатель качества звука, первоначально разработанный для оценки качества речи людей, пользующихся слуховым аппаратом . [1] [2] Также было показано, что он способен оценивать качество звука для неречевых звуков и для слушателей без потери слуха . [3]
Фон
[ редактировать ]Хотя восприятие качества звука можно оценить с помощью перцептивных измерений, тестирование требует много времени. Следовательно, был разработан ряд показателей, позволяющих оценивать качество звука без необходимости прослушивания человеком. Стандартизированные примеры из телефонии включают PESQ , POLQA , PEVQ и PEAQ . HASQI изначально был разработан Кейтсом и Арехартом для оценки того, как искажения, вносимые слуховыми аппаратами, ухудшают качество звука. [1] Они также выпустили новую версию в 2014 году. [2]
Кресснер и др. [3] протестировали речевой корпус, отличный от набора данных, использованного для разработки HASQI, и показали, что индекс хорошо обобщается для слушателей без потери слуха с производительностью, сравнимой с PESQ. Кендрик и др. [4] показали, что HASQI может оценивать качество звука музыки, а также геофонических, биофонических и антропофонических повседневных звуков, хотя в их исследовании использовался более ограниченный набор оценок.
Метод
[ редактировать ]HASQI и его версия 2014 года представляют собой двусторонние методы, требующие как чистого эталона, так и ухудшенного сигнала для возможности оценки. Индекс пытается уловить влияние шума, нелинейных искажений, линейной фильтрации и спектральных изменений путем вычисления разницы или корреляции между ключевыми особенностями звука. Это делается путем исследования огибающих кратковременных сигналов для количественной оценки ухудшения, вызванного шумом и нелинейной фильтрацией, а также огибающих долговременных сигналов для количественной оценки эффектов линейной фильтрации. Версия 2 HASQI включает модель, отражающую некоторые аспекты периферической слуховой системы как для нормальных, так и для слабослышащих слушателей.
Кендрик и др. разработал слепой (односторонний) метод bHASQI с использованием машинного обучения. Это позволяет оценивать качество звука только по ухудшенному сигналу без необходимости использования чистого эталонного сигнала. [4]
См. также
[ редактировать ]- Перцептивная оценка качества речи (PESQ)
- Перцептивный объективный анализ качества прослушивания (POLQA)
- Перцептивная оценка качества видео (PEVQ)
- Перцептивная оценка качества звука (PEAQ)
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Кейтс, Джеймс; Арехарт, Кэтрин (2010). «Индекс качества речи слухового аппарата (HASQI)». Журнал Общества аудиоинженеров . 58 (5): 363–381.
- ^ Перейти обратно: а б Кейтс, Джеймс; Арехарт, Кэтрин (2014). «Индекс качества речи слухового аппарата (HASQI), версия 2». Журнал Общества аудиоинженеров . 62 (3): 99–117. дои : 10.17743/jaes.2014.0006 .
- ^ Перейти обратно: а б Кресснер, Эбигейл А.; Андерсон, Дэвид В.; Розелл, Кристофер Дж. (2013). «Оценка обобщения индекса качества речи слухового аппарата (HASQI)». Транзакции IEEE по обработке звука, речи и языка . 21 (2): 407. doi : 10.1109/TASL.2012.2217132 . S2CID 2722337 .
- ^ Перейти обратно: а б Кендрик, Пол; Ли, Фрэнсис; Фазенда, Бруно; Джексон, Иэн; Кокс, Тревор (2015). «Воспринимаемое качество звука, ухудшенное нелинейными искажениями, и односторонняя оценка с использованием HASQI» . Журнал Общества аудиоинженеров . 63 (9): 698–712. дои : 10.17743/jaes.2015.0068 .