Бинауральная демаскировка
Бинауральная демаскировка — феномен слухового восприятия, открытый Айрой Хирш . [1] При бинауральной демаскировке мозг объединяет информацию из двух ушей, чтобы улучшить обнаружение и идентификацию сигналов в шуме . Это явление чаще всего наблюдается, когда существует разница между интерауральной фазой сигнала и интерауральной фазой шума. При наличии такой разницы происходит улучшение порога маскировки по сравнению с эталонной ситуацией, в которой интерауральные фазы одинаковы или когда стимул предъявлялся моноурально. Эти два случая обычно дают очень схожие пороговые значения. Размер улучшения известен как «разница в уровнях бинауральной маскировки» (BMLD) или просто «разница в уровнях маскировки».
Бинауральная демаскировка наиболее эффективна на низких частотах. BMLD для чистых тонов широкополосного шума достигает максимального значения около 15 децибел (дБ) при 250 Гц и постепенно снижается до 2–3 дБ при 1500 Гц. Затем BMLD стабилизируется на уровне 2–3 дБ для всех более высоких частот, по крайней мере, до 4 кГц. [2] Бинауральную демаскировку можно также наблюдать для узкополосных маскирующих шумов, но эффект ведет себя иначе: можно наблюдать более крупные BMLD, и имеется мало свидетельств снижения с увеличением частоты. [3]
Об улучшении распознавания речи в шуме впервые сообщил JCR Licklider . [4] Ликлайдер отметил, что разница в межушной фазе, которая использовалась при демаскировке, аналогична межушной разнице во времени , которая меняется в зависимости от направления источника звука и участвует в локализации звука. Тот факт, что речь может быть разоблачена, а основные сигналы меняются в зависимости от направления звука, указывает на возможность того, что бинауральная демаскировка играет роль в эффекте коктейльной вечеринки .
Система маркировки
[ редактировать ]Систематическая система маркировки различных конфигураций стимулов, впервые использованная Джеффрессом, [5] был принят большинством авторов в этой области. Имена условий записываются как NxSy, где x — межушная конфигурация шума, а y — межушная конфигурация сигнала. Некоторые общие значения для x и y включают в себя:
- 0 означает, что сигнал или шум в обоих ушах одинаковы.
- π означает, что сигнал или шум имеет межушную разность фаз в π радиан.
- τ означает, что сигнал или шум имеет межушную разницу во времени , где точное значение разницы во времени τ указано в другом месте.
- ρ означает, что шум имеет межушную корреляцию менее единицы, точная корреляция указана в другом месте.
- u означает, что сигнал или шум некоррелированы в двух ушах.
- m означает, что сигнал или шум монофонический.
Теории
[ редактировать ]Бинауральная демаскировка имеет две основные объяснительные основы. Они основаны на межушной взаимной корреляции. [6] и интерауральная вычитание. [7]
Объяснение взаимной корреляции основано на существовании сети обнаружения совпадений в среднем мозге, аналогичной той, которую предложил Ллойд А. Джеффресс. [8] для учета чувствительности к межушным временным различиям в локализации звука . Каждый детектор совпадений получает поток потенциалов действия от двух ушей через сеть аксонов, которые создают дифференциальные задержки передачи. Считается, что обнаружение сигнала происходит, когда скорость отклика наиболее активного детектора совпадений снижается из-за присутствия сигнала. Взаимная корреляция сигналов в двух ушах часто используется в качестве математического аналога для моделирования такого массива нейронов, обнаруживающих совпадения; снижение скорости ответа преобразуется в уменьшение максимума взаимной корреляции.
Субтрактивная теория известна как теория «уравнивания-отмены» или «EC». В этом случае сигналы в двух ушах (или их внутренних представлениях) выравниваются по времени (уравниваются) мозгом, а затем вычитаются одни из других. По сути, детекторы совпадений заменяются нейронами, которые возбуждаются потенциалами действия из одного уха, но тормозятся потенциалами действия из другого. Однако теория ЭК обычно не формулируется в столь явных неврологических терминах, и в мозге не обнаружено подходящего нейронного субстрата. Тем не менее, теория ЕС оказалась очень популярной основой моделирования и хорошо зарекомендовала себя при прямом сравнении с моделями взаимной корреляции в психоакустических экспериментах. [9]
Перцептивные сигналы
[ редактировать ]Ухо фильтрует входящий звук на разные частоты: определенное место улитки и определенное волокно слухового нерва реагируют только на ограниченный диапазон частот. Следовательно, исследователи изучили сигналы, которые генерируются смесью речи и шума в двух ушах в узком диапазоне частот вокруг сигнала. При сложении сигнала и узкополосного шума происходит векторное суммирование , при котором результирующие амплитуда и фаза отличаются от амплитуды и фазы только шума или сигнала. Для бинаурального демаскирующего стимула различия между интерауральными параметрами сигнала и шума означают, что в каждом ухе будет разное векторное суммирование. [5] наблюдаются колебания как Следовательно, независимо от конструкции стимула, в ушах слушателя уровня, так и разности фаз стимулов.
Эксперименты показали, какие из этих сигналов слуховая система может лучше всего уловить. Они показали, что на низких частотах (в частности, 500 Гц) слуховая система наиболее чувствительна к межушным временным различиям . [10] Однако на более высоких частотах, по-видимому, происходит переход к использованию межушных различий уровней. [11]
Практические последствия
[ редактировать ]В повседневной жизни речь легче понять в шуме, когда речь и шум исходят с разных направлений - явление, известное как «пространственное освобождение от маскировки». В этой ситуации речь и шум имеют четкие межушные различия во времени и межушные различия в уровне. Разница во времени возникает из-за разницы в длине пути звука к двум ушам, а разница в уровне вызвана эффектом акустического затенения головы. Эти два сигнала играют важную роль в локализации звука , и было показано, что оба они оказывают независимое влияние на пространственное освобождение от маскировки. [12] Межушные различия в уровнях могут привести к тому, что то или иное ухо будет иметь лучшее соотношение сигнал/шум , что позволит слушателю улучшить разборчивость, просто слушая это ухо. Однако межушную разницу во времени можно использовать только путем сравнения форм сигналов в двух ушах. Успешные модели пространственного освобождения от маскировки, как правило, используют теорию выравнивания-компенсации для создания эффектов межушных временных различий. [13]
Ссылки
[ редактировать ]- ^ Хирш Эй-Джей (1948). «Влияние интерауральной фазы на интерауральное суммирование и торможение». Дж. Акуст. Соц. Являюсь . 20 (4): 536–544. Бибкод : 1948ASAJ...20..536H . дои : 10.1121/1.1906407 .
- ^ Хирш И.Дж., Берджит М. (1958). «Бинауральные эффекты в удаленной маскировке». Дж. Акуст. Соц. Являюсь . 30 (9): 827–832. Бибкод : 1958ASAJ...30..827H . дои : 10.1121/1.1909781 .
- ^ Макфадден Д., Пасанен Э.Г. (1978). «Бинауральное обнаружение на высоких частотах с задержкой по времени». Дж. Акуст. Соц. Являюсь . 34 (4): 1120–1131. Бибкод : 1978ASAJ...63.1120M . дои : 10.1121/1.381820 . ПМИД 649871 .
- ^ Ликлайдер Дж. К. (1948). «Влияние межушных фазовых отношений на маскировку речи белым шумом». Дж. Акуст. Соц. Являюсь . 20 (2): 150–159. Бибкод : 1948ASAJ...20..150L . дои : 10.1121/1.1906358 .
- ^ Jump up to: а б Джеффресс Л.А., Блоджетт Х.К., Сандел Т.Т., Вуд К.Л. (1956). «Маскировка тональных сигналов». Дж. Акуст. Соц. Являюсь . 28 (3): 416–426. Бибкод : 1956ASAJ...28..416J . дои : 10.1121/1.1908346 .
- ^ Колберн Х.С. (1977). «Теория бинаурального взаимодействия на основе данных слухового нерва. II. Обнаружение тонов в шуме». Дж. Акуст. Соц. Являюсь . 61 (2): 525–533. Бибкод : 1977ASAJ...61..525C . дои : 10.1121/1.381294 . ПМИД 845314 .
- ^ Дурлах Н.И. (1963). «Теория выравнивания и устранения различий в уровнях бинауральной маскировки». Дж. Акуст. Соц. Являюсь . 35 (8): 416–426. дои : 10.1121/1.1918675 .
- ^ Джеффресс, Луизиана (1948). «Местотеория локализации звука». Журнал сравнительной и физиологической психологии . 41 (1): 35–9. дои : 10.1037/h0061495 . ПМИД 18904764 .
- ^ Каллинг Дж. Ф. (2007). «Доказательства, явно подтверждающие теорию выравнивания-отмены бинауральной демаскировки». J Acoust Soc Am . 122 (5): 2803–2813. Бибкод : 2007ASAJ..122.2803C . дои : 10.1121/1.2785035 . ПМИД 18189570 . S2CID 24476950 .
- ^ Ван дер Хейден М., Йорис ПХ (2010). «Межауральная корреляция не может учитывать обнаружение в классической бинауральной задаче: динамические ITD доминируют над обнаружением N0Sπ» . J Assoc Res Otolaryngol . 11 (1): 113–131. дои : 10.1007/s10162-009-0185-8 . ПМК 2820206 . ПМИД 19760461 .
- ^ Каллинг Дж. Ф. (2011). «Подкомпонентные сигналы при бинауральной демаскировке» (PDF) . J Acoust Soc Am . 129 (6): 3846–3855. Бибкод : 2011ASAJ..129.3846C . дои : 10.1121/1.3560944 . ПМИД 21682408 .
- ^ Бронкхорст А.В., Пломп Р. (1988). «Влияние межушного времени и разницы уровней, вызванных воздействием головы, на разборчивость речи в шуме» . J Acoust Soc Am . 83 : 1508–1516. дои : 10.1121/1.395906 . ПМИД 3372866 .
- ^ Бойтельманн Р., Бранд Т (2006). «Прогнозирование разборчивости речи в условиях пространственного шума и реверберации для нормально слышащих и слабослышащих слушателей». J Acoust Soc Am . 120 (1): 331–342. Бибкод : 2006ASAJ..120..331B . дои : 10.1121/1.2202888 . ПМИД 16875230 .