Jump to content

Звуковая локализация

(Перенаправлено с локализации звука )

Локализация звука — это способность слушателя определять местонахождение или источник обнаруженного звука по направлению и расстоянию.

Механизмы локализации звука в слуховой системе млекопитающих широко изучены. Слуховая система использует несколько сигналов для локализации источника звука, включая разницу во времени и разницу уровней (или разницу интенсивности) между ушами, а также спектральную информацию. Другие животные, такие как птицы и рептилии, также используют их, но они могут использовать их по-другому, а у некоторых также есть сигналы локализации, которые отсутствуют в слуховой системе человека, например, эффекты движений ушей. Животные, обладающие способностью локализовать звук, имеют явное эволюционное преимущество.

Как звук достигает мозга

[ редактировать ]

Звук — это воспринимаемый результат механических вибраций, распространяющихся через такую ​​среду, как воздух или вода. Благодаря механизмам сжатия и разрежения звуковые волны распространяются по воздуху, отражаются от ушной раковины и раковины наружного уха и попадают в слуховой проход. У млекопитающих звуковые волны вызывают вибрацию барабанной перепонки ( барабанной перепонки ), заставляя вибрировать три косточки среднего уха , что затем передает энергию через овальное окно в улитку , где она преобразуется в химический сигнал волосковыми клетками. в кортиевом органе , который образует синапсы на спиральных ганглиозных волокнах, которые проходят через улитковый нерв в мозг.

Нейронные взаимодействия

[ редактировать ]

Известно, что у позвоночных межушные временные различия рассчитываются в верхнем оливковом ядре ствола мозга . По словам Джеффресса , [1] этот расчет основан на линиях задержки : нейронах верхней оливы, которые получают иннервацию от каждого уха с соединительными аксонами разной длины. Некоторые клетки более непосредственно связаны с одним ухом, чем с другим, поэтому они специфичны для определенной межушной разницы во времени. Эта теория эквивалентна математической процедуре взаимной корреляции . Однако, поскольку теория Джеффресса не может объяснить эффект предшествования , при котором для определения местоположения звука используется только первый из нескольких идентичных звуков (что позволяет избежать путаницы, вызванной эхом), ее нельзя полностью использовать для объяснения реакции. Более того, ряд недавних физиологических наблюдений, сделанных в среднем мозге и стволе мозга мелких млекопитающих, поставили под сомнение обоснованность оригинальных идей Джеффресса. [2]

Нейроны, чувствительные к межушным различиям уровней (ILD), возбуждаются при стимуляции одного уха и тормозятся при стимуляции другого уха, так что величина ответа клетки зависит от относительной силы двух входных сигналов, которая, в свою очередь, зависит от интенсивность звука в ушах.

В слуховом ядре среднего мозга, нижнем холмике (IC), многие чувствительные к ILD нейроны имеют функции ответа, которые резко снижаются от максимальных до нулевых спайков в зависимости от ILD. Однако есть также много нейронов с гораздо более поверхностными функциями ответа, которые не снижаются до нуля.

Слуховая система человека

[ редактировать ]

Локализация звука – это процесс определения местоположения источника звука . Мозг использует тонкие различия в интенсивности, спектре и временных сигналах для локализации источников звука. [3] [4]

Локализация может быть описана с точки зрения трехмерного положения: азимута или горизонтального угла, угла места или вертикального угла, а также расстояния (для статических звуков) или скорости (для движущихся звуков). [5]

Об азимуте звука сигнализирует разница во времени прибытия между ушами , относительная амплитуда высокочастотных звуков (эффект тени), а также асимметричные спектральные отражения от различных частей нашего тела, включая туловище, плечи, и пинне . [5]

Признаками расстояния являются потеря амплитуды, потеря высоких частот и соотношение прямого сигнала к реверберированному сигналу. [5]

В зависимости от того, где находится источник, наша голова действует как барьер для изменения тембра , интенсивности и спектральных качеств звука, помогая мозгу сориентироваться, откуда исходит звук. [4] Эти мельчайшие различия между двумя ушами известны как межушные сигналы. [4]

Более низкие частоты и более длинные волны преломляют звук вокруг головы, заставляя мозг сосредоточиться только на фазовых сигналах источника. [4]

Хельмут Хаас обнаружил, что мы можем различить источник звука, несмотря на дополнительные отражения на 10 децибел громче исходного волнового фронта, используя самый ранний пришедший волновой фронт. [4] Этот принцип известен как эффект Хааса , особая версия эффекта предшествования . [4] Хаас измерил разницу во времени между исходным звуком и отраженным звуком даже в 1 миллисекунду, что увеличило объемность, позволив мозгу определить истинное местоположение исходного звука. Нервная система объединяет все ранние отражения в единое воспринимаемое целое, позволяя мозгу обрабатывать несколько разных звуков одновременно. [6] Нервная система будет комбинировать отражения, которые находятся в пределах 35 миллисекунд друг от друга и имеют одинаковую интенсивность. [6]

Теория дуплекса

[ редактировать ]

Чтобы определить боковое направление ввода (слева, спереди, справа), слуховая система анализирует следующую информацию о ушных сигналах:

В 1907 году лорд Рэлей использовал камертоны для генерации монофонического возбуждения и изучил теорию боковой локализации звука на модели головы человека без ушной раковины. Он первым представил теорию локализации звука, основанную на межушных различиях, известную как теория дуплекса. [7] Уши человека находятся по разные стороны головы и, следовательно, имеют разные координаты в пространстве. Как показано на рисунке теории дуплекса, поскольку расстояния между источником звука и ушами различны, между звуковыми сигналами двух ушей существует разница во времени и разница в интенсивности. Мы называем эти виды различий межушной разницей во времени (ITD) и межушной разницей в интенсивности (IID) соответственно.

Теория дуплекса
Межушная разница во времени (ITD) между левым ухом (вверху) и правым ухом (внизу).
[ источник звука 100 мс : белый шум справа]
Межушная разница уровней (ILD) между левым ухом (слева) и правым ухом (справа).
[ источник звука : взмах справа]

На рисунке теории дуплекса мы видим, что для источника B1 или источника B2 будет задержка распространения между двумя ушами, которая будет генерировать ITD. Одновременно голова и уши человека могут оказывать затеняющее воздействие на высокочастотные сигналы, которые будут генерировать IID.

  • Межушная разница во времени (ITD). Звук с правой стороны достигает правого уха раньше, чем левого. Слуховая система оценивает межушные временные различия по: (а) фазовым задержкам на низких частотах и ​​(б) групповым задержкам на высоких частотах.
  • Теория и эксперименты показывают, что ITD зависит от частоты сигнала. . Предположим, что угловое положение источника звука равно , радиус головы а скорость звука , функция ITD определяется выражением: [8] [ цитата не найдена ] . В приведенной выше закрытой форме мы предположили, что 0 градусов находится справа перед головой, а направление против часовой стрелки является положительным.
  • Межушная разница интенсивности (IID) или межушная разница уровней (ILD). Звук с правой стороны имеет более высокий уровень в правом ухе, чем в левом ухе, поскольку голова затеняет левое ухо. Эти различия уровней сильно зависят от частоты и увеличиваются с увеличением частоты. Массивные теоретические исследования показывают, что IID связан с частотой сигнала. и угловое положение источника звука . Функция IID определяется: [8] [ цитата не найдена ]
  • Для частот ниже 1000 Гц оцениваются в основном ITD ( фазовые задержки ), для частот выше 1500 Гц оцениваются преимущественно IID. Между 1000 Гц и 1500 Гц существует переходная зона, где играют роль оба механизма.
  • Точность локализации составляет 1 градус для источников перед слушателем и 15 градусов для источников по бокам. Люди могут различать межушную разницу во времени в 10 микросекунд или меньше. [9] [10]

Для частот ниже 800 Гц размеры головы (расстояние до уха 21,5 см, что соответствует межушной временной задержке 626 мкс) меньше половины длины волны звуковых волн. Таким образом, слуховая система может без путаницы определить фазовые задержки между обоими ушами. Межушные различия уровней в этом диапазоне частот очень малы, особенно ниже примерно 200 Гц, поэтому точная оценка направления входного сигнала практически невозможна только на основе различий уровней. Когда частота падает ниже 80 Гц, становится трудно или невозможно использовать разницу во времени или разницу уровней для определения бокового источника звука, поскольку разность фаз между ушами становится слишком маленькой для оценки направления. [11]

Для частот выше 1600 Гц размеры головы больше длины звуковых волн. На этих частотах невозможно однозначное определение направления входного сигнала только на основе межушной фазы. Однако различия между ушными уровнями становятся больше, и эти различия уровней оцениваются слуховой системой. Кроме того, задержки между ушами все еще можно обнаружить с помощью некоторой комбинации разностей фаз и групповых задержек , которые более выражены на более высоких частотах; то есть, если есть начало звука, задержку этого начала между ушами можно использовать для определения направления входа соответствующего источника звука. Этот механизм становится особенно важным в реверберирующей среде. После появления звука проходит небольшой промежуток времени, когда прямой звук достигает ушей, но еще не отраженный звук. Слуховая система использует этот короткий промежуток времени для оценки направления источника звука и сохраняет это обнаруженное направление до тех пор, пока отражения и реверберация не позволяют однозначно оценить направление. [12] Описанные выше механизмы нельзя использовать для различения источника звука перед слушающим или позади него; поэтому необходимо оценить дополнительные сигналы. [13]

Эффект фильтрации Пинны

[ редактировать ]
HRTF

Теория дуплекса показывает, что ITD и IID играют важную роль в локализации звука, но они могут решать только проблемы боковой локализации. Например, если два акустических источника расположены симметрично в передней и задней части правой стороны головы человека, они будут генерировать равные ITD и IID, что называется эффектом модели конуса. Однако человеческие уши все еще могут различать эти источники. Кроме того, при естественном слухе одно ухо, без каких-либо ITD или IID, может различать их с высокой точностью. Из-за недостатков теории дуплекса исследователи предложили теорию эффекта фильтрации ушной раковины. [14] [15] Форма ушной раковины человека вогнутая, со сложными складками, асимметрична как по горизонтали, так и по вертикали. Отраженные и прямые волны генерируют на барабанной перепонке частотный спектр, соответствующий источникам звука. Затем слуховые нервы локализуют источники, используя этот частотный спектр. [16]

HRIR

Эти подсказки спектра, генерируемые эффектом фильтрации ушной раковины, могут быть представлены как передаточная функция, связанная с головой (HRTF). Соответствующие выражения во временной области называются импульсной реакцией, связанной с головой (HRIR). HRTF также описывается как передаточная функция от свободного поля к определенной точке ушного прохода. Обычно мы признаем HRTF системами LTI: [8]

где L и R представляют собой левое и правое ухо соответственно, и представляют собой амплитуду звукового давления на входах в левый и правый слуховые проходы, а — амплитуда звукового давления в центре координаты головы при отсутствии слушателя. В целом, HRTF и являются функциями углового положения источника , угол возвышения , расстояние между источником и центром головы , угловая скорость и эквивалентный размер головы .

В настоящее время в число основных институтов, занимающихся измерением базы данных HRTF, входят CIPIC. [17] Международная лаборатория, Медиа-лаборатория Массачусетского технологического института, Высшая школа психоакустики Ольденбургского университета, Лаборатория нейрофизиологии Университета Висконсин-Мэдисон и Лаборатория Эймса НАСА. Базы данных HRIR людей с нормальным и нарушенным слухом и животных общедоступны.

Другие сигналы

[ редактировать ]

человека Наружное ухо , то есть структуры ушной раковины и наружного слухового прохода , образуют направленно-селективные фильтры. В зависимости от направления ввода звука активируются различные резонансы фильтра. паттерны, специфичные для направления Эти резонансы внедряют в частотные характеристики ушей , которые могут быть оценены слуховой системой на предмет локализации звука. Вместе с другими направленно-избирательными отражениями в голове, плечах и туловище они образуют передаточные функции наружного уха. уха Эти закономерности частотных характеристик очень индивидуальны и зависят от формы и размера наружного уха. Если звук воспроизводится через наушники и записан через другую голову с внешней поверхностью уха другой формы, диаграммы направленности будут отличаться от собственных, и возникнут проблемы при попытке оценить направления в срединной плоскости этими чужими ушами. Как следствие, при прослушивании могут возникать перестановки спереди и сзади или внутриголовная локализация. записи с фиктивной головы , или иначе называемые бинауральными записями. Было показано, что люди могут моноурально локализовать высокочастотный звук, но не низкочастотный звук. Однако бинауральная локализация была возможна и на более низких частотах. Вероятно, это связано с тем, что ушная раковина достаточно мала, чтобы взаимодействовать только со звуковыми волнами высокой частоты. [18] Кажется, что люди могут точно локализовать высоту только сложных звуков, включающих частоты выше 7000 Гц, и при этом должна присутствовать ушная раковина. [19]

Когда голова неподвижна, бинауральные сигналы боковой локализации звука (интерауральная разница во времени и интерауральная разница в уровне) не дают информации о расположении звука в срединной плоскости. Идентичные ITD и ILD могут производиться звуками на уровне глаз или на любой высоте, при условии, что боковое направление постоянно. Однако если голову повернуть, ITD и ILD изменяются динамически, и эти изменения различны для звуков на разной высоте. Например, если источник звука на уровне глаз находится прямо перед вами, а голова повернута влево, звук становится громче (и доходит раньше) до правого уха, чем до левого. Но если источник звука находится непосредственно над головой, при повороте головы изменений в ITD и ILD не будет. Промежуточные высоты будут вызывать промежуточные степени изменения, и если подача бинауральных сигналов двум ушам во время движения головы будет изменена на противоположную, звук будет слышен позади слушателя. [13] [20] Ганс Валлах [21] искусственно изменяли бинауральные сигналы звука во время движений головы. Хотя звук объективно располагался на уровне глаз, динамические изменения ITD и ILD при вращении головы были такими же, как если бы источник звука был поднят. В этой ситуации звук был слышен на синтезированной высоте. Тот факт, что источники звука объективно оставались на уровне глаз, не позволял моноуральным сигналам определять высоту, показывая, что именно динамическое изменение бинауральных сигналов во время движения головы позволяло звуку правильно локализоваться в вертикальном измерении. Движения головы не обязательно должны быть активными; точная вертикальная локализация наблюдалась в аналогичной установке, когда вращение головы осуществлялось пассивно путем усаживания испытуемого с завязанными глазами на вращающееся кресло. Пока динамические изменения бинауральных сигналов сопровождали воспринимаемое вращение головы, воспринимался синтезированный подъем. [13]

В 1960-х годах Батто показал, что ушная раковина также усиливает горизонтальную локализацию. [22] [23]

Расстояние до источника звука

[ редактировать ]

[ нужна ссылка ]

Слуховая система человека имеет лишь ограниченные возможности определения расстояния до источника звука. На близком расстоянии есть некоторые показания для определения расстояния, такие как крайние различия в уровнях (например, при шепоте в одно ухо) или специфические резонансы ушной раковины (видимой части уха) на близком расстоянии.

Слуховая система использует эти подсказки для оценки расстояния до источника звука:

  • Коэффициент прямого/отражения: В закрытых помещениях к слушателю доходят два типа звука: Прямой звук доходит до ушей слушателя, не отражаясь от стены. Отраженный звук хотя бы один раз отразился от стены, прежде чем достичь слушателя. Соотношение между прямым звуком и отраженным звуком может дать представление о расстоянии до источника звука.
  • Громкость: Удаленные источники звука имеют меньшую громкость, чем близкие. Этот аспект особенно можно оценить для известных источников звука.
  • Звуковой спектр: высокие частоты заглушаются воздухом быстрее, чем низкие. Поэтому дальний источник звука звучит более приглушенно, чем близкий, потому что высокие частоты ослабляются. Для звука с известным спектром (например, речи) расстояние можно приблизительно оценить с помощью воспринимаемого звука.
  • ITDG: Начальный интервал задержки описывает разницу во времени между приходом прямой волны и первым сильным отражением от слушателя. Близлежащие источники создают относительно большую ITDG, при этом первым отражениям придется пройти более длинный путь, возможно, во много раз дольше. Когда источник находится далеко, прямые и отраженные звуковые волны имеют одинаковую длину пути.
  • Движение: Подобно зрительной системе, при слуховом восприятии также существует явление параллакса движения . Для движущегося слушателя близлежащие источники звука проходят быстрее, чем удаленные.
  • Разница в уровне: очень близкие источники звука вызывают разный уровень звука в ушах.

Обработка сигналов

[ редактировать ]

Звуковая обработка слуховой системы человека осуществляется в так называемых критических полосах . Диапазон слуха разделен на 24 критические полосы, каждая шириной 1 Барк или 100 Мел . Для направленного анализа сигналы внутри критической полосы анализируются вместе.

Слуховая система может извлечь звук желаемого источника звука из мешающего шума. Это позволяет слушателю сосредоточиться только на одном говорящем, если другие говорящие тоже говорят ( эффект коктейльной вечеринки ). С помощью эффекта коктейльной вечеринки звук с мешающих направлений воспринимается приглушённым по сравнению со звуком с нужного направления. Слуховая система может увеличить соотношение сигнал/шум до 15 дБ , что означает, что мешающий звук воспринимается как приглушенный до половины (или меньше) его фактической громкости . [ нужна ссылка ]

В закрытых помещениях к ушам слушателя поступает не только прямой звук от источника звука, но и звук, отраженный от стен. Слуховая система анализирует только прямой звук, [12] который приходит первым, для локализации звука, а не отраженный звук, который приходит позже ( закон первого волнового фронта ). Таким образом, локализация звука остается возможной даже в эхогенной среде. Это эхоподавление происходит в дорсальном ядре латерального лемниска (DNLL). [24]

Чтобы определить периоды времени, в которых преобладает прямой звук и которые можно использовать для оценки направленности, слуховая система анализирует изменения громкости в разных критических диапазонах, а также стабильность воспринимаемого направления. Если имеется сильный приступ громкости в нескольких критических полосах и если воспринимаемое направление стабильно, то этот приступ, по всей вероятности, вызван прямым звуком источника звука, поступающего вновь или меняющего свои характеристики сигнала. Этот короткий период времени используется слуховой системой для анализа направления и громкости этого звука. Когда отражения приходят чуть позже, они не так сильно усиливают громкость внутри критических полос, но сигналы направления становятся нестабильными, поскольку происходит смешение звука нескольких направлений отражения. В результате слуховая система не запускает новый направленный анализ.

Это первое обнаруженное направление прямого звука принимается в качестве найденного направления источника звука до тех пор, пока другие сильные атаки громкости в сочетании со стабильной информацией о направлении не укажут на то, что возможен новый анализ направления. (см. эффект Франссена )

Конкретные методы с приложениями

[ редактировать ]

Стереосистема передачи слуха

[ редактировать ]

Такая техника локализации звука дает нам настоящую виртуальную стереосистему . [25] Он использует «умные» манекены, такие как KEMAR, для сбора сигналов или методы цифровой обработки сигналов для моделирования процесса передачи от источников к ушам. После усиления, записи и передачи два канала принятых сигналов будут воспроизводиться через наушники или динамики. Этот подход локализации использует электроакустические методы для получения пространственной информации об исходном звуковом поле путем переноса слухового аппарата слушателя в исходное звуковое поле. Самым значительным его преимуществом является то, что его акустические изображения живы и естественны. Кроме того, для воспроизведения акустического изображения 3D-системы требуется всего два независимых передаваемых сигнала.

Локализация звука с помощью манекена

3D para-virtualization stereo system

[ редактировать ]

Представителями такого рода систем являются SRS Audio Sandbox, Spatializer Audio Lab и Qsound Qxpander. [25] Они используют HRTF для имитации полученных акустических сигналов в ушах с разных направлений с общим бинарным стереовоспроизведением. Таким образом, они могут имитировать отраженные звуковые волны и улучшать субъективное ощущение пространства и окружения. Поскольку они представляют собой стереосистемы паравиртуализации, их основной целью является имитация стереозвуковой информации. Традиционные стереосистемы используют датчики, которые сильно отличаются от человеческих ушей. Хотя эти датчики могут получать акустическую информацию с разных направлений, они не имеют такой же частотной характеристики, как слуховая система человека. Таким образом, при применении бинарного режима слуховые системы человека по-прежнему не могут чувствовать поле трехмерного звукового эффекта. Однако 3D-стереосистема с паравиртуализацией преодолевает такие недостатки. Он использует принципы HRTF для сбора акустической информации из исходного звукового поля, а затем создания живого трехмерного звукового поля через обычные наушники или динамики.

Многоканальное виртуальное стереовоспроизведение

[ редактировать ]

Поскольку многоканальные стереосистемы требуют большого количества каналов воспроизведения, некоторые исследователи применили технологии моделирования HRTF, чтобы уменьшить количество каналов воспроизведения. [25] Они используют только два динамика для имитации нескольких динамиков в многоканальной системе. Этот процесс называется виртуальным воспроизведением. По сути, такой подход использует как принцип межушных различий, так и теорию эффекта фильтрации ушной раковины. К сожалению, такой подход не может полностью заменить традиционную многоканальную стереосистему, такую ​​как 5.1 / объемного звучания система 7.1. Это связано с тем, что когда зона прослушивания относительно больше, воспроизведение моделирования через HRTF может привести к инвертированию акустических изображений в симметричных положениях.

Животные

[ редактировать ]

Поскольку у большинства животных два уха, многие эффекты слуховой системы человека можно обнаружить и у других животных. Следовательно, межушные различия во времени (интерауральные фазовые различия) и межушные различия уровней играют роль для слуха многих животных. Но влияние на локализацию этих эффектов зависит от размера головы, расстояния до ушей, положения ушей и ориентации ушей. Более мелкие животные, такие как насекомые, используют другие методы, поскольку расстояние между ушами слишком мало. [26] Информацию о процессе, когда животные издают звук для улучшения локализации, биологической форме активного сонара , см. в разделе «Эхолокация животных» .

Боковая информация (слева, впереди, справа)

[ редактировать ]

Если уши расположены сбоку от головы, можно использовать те же сигналы боковой локализации, что и для слуховой системы человека. Это означает: оценку межушной разницы во времени (межушной разности фаз) для более низких частот и оценку межушной разницы уровней для более высоких частот. Оценка межушных фазовых различий полезна, поскольку дает однозначные результаты. Это так, если расстояние до уха меньше половины длины (максимальная длина волны) звуковых волн. Для животных с головой большего размера, чем у человека, диапазон оценки интерауральных фазовых разностей сдвинут в сторону более низких частот, для животных с головой меньшего размера этот диапазон сдвинут в сторону более высоких частот.

Самая низкая частота, которую можно локализовать, зависит от расстояния до уха. Животные с большим расстоянием до ушей могут локализовать более низкие частоты, чем люди. У животных с меньшим расстоянием до уха самая низкая локализуемая частота выше, чем у человека.

Если уши расположены сбоку от головы, межушные различия уровней появляются для более высоких частот и могут быть оценены для задач локализации. У животных с ушами на макушке затенение головы не появится и, следовательно, будет гораздо меньше межушных различий на уровне, которые можно было бы оценить. Многие из этих животных могут двигать ушами, и эти движения ушей можно использовать как сигнал боковой локализации.

В срединной плоскости (спереди, сверху, сзади, снизу)

[ редактировать ]

У многих млекопитающих имеются также выраженные структуры в ушной раковине вблизи входа в слуховой проход. Как следствие, могут возникать резонансы, зависящие от направления, которые можно использовать в качестве дополнительного сигнала локализации, аналогично локализации в срединной плоскости в слуховой системе человека.Существуют дополнительные сигналы локализации, которые также используют животные.

Наклон головы

[ редактировать ]

Для локализации звука в срединной плоскости (подъем звука) также можно использовать два детектора, расположенные на разной высоте. Однако у животных приблизительную информацию о высоте можно получить, просто наклонив голову, при условии, что звук длится достаточно долго, чтобы завершить движение. Это объясняет врожденное поведение [ нечеткий ] наклон головы в сторону при попытке точно локализовать звук. Чтобы получить мгновенную локализацию в более чем двух измерениях по сигналам разности времени или разности амплитуд, требуется более двух детекторов.

Локализация при спаренных ушах (мухи)

[ редактировать ]

Крошечная паразитическая муха Ormia ochracea стала модельным организмом в экспериментах по локализации звука из-за своего уникального уха . Животное слишком мало, чтобы можно было вычислить разницу во времени, когда звук достигает двух ушей, обычным способом, однако оно может с исключительной точностью определять направление источников звука. Барабанные перепонки противоположных ушей механически соединены напрямую, что позволяет разрешить разницу во времени в субмикросекундные доли. [27] [28] и требуется новая стратегия нейронного кодирования . [29] К [30] показали, что система связанных барабанных перепонок у лягушек может вызывать повышенные различия в межушных вибрациях, когда во времени прибытия голове животного доступны лишь небольшие различия и уровне звука. В настоящее время предпринимаются усилия по созданию направленных микрофонов на основе конструкции связанной барабанной перепонки.

Двухкоординатная локализация звука (совы)

[ редактировать ]

Большинство сов — ночные или сумеречные хищные птицы . Поскольку они охотятся ночью, им приходится полагаться на незрительные органы чувств. Эксперименты Роджера Пейна [31] показали, что совы чувствительны к звукам, издаваемым их добычей, а не к теплу или запаху. Фактически, звуковые сигналы необходимы и достаточны для локализации мышей из удаленного места, где они сидят. Чтобы это сработало, совы должны уметь точно определять азимут и высоту источника звука.

Дельфины

[ редактировать ]

Дельфины (и другие зубатые киты ) полагаются на эхолокацию , чтобы помочь обнаружить, идентифицировать, локализовать и поймать добычу. Сигналы гидролокатора дельфинов хорошо подходят для локализации нескольких небольших целей в трехмерной водной среде за счет использования узконаправленного (ширина луча 3 дБ около 10 градусов) широкополосного сигнала (полоса пропускания 3 дБ обычно составляет около 40 кГц; пиковые частоты от 40 кГц до 120 кГц), кратковременные щелчки (около 40 мкс). Дельфины способны локализовать звуки как пассивно, так и активно (эхолокация) с разрешением около 1 град. Кросс-модальное соответствие (между зрением и эхолокацией) предполагает, что дельфины воспринимают пространственную структуру сложных объектов, опрашиваемых с помощью эхолокации, - подвиг, который, вероятно, требует пространственного разрешения отдельных особенностей объекта и интеграции в целостное представление формы объекта. Хотя дельфины чувствительны к небольшой бинауральной интенсивности и разнице во времени, все больше данных свидетельствует о том, что дельфины используют зависящие от положения спектральные сигналы, полученные из хорошо развитых передаточных функций, связанных с головой, для локализации звука как в горизонтальной, так и в вертикальной плоскостях. Очень малое время временной интеграции (264 мкс) позволяет локализовать несколько целей на разных расстояниях. Адаптации по локализации включают выраженную асимметрию черепа, носовых мешков и специализированных липидных структур лба и челюстей, а также акустически изолированное среднее и внутреннее ухо.

Роль Престина в локализации звука:

В сфере локализации звука у млекопитающих ген Prestin стал ключевым игроком, особенно в увлекательной области эхолокации, используемой летучими мышами и дельфинами. Обнаруженный чуть более десяти лет назад, Престин кодирует белок, расположенный в волосковых клетках внутреннего уха, способствуя быстрым сокращениям и расширениям. Этот сложный механизм действует подобно старинному рупору фонографа, усиливая звуковые волны в улитке и повышая общую чувствительность слуха.

В 2014 году Лю и другие углубились в эволюционную адаптацию Престина , раскрыв его решающую роль в ультразвуковом диапазоне слуха, необходимом для сонара животных, особенно в контексте эхолокации . Эта адаптация оказывается полезной для дельфинов, перемещающихся по мутной воде, и для летучих мышей, ищущих пропитание в ночной темноте. [32]

Примечательно, что зубатые киты и летучие мыши-эхолокаторы излучают высокочастотные эхолокационные сигналы, демонстрирующие разнообразие формы, продолжительности и амплитуды. Однако именно их высокочастотный слух становится первостепенным, поскольку он позволяет принимать и анализировать эхо, отражающееся от объектов в их окружении. Тщательное исследование функции белка престина у летучих мышей, управляемых гидролокатором, и афалин в сравнении с млекопитающими, не обладающими гидролокатором, проливает свет на тонкости этого процесса.

Эволюционный анализ последовательностей белков престина позволил сделать убедительное наблюдение — необычный аминокислотный сдвиг от треонина (Thr или T) у сонарных млекопитающих к аспарагину (Asn или N) у несонарных млекопитающих. Это специфическое изменение, подверженное параллельной эволюции, становится стержнем в повествовании об эхолокации млекопитающих. [32]

Последующие эксперименты подтвердили эту гипотезу, определив четыре ключевых различия в аминокислотах у гидроакустических млекопитающих, которые, вероятно, способствуют их отличительным особенностям эхолокации. Слияние эволюционного анализа и эмпирических результатов дает убедительные доказательства, отмечая важный момент в понимании роли гена Prestin в эволюционной траектории эхолокационных систем млекопитающих. Это исследование подчеркивает адаптивность и эволюционное значение Престина, предлагая ценную информацию о генетических основах локализации звука у летучих мышей и дельфинов, особенно в сложной сфере эхолокации. [32]

Термин «бинауральный» буквально означает «слышать двумя ушами» и был введен в 1859 году для обозначения практики прослушивания одного и того же звука обоими ушами или двух отдельных звуков, по одному через каждое ухо. Лишь в 1916 году Карл Штумпф (1848–1936), немецкий философ и психолог , провел различие между дихотическим слушанием, подразумевающим стимуляцию каждого уха разными стимулами , и диотическим слушанием, одновременной стимуляцией обоих ушей разными стимулами. тот же стимул. [33]

Позже стало очевидно, что бинауральный слух, дихотический или диотический, является средством локализации звука. [33] [34] [ нужна страница ]

Научное рассмотрение бинаурального слуха началось еще до того, как это явление было названо так, с предположений, опубликованных в 1792 году Уильямом Чарльзом Уэллсом (1757–1817), основанных на его исследованиях бинокулярного зрения . [35] Джованни Баттиста Вентури (1746–1822) проводил и описывал эксперименты, в которых люди пытались локализовать звук, используя оба уха или закрывая пальцем одно ухо. Эта работа не получила дальнейшего развития и была возобновлена ​​​​только после того, как другие выяснили, как работает локализация человеческого звука. [33] [35] Лорд Рэлей (1842–1919) проделал те же эксперименты и пришел к результатам, не зная, что Вентури впервые проделал их почти семьдесят пять лет спустя. [35]

Чарльз Уитстон (1802–1875) работал над оптикой и смешением цветов, а также исследовал слух. Он изобрел устройство, которое назвал «микрофоном», в котором над каждым ухом располагалась металлическая пластина, соединенная с металлическими стержнями; он использовал это устройство для усиления звука. Он также проводил эксперименты, поднося камертоны к обоим ушам одновременно или по отдельности, пытаясь выяснить, как работает слух, и опубликовал их в 1827 году. [35] Эрнст Генрих Вебер (1795–1878), Август Зеебек (1805–1849) и Уильям Чарльз Уэллс также пытались сравнить и противопоставить то, что впоследствии стало известно как бинауральный слух, с принципами бинокулярной интеграции в целом. [35]

Понимание того, как различия в звуковых сигналах между двумя ушами способствуют слуховой обработке таким образом, чтобы обеспечить локализацию и направление звука, значительно продвинулось после изобретения стетофона Сомервиллем Скоттом Элисоном в 1859 году, который ввел термин «бинауральный». Элисон создала стетофон на основе стетоскопа , изобретенного Рене Теофилем Гиасинтом Лаэннеком (1781–1826); у стетофона было два отдельных «звукоснимателя», позволяющих пользователю слышать и сравнивать звуки, исходящие из двух отдельных мест. [35]

См. также

[ редактировать ]
  1. ^ Джеффресс Л.А. (1948). «Местотеория локализации звука». Журнал сравнительной и физиологической психологии . 41 (1): 35–39. дои : 10.1037/h0061495 . ПМИД   18904764 .
  2. ^ Шнупп Дж., Нелькен И и Кинг А.Дж., 2011. Слуховая нейронаука, MIT Press, глава 5.
  3. ^ Блауэрт, Дж.: Пространственный слух: психофизика локализации звука человека; Массачусетский технологический институт Пресс; Кембридж, Массачусетс (1983)
  4. ^ Jump up to: а б с д и ж Томпсон, Дэниел М. Понимание звука: получение максимальной отдачи от вашего проекта или профессиональной студии звукозаписи. Бостон, Массачусетс: Беркли, 2005. Печать.
  5. ^ Jump up to: а б с Дороги, Кертис. Учебник по компьютерной музыке. Кембридж, Массачусетс: Массачусетский технологический институт, 2007. Печать.
  6. ^ Jump up to: а б Бенаде, Артур Х. Основы музыкальной акустики. Нью-Йорк: Оксфордский университет, 1976. Печать.
  7. ^ Рэлей Л. XII. О нашем восприятии направления звука[J]. Философский журнал и научный журнал Лондона, Эдинбурга и Дублина, 1907, 13 (74): 214–232.
  8. ^ Jump up to: а б с Чжоу X. Техника виртуальной реальности[J]. Телекоммуникационная наука, 1996, 12(7): 46-–.
  9. ^ Ян Питт. «Слуховое восприятие» . Архивировано из оригинала 10 апреля 2010 г.
  10. ^ ДеЛян Ван; Гай Дж. Браун (2006). Вычислительный анализ слуховой сцены: принципы, алгоритмы и приложения . Вайли межнаучный. ISBN  9780471741091 . Для синусоидальных сигналов, представленных в горизонтальной плоскости, пространственное разрешение является самым высоким для звуков, исходящих из срединной плоскости (непосредственно перед слушателем) при МАА примерно 1 градус, и оно заметно ухудшается, когда стимулы перемещаются в сторону - например, МАА. составляет около 7 градусов для звуков, исходящих под углом 75 градусов в сторону.
  11. ^ Слуховая локализация - Введение Колумбийский колледж, Чикаго - Аудиоискусство и акустика Acousticslab.org/psychoacoustics , по состоянию на 16 мая 2021 г.
  12. ^ Jump up to: а б Уоллах, Х; Ньюман, Э.Б.; Розенцвейг, MR (июль 1949 г.). «Эффект приоритета в локализации звука». Американский журнал психологии . 62 (3): 315–336. дои : 10.2307/1418275 . JSTOR   1418275 . ПМИД   18134356 .
  13. ^ Jump up to: а б с Уоллах, Ганс (октябрь 1940 г.). «Роль движений головы, вестибулярных и зрительных сигналов в локализации звука». Журнал экспериментальной психологии . 27 (4): 339–368. дои : 10.1037/h0054629 .
  14. ^ «Акустика: она есть в ушах». Newsweek . 04.12.1961. п. 80.
  15. ^ Батто Д. В. Роль ушной раковины в локализации человека [J]. Труды Лондонского королевского общества B: Биологические науки, 1967, 168(1011): 158-180.
  16. ^ Музыкант А.Д., Батлер Р.А. Влияние спектральных сигналов на основе ушных раковин на локализацию звука [J]. Журнал Акустического общества Америки, 1984, 75 (4): 1195–1200.
  17. ^ «База данных CIPIC HRTF» . Архивировано из оригинала 13 сентября 2013 г.
  18. ^ Роберт А. БАТЛЕР; Ричард А. ГУМАНСКИ (1992). «Локализация звука в вертикальной плоскости с высокочастотными спектральными признаками и без них» . Восприятие и психофизика . 51 (2): 182–186. дои : 10.3758/bf03212242 . ПМИД   1549436 .
  19. ^ Роффлер Сюзанна К.; Батлер Роберт А. (1968). «Факторы, влияющие на локализацию звука в вертикальной плоскости» . Дж. Акуст. Соц. Являюсь . 43 (6): 1255–1259. Бибкод : 1968ASAJ...43.1255R . дои : 10.1121/1.1910976 . ПМИД   5659493 .
  20. ^ Терлоу, В. Р. «Прослушивание» в Клинге, Дж. В. и Риггсе, Луизиана, Экспериментальная психология , 3-е издание, Холт Райнхарт и Уинстон, 1971, стр. 267–268.
  21. ^ Уоллах, Х (1939). «О локализации звука». Журнал Акустического общества Америки . 10 (4): 270–274. Бибкод : 1939ASAJ...10..270W . дои : 10.1121/1.1915985 .
  22. ^ "Уши есть", Newsweek 1961-12-04, стр.80-81.
  23. ^ Батто, Дуайт Уэйн (январь 1964 г.). «Роль ушной раковины в локализации человека» (PDF) . Труды Лондонского королевского общества, B биологических наук . Проверено 30 ноября 2023 г.
  24. ^ Кидд, Шон А.; Келли, Джек Б. (15 ноября 1996 г.). «Вклад дорсального ядра латерального лемниска в бинауральные реакции в нижнем холмике крысы: межушные задержки времени» . Журнал неврологии . 16 (22): 7390–7397. doi : 10.1523/JNEUROSCI.16-22-07390.1996 . ISSN   0270-6474 . ПМК   6578946 . ПМИД   8929445 .
  25. ^ Jump up to: а б с Чжао Р. Исследование системы локализации звуковой передачи [D], Университет науки и технологий Китая, 2006.
  26. ^ Диас-Гарсия, Лара; Рид, Эндрю; Джексон-Камарго, Джозеф; Ветряная мельница, Джеймс ФК (2022). «На пути к биотехнологическому акустическому датчику: ухо Achroia grisella» . Журнал датчиков IEEE . 22 (18): 17746–17753. Бибкод : 2022ISenJ..2217746D . дои : 10.1109/JSEN.2022.3197841 . ISSN   1558-1748 . S2CID   252223827 . Проверено 12 сентября 2022 г.
  27. ^ Майлз Р.Н., Роберт Д., Хой Р.Р. (декабрь 1995 г.). «Механически соединенные уши для направленного слуха у паразитоидной мухи Ormia ochracea». J Acoust Soc Am . 98 (6): 3059–70. Бибкод : 1995ASAJ...98.3059M . дои : 10.1121/1.413830 . ПМИД   8550933 .
  28. ^ Роберт Д., Майлз Р.Н., Хой Р.Р. (1996). «Направленный слух посредством механической связи у паразитоидной мухи Ormia ochracea». J Comp Physiol A. 179 (1): 29–44. дои : 10.1007/BF00193432 . ПМИД   8965258 . S2CID   21452506 .
  29. ^ Мейсон А.С., Ошинский М.Л., Хой Р.Р. (апрель 2001 г.). «Сверхострый направленный слух в микромасштабной слуховой системе». Природа . 410 (6829): 686–90. дои : 10.1038/35070564 . ПМИД   11287954 . S2CID   4370356 .
  30. ^ Хо CC, премьер-министр Наринс (апрель 2006 г.). «Направленность ушей, принимающих разницу давлений, у северной леопардовой лягушки Rana pipiens pipiens». J Comp Physiol A. 192 (4): 417–29. дои : 10.1007/s00359-005-0080-7 . ПМИД   16380842 . S2CID   5881898 .
  31. ^ Пейн, Роджер С., 1962. Как сипуха находит добычу на слух. Живая птица, первый ежегодник Корнельской лаборатории орнитологии , 151–159.
  32. ^ Jump up to: а б с Лю, З., Ци, Ф.Ю., Чжоу, К., Рен, штаб-квартира, и Ши, П. (2014). Параллельные сайты указывают на функциональную конвергенцию слухового гена prestin у эхолокирующих млекопитающих. Молекулярная биология и эволюция , 31 (9), 2415–2424. два : 10.1093/molbev/msu194
  33. ^ Jump up to: а б с Уэйд, Нью-Джерси; Оно, Х (2005). «От дихоптики к дихотике: исторические контрасты между бинокулярным зрением и бинауральным слухом». Восприятие . 34 (6): 645–68. дои : 10.1068/p5327 . ПМИД   16042189 . S2CID   43674057 .
  34. ^ Бейер, Роберт Т. (1999). Звуки нашего времени: двести лет акустики . Нью-Йорк: Спрингер. ISBN  978-0-387-98435-3 .
  35. ^ Jump up to: а б с д и ж Уэйд, Николас Дж.; Дойч, Диана (июль 2008 г.). «Бинауральный слух — до и после стетофона» (PDF) . Акустика сегодня . 4 (3): 16–27. дои : 10.1121/1.2994724 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2ea0647067c847b9602687148208f3c1__1718511120
URL1:https://arc.ask3.ru/arc/aa/2e/c1/2ea0647067c847b9602687148208f3c1.html
Заголовок, (Title) документа по адресу, URL1:
Sound localization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)