Психоакустика
Психоакустика — раздел психофизики, занимающийся научным изучением звука восприятия и аудиологией человека — тем, как слуховая система воспринимает различные звуки. Точнее, это отрасль науки, изучающая психологические реакции, связанные со звуком (включая шум , речь и музыку ). Психоакустика — это междисциплинарная область, включающая психологию, акустику , электронную технику, физику, биологию, физиологию и информатику. [1]
Фон
[ редактировать ]Слух — это не чисто механическое явление распространения волн , но также сенсорное и перцептивное событие; Другими словами, когда человек что-то слышит, это что-то достигает уха в виде механической звуковой волны, распространяющейся по воздуху, но внутри уха оно преобразуется в нервные потенциалы действия . млекопитающих Наружные волосковые клетки (OHC) улитки повышают чувствительность и улучшают качество восприятия. [ нужны разъяснения ] частотное разрешение механического отклика перегородки улитки. Эти нервные импульсы затем попадают в мозг, где они воспринимаются. Следовательно, во многих задачах акустики, например при обработке звука , полезно учитывать не только механику окружающей среды, но и тот факт, что в процессе прослушивания человека участвуют и ухо, и мозг. [ нужны разъяснения ] [ нужна ссылка ]
, Внутреннее ухо например, выполняет значительную обработку сигналов при преобразовании звуковых волн в нервные стимулы, поэтому некоторые различия между формами сигналов могут быть незаметными. [2] методах сжатия данных , таких как MP3 . Этот факт используется в [3] Кроме того, ухо имеет нелинейную реакцию на звуки разного уровня интенсивности; этот нелинейный отклик называется громкостью . Телефонные сети и системы шумоподавления используют этот факт, нелинейно сжимая образцы данных перед передачей, а затем расширяя их для воспроизведения. [4] Другим эффектом нелинейной реакции уха является то, что близкие по частоте звуки создают фантомные ноты или продукты интермодуляционных искажений. [5]
Термин «психоакустика» также возникает в дискуссиях о когнитивной психологии и влиянии, которое личные ожидания, предубеждения и предрасположенности могут оказывать на относительные оценки и сравнения слушателей эстетики и остроты звука, а также на различные определения слушателей относительно относительных качеств различных музыкальных инструментов и исполнители. К таким дискуссиям может относиться выражение «слышишь то, что хочешь (или ожидаешь) услышать». [ нужна ссылка ]
Пределы восприятия
[ редактировать ]Человеческое ухо номинально способно слышать звуки в диапазоне от 20 до 20 000 Гц . Верхний предел имеет тенденцию к снижению с возрастом; большинство взрослых не способны слышать частоту выше 16 000 Гц . Самая низкая частота, которая была определена как музыкальный тон, составляет 12 Гц в идеальных лабораторных условиях. [6] тела Тоны от 4 до 16 Гц можно воспринимать посредством осязания .
Было измерено, что человеческое восприятие временного разделения аудиосигнала составляет менее 10 микросекунд. Это не означает, что частоты выше 100 кГц слышны, но временная дискриминация не связана напрямую с частотным диапазоном. [7] [8]
Частотное разрешение уха составляет около 3,6 Гц в пределах октавы 1000–2000 Гц. То есть изменения высоты звука более 3,6 Гц можно воспринимать в клинических условиях. [6] Однако даже меньшие различия в высоте звука можно обнаружить другими способами. Например, интерференцию двух тонов часто можно услышать как повторяющееся изменение громкости тона. Эта амплитудная модуляция происходит с частотой, равной разнице частот двух тонов, и называется биением .
Полутоновая шкала , используемая в западной нотной записи, представляет собой не линейную частотную шкалу, а логарифмическую . Другие шкалы были получены непосредственно в результате экспериментов по человеческому слуховому восприятию, такие как шкала Мела и шкала Барка (они используются при изучении восприятия, но обычно не в музыкальной композиции), и они примерно логарифмические по частоте на высокочастотном конце. , но почти линейным на низкочастотном конце.
Диапазон интенсивности слышимых звуков огромен. Барабанные перепонки человека чувствительны к изменениям звукового давления и могут обнаруживать изменения давления от нескольких микропаскалей (мкПа) до более 100 кПа . По этой причине уровень звукового давления также измеряется логарифмически, при этом все давления относятся к 20 мкПа (или 1,973 85 × 10 −10 банкомат ). Поэтому нижний предел слышимости определяется как 0 дБ , а верхний предел не так четко определен. Верхний предел — это скорее вопрос предела, при котором ухо будет физически повреждено или может вызвать потерю слуха из-за шума .
Более тщательное исследование нижних пределов слышимости показывает, что минимальный порог, при котором можно услышать звук, зависит от частоты. Измеряя эту минимальную интенсивность для тестирования тонов различных частот, абсолютного порога слышимости можно получить частотно-зависимую кривую (ATH). Обычно ухо демонстрирует пик чувствительности (т. е. самый низкий ATH) в диапазоне 1–5 кГц , хотя порог меняется с возрастом: более старые уши демонстрируют снижение чувствительности выше 2 кГц. [9]
ATH — это самый низкий из контуров равной громкости . Контуры равной громкости обозначают уровень звукового давления (дБ SPL) в диапазоне слышимых частот, которые воспринимаются как равные по громкости. Контуры равной громкости были впервые измерены Флетчером и Мансоном в Bell Labs в 1933 году с использованием чистых тонов, воспроизводимых через наушники, а собранные ими данные называются кривыми Флетчера-Мансона . Поскольку субъективную громкость было трудно измерить, кривые Флетчера-Мансона усреднялись по многим испытуемым.
Робинсон и Дадсон усовершенствовали этот процесс в 1956 году, чтобы получить новый набор кривых равной громкости для фронтального источника звука, измеренного в безэховой камере . Кривые Робинсона-Дадсона были стандартизированы как ISO 226 в 1986 году. В 2003 году ISO 226 был пересмотрен как контур равной громкости с использованием данных, собранных в результате 12 международных исследований.
Звуковая локализация
[ редактировать ]Локализация звука – это процесс определения местоположения источника звука. Мозг использует тонкие различия в громкости, тоне и времени между двумя ушами, чтобы мы могли локализовать источники звука. [10] Локализация может быть описана с точки зрения трехмерного положения: азимута или горизонтального угла, зенита или вертикального угла, а также расстояния (для статических звуков) или скорости (для движущихся звуков). [11] Люди, как и большинство четвероногих животных , умеют определять направление в горизонтальном направлении, но в меньшей степени — в вертикальном направлениях из-за симметричного расположения ушей. У некоторых видов сов уши расположены асимметрично, и они могут улавливать звуки во всех трех плоскостях, что является приспособлением для охоты на мелких млекопитающих в темноте. [12]
Маскирующие эффекты
[ редактировать ]Предположим, слушатель может услышать данный акустический сигнал в условиях тишины. Когда сигнал воспроизводится одновременно с другим звуком (маскером), сигнал должен быть сильнее, чтобы слушатель мог его услышать. Для маскировки маскеру не обязательно иметь частотные составляющие исходного сигнала. Замаскированный сигнал можно услышать, даже если он слабее маскирующего. Маскирование происходит, когда сигнал и маскер воспроизводятся вместе — например, когда один человек шепчет, а другой кричит — и слушатель не слышит более слабый сигнал, поскольку он замаскирован более громким маскером. Маскирование также может произойти с сигналом до запуска маскера или после его остановки. Например, один внезапный громкий хлопок может сделать неслышимыми звуки, которые непосредственно предшествуют или следуют за ним. Эффект обратной маскировки слабее, чем прямой. Маскирующий эффект широко изучался в психоакустических исследованиях. Можно изменить уровень маскера и измерить порог, а затем создать диаграмму психофизической кривой настройки, которая выявит аналогичные особенности. Эффекты маскировки также используются при кодировании звука с потерями, например MP3 .
Отсутствует фундаментальный
[ редактировать ]Когда им предъявляют гармонический ряд частот в соотношении 2f , 3f , 4f , 5f и т. д. (где f — определенная частота), люди склонны воспринимать высоту звука как f . Звуковой пример можно найти на YouTube. [13]
Программное обеспечение
[ редактировать ]Психоакустическая модель обеспечивает высококачественное сжатие сигнала с потерями , описывая, какие части данного цифрового аудиосигнала могут быть удалены (или агрессивно сжаты) безопасно, то есть без значительных потерь в (сознательном) воспринимаемом качестве звука.
Это может объяснить, почему резкий хлопок в ладоши может показаться болезненно громким в тихой библиотеке, но едва заметен после того, как машина грохнула на оживленной городской улице. Это обеспечивает большую выгоду для общей степени сжатия, а психоакустический анализ обычно приводит к сжатию музыкальных файлов, размер которых составляет от одной десятой до одной двенадцатой размера высококачественных мастер-файлов, но с заметно менее пропорциональными потерями качества. Такое сжатие является особенностью почти всех современных форматов сжатия звука с потерями. Некоторые из этих форматов включают Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (используется для цифрового аудиовещания в нескольких странах) и ATRAC , сжатие, используемое в MiniDisc и некоторых других Walkman форматах. Модели .
Психоакустика во многом основана на анатомии человека , особенно на ограничениях уха в восприятии звука, как описано ранее. Подводя итог, эти ограничения таковы:
- Высокочастотный предел
- Абсолютный порог слышимости
- Временная маскировка (прямая маскировка, обратная маскировка)
- Одновременная маскировка (также известная как спектральная маскировка)
Алгоритм сжатия может назначать более низкий приоритет звукам, находящимся за пределами человеческого слуха. Осторожно перемещая биты от неважных компонентов к важным, алгоритм гарантирует, что звуки, которые слушатель, скорее всего, воспримет, будут представлены наиболее точно.
Музыка
[ редактировать ]Психоакустика включает темы и исследования, имеющие отношение к музыкальной психологии и музыкальной терапии . Теоретики, такие как Бенджамин Борец, считают, что некоторые результаты психоакустики имеют смысл только в музыкальном контексте. [14]
Пластинки Ирва Тейбеля из серии Environments (1969–79) являются ранним примером коммерчески доступных звуков, выпущенных специально для улучшения психологических способностей. [15]
Прикладная психоакустика
[ редактировать ]Психоакустика уже давно находится в симбиотических отношениях с информатикой . Пионеры Интернета Дж. К. Р. Ликлайдер и Боб Тейлор закончили аспирантуру в области психоакустики, а BBN Technologies первоначально специализировалась на консультировании по вопросам акустики, прежде чем приступила к созданию первой сети с коммутацией пакетов .
Ликлайдер написал статью под названием «Двойная теория восприятия высоты звука». [16]
Психоакустика применяется во многих областях разработки программного обеспечения, где разработчики отображают проверенные и экспериментальные математические закономерности цифровой обработки сигналов. Многие кодеки сжатия звука, такие как MP3 и Opus, используют психоакустическую модель для увеличения степени сжатия. Успех обычных аудиосистем для воспроизведения музыки в театрах и дома можно отнести на счет психоакустики. [17] психоакустические соображения привели к появлению новых аудиосистем, таких как психоакустический синтез звукового поля . [18] Кроме того, ученые экспериментировали с ограниченным успехом по созданию нового акустического оружия, которое излучает частоты, которые могут нанести ущерб, нанести вред или убить. [19] Психоакустика также используется при ультразвуковой обработке , чтобы сделать несколько независимых измерений данных слышимыми и легко интерпретируемыми. [20] Это обеспечивает слуховое руководство без необходимости использования пространственного звука и с ультразвуковой обработкой. компьютерных игр [21] и другие приложения, такие как полеты дронов и хирургия под визуальным контролем . [22] Сегодня это также применяется в музыке, где музыканты и художники продолжают создавать новые слуховые впечатления, маскируя нежелательные частоты инструментов, вызывая усиление других частот. Еще одно применение - разработка небольших громкоговорителей или громкоговорителей более низкого качества, которые могут использовать явление отсутствия основных элементов для создания эффекта басовых нот на более низких частотах, чем физически способны воспроизводить громкоговорители (см. Ссылки).
Производители автомобилей проектируют свои двигатели и даже двери так, чтобы они издавали определенный звук. [23]
См. также
[ редактировать ]Связанные поля
[ редактировать ]Психоакустические темы
[ редактировать ]- A-взвешивание , часто используемая функция передачи воспринимаемой громкости.
- АВХ-тест
- Слуховые иллюзии
- Слуховой анализ сцены, вкл. Восприятие 3D-звука, локализация
- Бинауральные ритмы
- Слепое разделение сигналов
- Комбинированный тон (также тон Тартини)
- Иллюзия шкалы Дойча
- Эквивалентная прямоугольная полоса пропускания (ERB)
- Эффект Франсена
- Иллюзия глиссандо
- Гиперзвуковой эффект
- Языковая обработка
- Эффект Левитина
- Мизофония
- Музыкальный тюнинг
- Влияние шума на здоровье
- Октавная иллюзия
- Питч (музыка)
- Эффект приоритета
- Психолингвистика
- Теория искажения скорости
- Звуковая локализация
- Звук скрежета ногтей по доске
- Звуковая маскировка
- Восприятие речи
- Распознавание речи
- Тембр
- Парадокс Тритона
Ссылки
[ редактировать ]Примечания
[ редактировать ]- ^ Баллоу, Дж. (2008). Справочник для звукорежиссеров (Четвертое изд.). Берлингтон: Focal Press. п. 43.
- ^ Кристофер Дж. Плак (2005). Чувство слуха . Рутледж. ISBN 978-0-8058-4884-7 .
- ^ Ларс Альзен; Кларенс Сонг (2003). Звуковой Blaster Live! Книга . Нет крахмального пресса. ISBN 978-1-886411-73-9 .
- ^ Рудольф Ф. Граф (1999). Современный словарь электроники . Ньюнес. ISBN 978-0-7506-9866-5 .
- ^ Джек Кац; Роберт Ф. Буркард и Ларри Медвецки (2002). Справочник по клинической аудиологии . Липпинкотт Уильямс и Уилкинс. ISBN 978-0-683-30765-8 .
- ^ Jump up to: а б Олсон, Гарри Ф. (1967). Музыка, физика и инженерия . Дуврские публикации. стр. 248–251. ISBN 978-0-486-21769-7 .
- ^ Кунчер, Милинд (август 2007 г.). «Слышимость временного размытия и временной расстройки акустических сигналов» (PDF) . boson.физика.sc.edu . Архивировано (PDF) из оригинала 14 июля 2014 г.
- ^ Робджонс, Хью (август 2016 г.). «Точность MQA во временной области и качество цифрового звука» . soundonsound.com . Звук на звуке. Архивировано из оригинала 10 марта 2023 года.
- ^ Фастл, Хьюго; Цвикер, Эберхард (2006). Психоакустика: факты и модели . Спрингер. стр. 21–22. ISBN 978-3-540-23159-2 .
- ^ Томпсон, Дэниел М. Понимание звука: получение максимальной отдачи от вашего проекта или профессиональной студии звукозаписи. Бостон, Массачусетс: Беркли, 2005. Печать.
- ^ Дороги, Кертис. Учебник по компьютерной музыке. Кембридж, Массачусетс: Массачусетский технологический институт, 2007. Печать.
- ^ Льюис, Д. П. (2007): Уши и слух совы. Страницы совы [Онлайн]. Доступно: http://www.owlpages.com/articles.php?section=Owl+Physiology&title=Hearing [2011, 5 апреля]
- ^ Акустика, Мюзикл (9 марта 2015 г.). «Недостающий фундамент» . Ютуб . Архивировано из оригинала 20 декабря 2021 г. Проверено 19 августа 2019 г.
- ^ Стерн, Джонатан (2003). Звуковое прошлое: культурные истоки воспроизведения звука . Дарем: Издательство Университета Дьюка. ISBN 9780822330134 .
- ^ Каммингс, Джим. «На этой неделе умер Ирв Тейбель: создатель пластинок «Environments» 1970-х годов» . Земное ухо . Проверено 18 ноября 2015 г.
- ^ Ликлайдер, JCR (январь 1951 г.). «Дуплексная теория восприятия высоты звука» (PDF) . Журнал Акустического общества Америки . 23 (1): 147. Бибкод : 1951ASAJ...23..147L . дои : 10.1121/1.1917296 . Архивировано (PDF) из оригинала 2 сентября 2016 г.
- ^ Цимер, Тим (2020). «Обычный стереофонический звук». Синтез звукового поля психоакустической музыки . Современные исследования в области систематического музыковедения. Том. 7. Чам: Спрингер. стр. 171–202. дои : 10.1007/978-3-030-23033-3_7 . ISBN 978-3-030-23033-3 . S2CID 201142606 .
- ^ Цимер, Тим (2020). Синтез звукового поля психоакустической музыки . Современные исследования в области систематического музыковедения. Том. 7. Чам: Спрингер. дои : 10.1007/978-3-030-23033-3 . ISBN 978-3-030-23032-6 . ISSN 2196-6974 . S2CID 201136171 .
- ^ «Исследования в области акустической энергии вызывают недовольство» . Архивировано из оригинала 19 июля 2010 г. Проверено 6 февраля 2010 г.
- ^ Цимер, Тим; Шультайс, Хольгер; Блэк, Дэвид; Кикинис, Рон (2018). «Психоакустическая интерактивная сонификация для навигации на короткие расстояния». Acta Acustica объединилась с Acustica . 104 (6): 1075–1093. дои : 10.3813/AAA.919273 . S2CID 125466508 .
- ^ КУРАТ. «Игры и тренинги по малоинвазивной хирургии» . КУРАТ . Бременский университет . Проверено 15 июля 2020 г.
- ^ Цимер, Тим; Нучпрайун, Нуттавут; Шультайс, Хольгер (2019). «Психоакустическая сонификация как пользовательский интерфейс для взаимодействия человека и машины». Международный журнал общества информатики . 12 (1). arXiv : 1912.08609 . дои : 10.13140/RG.2.2.14342.11848 .
- ^ Тарми, Джеймс (5 августа 2014 г.). «Двери Mercedes имеют фирменный звук: вот как» . Блумберг Бизнес . Проверено 10 августа 2020 г.
Источники
[ редактировать ]- Э. Ларсен и Р. М. Аартс (2004), Расширение полосы пропускания звука. Применение психоакустики, обработки сигналов и проектирования громкоговорителей. , Дж. Уайли.
- Ларсен Э.; Аартс Р.М. (март 2002 г.). «Воспроизведение низкочастотных сигналов через небольшие громкоговорители» (PDF) . Журнал Общества аудиоинженеров . 50 (3): 147–64. [ мертвая ссылка ]
- Оохаши Т.; Каваи Н.; Нишина Е.; Хонда М.; Яги Р.; Накамура С.; Моримото М.; Маэкава Т.; Ёнекура Ю.; Сибасаки Х. (февраль 2006 г.). «Роль биологической системы, отличной от слуховой воздушной проводимости, в возникновении гиперзвукового эффекта» . Исследования мозга . 1073–1074: 339–347. дои : 10.1016/j.brainres.2005.12.096 . ПМИД 16458271 .
Внешние ссылки
[ редактировать ]- Музыкальный слух - восприятие звука. Архивировано 25 декабря 2005 г. в Wayback Machine.
- Мюллер С., Шнайдер П., Перстерер А., Опиц М., Нефьодова М.В., Бергер М. (1993). «[Прикладная психоакустика в космическом полете]». Vienna Med Wochenschr (на немецком языке). 143 (23–24): 633–5. ПМИД 8178525 . — Моделирование слуха в свободном поле с помощью наушников.
- GPSYCHO — психоакустическая модель формирования шума с открытым исходным кодом для кодировщиков MP3 на основе ISO.
- Определение: перцептивное аудиокодирование.
- Java-апплет, демонстрирующий маскировку
- Временная маскировка
- Концепции гиперфизики: звук и слух
- MP3 как стандартный объект