Jump to content

Форманта

Спектрограмма гласных американского английского [i, u, ɑ] с формантами F 1 и F 2.

В речевой науке и фонетике формантой называют широкий спектральный максимум, возникающий в результате акустического резонанса речевого тракта человека . [1] [2] В акустике формантой обычно называют широкий пик или локальный максимум спектра. [3] [4] Для гармонических звуков в этом определении за формантную частоту иногда принимают частоту той гармоники , которая больше всего усиливается резонансом. Разница между этими двумя определениями заключается в том, характеризуют ли «форманты» механизмы производства звука или сам производимый звук. На практике частота спектрального пика немного отличается от соответствующей резонансной частоты, за исключением случаев, когда гармоники совпадают с резонансной частотой или когда источник звука в основном негармоничен, как при шепоте и вокале .

Можно сказать, что комната имеет форманты, характерные для этой конкретной комнаты из-за ее резонансов, то есть того, как звук отражается от ее стен и предметов. Комнатные форманты такого типа усиливают себя, подчеркивая определенные частоты и поглощая другие, как это использовал, например, Элвин Люсье в своей пьесе «Я сижу в комнате» . При цифровой обработке акустических сигналов то, как совокупность формант (например, комната) влияет на сигнал, может быть представлено импульсной характеристикой .

И в речи, и в комнате форманты являются характерными чертами резонансов пространства. Говорят, что их возбуждают акустические источники, такие как голос, и они формируют (фильтруют) звуки источников, но сами по себе они не являются источниками.

История [ править ]

С акустической точки зрения фонетика столкнулась с серьезной проблемой, связанной с идеей о том, что эффективная длина речевого тракта меняет гласные. [5] Действительно, при изменении длины речевого тракта все акустические резонаторы, образованные ротовыми полостями, масштабируются, как и их резонансные частоты. Поэтому было неясно, как гласные могут зависеть от частот, когда говорящие с разной длиной речевого тракта, например, певцы баса и сопрано , могут производить звуки, которые воспринимаются как принадлежащие к одной и той же фонетической категории. Должен был быть какой-то способ нормализовать спектральную информацию, лежащую в основе идентичности гласных. Герман предложил решение этой проблемы в 1894 году, введя термин «форманта». Гласный звук, по его мнению, представляет собой особое акустическое явление, зависящее от периодического возникновения особого частичного, или «формантного», или «характеристического» признака. Частота «форманты» может немного меняться без изменения характера гласной. Например, для «длинного е» ( ee или iy ) самая низкочастотная «форманта» может варьироваться от 350 до 440 Гц даже у одного и того же человека. [6]

Фонетика [ править ]

Средние форманты гласных мужского голоса [7]
Гласный
( МПА )
Формант Ф 1
(Гц)
Форма Ф2
(Гц)
Разница
Ф2 FФ1
(Гц)
я 240 2400 2160
и 235 2100 1865
и 390 2300 1910
ø 370 1900 1530
е 610 1900 1290
œ 585 1710 1125
а 850 1610 760
ɶ 820 1530 710
ɑ 750 940 190
ɒ 700 760 60
ʌ 600 1170 570
ɔ 500 700 200
ɤ 460 1310 850
тот 360 640 280
ɯ 300 1390 1090
в 250 595 345

Форманты – это отличительные частотные составляющие акустического сигнала, производимого речью, музыкальными инструментами. [8] или пение . Информация, необходимая людям для различения звуков речи, может быть представлена ​​чисто количественно путем указания пиков в частотном спектре.Большинство этих формант производятся в результате резонанса трубки и камеры , но несколько свистящих тонов возникают в результате периодического коллапса в результате эффекта Вентури . зон низкого давления [9]

Форманта с самой низкой частотой называется F 1 , вторая F 2 , третья F 3 и так далее. Основная частота или высота голоса иногда обозначается как F 0 , но это не форманта. двух первых формант, F 1 и F 2 Чаще всего для идентификации гласной достаточно . Взаимосвязь между воспринимаемым качеством гласных и первыми двумя формантными частотами можно оценить, слушая «искусственные гласные», которые генерируются путем пропускания последовательности щелчков (для имитации последовательности голосовых импульсов) через пару полосовых фильтров (для имитации голосового тракта). резонансы). Гласные переднего ряда имеют более высокий F 2 , а гласные нижнего ряда имеют более высокий F 1 . Закругление губ имеет тенденцию понижать F 1 и F 2 в гласных заднего ряда и F 2 и F 3 в гласных переднего ряда. [10]

Носовые согласные обычно имеют дополнительную форманту около 2500 Гц. Жидкий [l] обычно имеет дополнительную форманту на частоте 1500 Гц, тогда как английский звук «r» ( [ɹ] ) отличается очень низкой третьей формантой (значительно ниже 2000 Гц).

Взрывные звуки (и, в некоторой степени, фрикативные звуки ) изменяют расположение формант в окружающих гласных. Двугубные звуки (например, /b/ и /p/ в словах «шар» или «сок») вызывают понижение формант; на спектрограммах велярные звуки ( /k/ и /ɡ/ на английском языке) почти всегда показывают, что F 2 и F 3 собираются вместе в «веларном сжатии» перед велярным сжатием и отделяются от того же «щепотки», когда велярный звук высвобождается; альвеолярные звуки (английские /t/ и /d/ ) вызывают меньше систематических изменений в формантах соседних гласных, частично в зависимости от того, какая именно гласная присутствует. Временной ход этих изменений частот формант гласных называется «формантными переходами».

В нормальной звонкой речи основная вибрация, создаваемая голосовыми связками, напоминает пилообразную волну , богатую гармонические обертоны. Если основная частота или (чаще) один из обертонов выше резонансной частоты системы, то резонанс будет возбуждаться слабо и форманта, обычно сообщаемая этим резонансом, будет в основном потеряна. Это наиболее очевидно в случае певцов- сопрано оперных , которые поют на такой высоте, что их гласные становится очень трудно различить.

Контроль резонансов является важным компонентом вокальной техники, известной как обертонное пение , при которой исполнитель поет низкий основной тон и создает резкие резонансы для выделения верхних гармоник , создавая впечатление одновременного пения нескольких тонов.

Спектрограммы можно использовать для визуализации формант. На спектрограммах может быть трудно отличить форманты от естественных гармоник, возникающих при пении. Однако можно услышать естественные форманты в форме гласных с помощью атональных техник, таких как вокальная обработка .

Формантная оценка [ править ]

Форманты, независимо от того, рассматриваются ли они как акустические резонансы речевого тракта или как локальные максимумы в речевом спектре, как полосовые фильтры , определяются их частотой и шириной спектра ( шириной полосы пропускания ).

Существуют разные методы получения этой информации. Формантные частоты в их акустическом определении можно оценить по частотному спектру звука с помощью спектрограммы (на рисунке) или анализатора спектра. Однако для оценки акустических резонансов речевого тракта (т.е. определения формант речи) по записи речи можно использовать кодирование с линейным предсказанием . Промежуточный подход заключается в извлечении огибающей спектра путем нейтрализации основной частоты. [11] и только потом ищем локальные максимумы в огибающей спектра.

Форматные editграфики

Схема средних формант гласных

Первые две форманты важны для определения качества гласных, и часто говорят, что они соответствуют размерам открытого/закрытого (или низкого/высокого) и переднего/заднего размеров (которые традиционно связывались с формой и положением языка ) . . Таким образом, первая форманта F 1 имеет более высокую частоту для открытой или низкой гласной, такой как [a] и более низкую частоту для закрытой или высокой гласной, такой как [i] или [u] ; а вторая форманта F 2 имеет более высокую частоту для гласной переднего ряда, например [i] и более низкую частоту для гласной заднего ряда, например [u] . [12] [13]

Гласные почти всегда имеют четыре или более различимых форманты, а иногда и более шести. Однако первые две форманты являются наиболее важными для определения качества гласных, и их часто сравнивают друг с другом на диаграммах гласных. [14] хотя это упрощение не отражает некоторые аспекты качества гласных, такие как округление. [15]

Многие авторы обращались к проблеме нахождения оптимального выравнивания положений гласных на формантных графиках с позициями на обычном четырехугольнике гласных. Новаторская работа Ladefoged [16] использовал шкалу Мела , поскольку утверждалось, что эта шкала больше соответствует слуховой шкале высоты звука , чем акустической мере основной частоты, выраженной в герцах. Двумя альтернативами шкале Мела являются шкала Барка и шкала ERB . [17] разницу между F 1 и F 2, а не F 2 . Другая широко распространенная стратегия – откладывать на горизонтальной оси [ нужна ссылка ]

Форманта Зингера [ править ]

Исследования частотного спектра подготовленных говорящих и классических певцов , особенно певцов мужского пола, указывают на четкую форманту около 3000 Гц (между 2800 и 3400 Гц), которая отсутствует в речи или в спектрах неподготовленных говорящих или певцов. Считается, что это связано с одним или несколькими высшими резонансами речевого тракта. [18] [19] Именно это увеличение энергии на частоте 3000 Гц позволяет певцам быть услышанными и понятыми в оркестре . Эта форманта активно развивается посредством тренировки вокала , например, с помощью так называемого voce di strega или «голоса ведьмы». [20] упражнения и вызвано тем, что часть речевого тракта действует как резонатор . [21] В классической музыке и вокальной педагогике это явление также известно как сквилло .

См. также [ править ]

Ссылки [ править ]

  1. ^ Титце, ИК (1994). Принципы производства голоса, Прентис Холл, ISBN   978-0-13-717893-3 .
  2. ^ Титце, И.Р., Бакен, Р.Дж. Бозман, К.В., Гранквист, С. Хенрих, Н., Хербст, Коннектикут, Ховард, Д.М., Хантер, Э.Дж., Кэлин, Д., Кент, Р.Д., Лёфквист, А., Маккой, С. ., Миллер, Д.Г., Ноэ, Х., Шерер, Р.К., Смит, Дж.Р., Стори, Б.Х., Швец, Дж.Г., Тернстрем, С. и Вульф, Дж. (2015) «На пути к консенсусу в отношении символического обозначения гармоник, резонансов и форманты в вокализации». Дж. Акуст. Соц. Америка. 137, 3005–3007.
  3. ^ Джинс, JH (1938) Наука и музыка, перепечатано Дувром, 1968.
  4. ^ Секретариат по стандартам, Акустическое общество Америки, (1994). ANSI S1.1-1994 (R2004) Американский национальный стандарт акустической терминологии, (12.41) Акустическое общество Америки, Мелвилл, Нью-Йорк.
  5. ^ Германн, Людимар (1894). исследования ( Фонофотографические на немецком языке) (5-е изд.).
  6. ^ Маккендрик, JG (1903). Экспериментальная фонетика. В годовом отчете попечительского совета Смитсоновского института за год, закончившийся 30 июня 1902 г. (стр. 241–259). Смитсоновский институт.
  7. ^ Кэтфорд, JC (1988) Практическое введение в фонетику , Oxford University Press, стр. 161. ISBN   978-0198242178
  8. ^ Рейтер, Кристоф (2009): Роль формантных позиций и микромодуляций в смешении и частичной маскировке музыкальных инструментов. В: Журнал Акустического общества Америки (JASA), Vol. 126,4, с. 2237
  9. ^ Фланаган, Джеймс Л. (1972). Анализ речи, синтез и восприятие . дои : 10.1007/978-3-662-01562-9 . ISBN  978-3-662-01564-3 .
  10. ^ Томас, Эрик Р. (2011). Социофонетика: Введение . Пэлгрейв Макмиллан. п. 145. ИСБН  978-0-230-22455-1 .
  11. ^ Кавахара, Хидеки; Масуда-Кацусэ, Икуё; де Шевенье, Ален (апрель 1999 г.). «Реструктуризация речевых представлений с использованием адаптивного по высоте частотного сглаживания и извлечения F0 на основе мгновенной частоты: возможная роль повторяющейся структуры в звуках». Речевое общение . 27 (3–4): 187–207. дои : 10.1016/S0167-6393(98)00085-5 .
  12. ^ Ладефогед, Питер (2006) Курс фонетики (пятое издание) , Бостон, Массачусетс: Томсон Уодсворт, стр. 188. ISBN   1-4130-2079-8
  13. ^ Ладефогед, Питер (2001) Гласные и согласные: введение в звуки языка , Малдерн, Массачусетс: Блэквелл, с. 40. ISBN   0-631-21412-7
  14. ^ Детердинг, Дэвид (1997) «Форманты гласных монофтонгов в стандартном южно-британском английском произношении», Журнал Международной фонетической ассоциации , 27, стр. 47–55.
  15. ^ Хейворд, Катрина (2000) Экспериментальная фонетика , Харлоу, Великобритания: Пирсон, стр. 149. ISBN   0-582-29137-2
  16. ^ Ладефогед, П. (1967). Три области экспериментальной фонетики . Оксфорд. п. 87.
  17. ^ Хейворд, К. (2000). Экспериментальная фонетика . Лонгман. ISBN  0-582-29137-2 .
  18. ^ Сундберг, Дж. (1974). «Артикуляционная интерпретация« певческой форманты »», Журнал Акустического общества Америки , 55, 838–844.
  19. ^ Беле, Ирен Вельсвик (декабрь 2006 г.). «Форманта спикера». Дж. Голос . 20 (4): 555–578. дои : 10.1016/j.jvoice.2005.07.001 . ПМИД   16325374 .
  20. ^ Фриселл, Энтони (2007). Голос баритона . Бостон: Branden Books. п. 84. ИСБН  978-0-8283-2181-5 .
  21. ^ Сундберг, Йохан (1987). Наука о певческом голосе . ДеКалб, Иллинойс: Издательство Университета Северного Иллинойса . ISBN  0-87580-542-6 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: cdc39dbe7e8c1b0f10ca1c98228039bf__1717599300
URL1:https://arc.ask3.ru/arc/aa/cd/bf/cdc39dbe7e8c1b0f10ca1c98228039bf.html
Заголовок, (Title) документа по адресу, URL1:
Formant - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)