Форманта
В речевой науке и фонетике формантой называют широкий спектральный максимум, возникающий в результате акустического резонанса речевого тракта человека . [1] [2] В акустике формантой обычно называют широкий пик или локальный максимум спектра. [3] [4] Для гармонических звуков в этом определении за формантную частоту иногда принимают частоту той гармоники , которая больше всего усиливается резонансом. Разница между этими двумя определениями заключается в том, характеризуют ли «форманты» механизмы производства звука или сам производимый звук. На практике частота спектрального пика немного отличается от соответствующей резонансной частоты, за исключением случаев, когда гармоники по счастливой случайности совпадают с резонансной частотой или когда источник звука в основном негармоничен, как при шепоте и вокале .
Можно сказать, что комната имеет форманты, характерные для этой конкретной комнаты, благодаря ее резонансам, т. е. тому, как звук отражается от ее стен и предметов. Комнатные форманты такого типа усиливают себя, подчеркивая определенные частоты и поглощая другие, как это использовал, например, Элвин Люсье в своей пьесе «Я сижу в комнате» . При цифровой обработке акустических сигналов то, как совокупность формант (например, комната) влияет на сигнал, может быть представлено импульсной характеристикой .
И в речи, и в комнате форманты являются характерными чертами резонансов пространства. Говорят, что их возбуждают акустические источники, такие как голос, и они формируют (фильтруют) звуки источников, но сами по себе они не являются источниками.
История
[ редактировать ]С акустической точки зрения фонетика столкнулась с серьезной проблемой, связанной с идеей о том, что эффективная длина речевого тракта меняет гласные. [5] Действительно, при изменении длины речевого тракта все акустические резонаторы, образованные ротовыми полостями, масштабируются, как и их резонансные частоты. Поэтому было неясно, как гласные могут зависеть от частот, когда говорящие с разной длиной речевого тракта, например, певцы баса и сопрано , могут производить звуки, которые воспринимаются как принадлежащие к одной и той же фонетической категории. Должен был быть какой-то способ нормализовать спектральную информацию, лежащую в основе идентичности гласных. Герман предложил решение этой проблемы в 1894 году, введя термин «форманта». Гласный звук, по его мнению, представляет собой особое акустическое явление, зависящее от периодического возникновения особого частичного, или «формантного», или «характеристического» признака. Частота «форманты» может немного меняться без изменения характера гласной. Например, для «длинного е» ( ee или iy ) самая низкочастотная «форманта» может варьироваться от 350 до 440 Гц даже у одного и того же человека. [6]
Фонетика
[ редактировать ]Гласный ( МПА ) | Формант Ф 1 (Гц) | Форма Ф2 (Гц) | Разница Ф2 – FФ1 (Гц) |
---|---|---|---|
я | 240 | 2400 | 2160 |
и | 235 | 2100 | 1865 |
и | 390 | 2300 | 1910 |
ø | 370 | 1900 | 1530 |
е | 610 | 1900 | 1290 |
œ | 585 | 1710 | 1125 |
а | 850 | 1610 | 760 |
ɶ | 820 | 1530 | 710 |
ɑ | 750 | 940 | 190 |
ɒ | 700 | 760 | 60 |
ʌ | 600 | 1170 | 570 |
ɔ | 500 | 700 | 200 |
ɤ | 460 | 1310 | 850 |
тот | 360 | 640 | 280 |
ɯ | 300 | 1390 | 1090 |
в | 250 | 595 | 345 |
Форманты – это отличительные частотные составляющие акустического сигнала, вырабатываемого речью, музыкальными инструментами. [8] или пение . Информация, необходимая людям для различения звуков речи, может быть представлена чисто количественно путем указания пиков в частотном спектре.Большинство этих формант производятся в результате резонанса трубки и камеры , но несколько свистящих тонов возникают в результате периодического коллапса в результате эффекта Вентури . зон низкого давления [9]
Форманта с самой низкой частотой называется F 1 , вторая F 2 , третья F 3 и так далее. Основная частота или высота голоса иногда обозначается как F 0 , но это не форманта. двух первых формант, F 1 и F 2 Чаще всего для идентификации гласной достаточно . Взаимосвязь между воспринимаемым качеством гласных и первыми двумя формантными частотами можно оценить, слушая «искусственные гласные», которые генерируются путем пропускания последовательности щелчков (для имитации последовательности голосовых импульсов) через пару полосовых фильтров (для имитации голосового тракта). резонансы). Гласные переднего ряда имеют более высокий F 2 , а гласные нижнего ряда имеют более высокий F 1 . Округление губ имеет тенденцию понижать F 1 и F 2 в гласных заднего ряда и F 2 и F 3 в гласных переднего ряда. [10]
Носовые согласные обычно имеют дополнительную форманту около 2500 Гц. Жидкий [l] обычно имеет дополнительную форманту на частоте 1500 Гц, тогда как английский звук «r» ( [ɹ] ) отличается очень низкой третьей формантой (значительно ниже 2000 Гц).
Взрывные звуки (и, в некоторой степени, фрикативные звуки ) изменяют расположение формант в окружающих гласных. Двугубные звуки (например, /b/ и /p/ в словах «шар» или «сок») вызывают понижение формант; на спектрограммах велярные звуки ( /k/ и /ɡ/ на английском языке) почти всегда показывают, что F 2 и F 3 собираются вместе в «веларном сжатии» перед велярным сжатием и отделяются от того же «щепотки» при отпускании велярного звука; альвеолярные звуки (английские /t/ и /d/ ) вызывают меньше систематических изменений в формантах соседних гласных, частично в зависимости от того, какая именно гласная присутствует. Временной ход этих изменений частот формант гласных называется «формантными переходами».
В нормальной звонкой речи основная вибрация, создаваемая голосовыми связками, напоминает пилообразную волну , богатую гармонические обертоны. Если основная частота или (чаще) один из обертонов выше резонансной частоты системы, то резонанс будет возбуждаться слабо и форманта, обычно сообщаемая этим резонансом, будет в основном потеряна. Это наиболее очевидно в случае певцов- сопрано оперных , которые поют на такой высоте, что их гласные становится очень трудно различить.
Контроль резонансов является важным компонентом вокальной техники, известной как обертонное пение , при которой исполнитель поет низкий основной тон и создает резкие резонансы для выделения верхних гармоник , создавая впечатление одновременного пения нескольких тонов.
Спектрограммы можно использовать для визуализации формант. На спектрограммах может быть трудно отличить форманты от естественных гармоник, возникающих при пении. Однако можно услышать естественные форманты в форме гласных с помощью атональных техник, таких как вокальный фрай .
Формирование сметы
[ редактировать ]Форманты, независимо от того, рассматриваются ли они как акустические резонансы речевого тракта или как локальные максимумы в речевом спектре, как полосовые фильтры , определяются их частотой и шириной спектра ( шириной полосы пропускания ).
Существуют разные методы получения этой информации. Формантные частоты в их акустическом определении можно оценить по частотному спектру звука с помощью спектрограммы (на рисунке) или анализатора спектра. Однако для оценки акустических резонансов речевого тракта (т.е. определения формант речи) по записи речи можно использовать кодирование с линейным предсказанием . Промежуточный подход заключается в извлечении огибающей спектра путем нейтрализации основной частоты. [11] и только потом ищем локальные максимумы в огибающей спектра.
Формантные графики
[ редактировать ]Первые две форманты важны для определения качества гласных, и часто говорят, что они соответствуют размерам открытого/закрытого (или низкого/высокого) и переднего/заднего размеров (которые традиционно связывались с формой и положением языка ) . . Таким образом, первая форманта F 1 имеет более высокую частоту для открытой или низкой гласной, такой как [a] и более низкую частоту для закрытой или высокой гласной, такой как [i] или [u] ; а вторая форманта F 2 имеет более высокую частоту для гласной переднего ряда, например [i] и более низкую частоту для гласной заднего ряда, например [u] . [12] [13]
Гласные почти всегда имеют четыре или более различимых форманты, а иногда и более шести. Однако первые две форманты являются наиболее важными для определения качества гласных, и их часто сравнивают друг с другом на диаграммах гласных. [14] хотя это упрощение не отражает некоторые аспекты качества гласных, такие как округление. [15]
Многие авторы обращались к проблеме нахождения оптимального выравнивания положений гласных на формантных графиках с позициями на обычном четырехугольнике гласных. Новаторская работа Ladefoged [16] использовал шкалу Мела , поскольку утверждалось, что эта шкала больше соответствует слуховой шкале высоты звука , чем акустической мере основной частоты, выраженной в герцах. Двумя альтернативами шкале Мела являются шкала Барка и шкала ERB . [17] разницу между F 1 и F 2, а не F 2 . Другая широко распространенная стратегия – откладывать на горизонтальной оси [ нужна ссылка ]
Формата Сингера
[ редактировать ]Исследования частотного спектра подготовленных говорящих и классических певцов , особенно певцов мужского пола, указывают на четкую форманту около 3000 Гц (между 2800 и 3400 Гц), которая отсутствует в речи или в спектрах неподготовленных говорящих или певцов. Считается, что это связано с одним или несколькими высшими резонансами речевого тракта. [18] [19] Именно это увеличение энергии на частоте 3000 Гц позволяет певцам быть услышанными и понятыми в оркестре . Эта форманта активно развивается посредством тренировки вокала , например, с помощью так называемого voce di strega или «голоса ведьмы». [20] упражнения и вызвано тем, что часть речевого тракта действует как резонатор . [21] В классической музыке и вокальной педагогике это явление также известно как сквилло .
См. также
[ редактировать ]- Формантный синтез
- Человеческий голос
- Линейное прогнозирующее кодирование
- Разговаривать
- Тембр
- Вокодер
Ссылки
[ редактировать ]- ^ Титце, ИК (1994). Принципы производства голоса, Прентис Холл, ISBN 978-0-13-717893-3 .
- ^ Титце, И.Р., Бакен, Р.Дж. Бозман, К.В., Гранквист, С. Хенрих, Н., Хербст, Коннектикут, Ховард, Д.М., Хантер, Э.Дж., Кэлин, Д., Кент, Р.Д., Лёфквист, А., Маккой, С. ., Миллер, Д.Г., Ноэ, Х., Шерер, Р.К., Смит, Дж.Р., Стори, Б.Х., Швец, Дж.Г., Тернстрем, С. и Вульф, Дж. (2015) «На пути к консенсусу в отношении символического обозначения гармоник, резонансов и форманты в вокализации». Дж. Акуст. Соц. Америка. 137, 3005–3007.
- ^ Джинс, JH (1938) Наука и музыка, перепечатано Дувром, 1968.
- ^ Секретариат по стандартам, Акустическое общество Америки, (1994). ANSI S1.1-1994 (R2004) Американский национальный стандарт акустической терминологии, (12.41) Акустическое общество Америки, Мелвилл, Нью-Йорк.
- ^ Германн, Людимар (1894). исследования ( Фонофотографические на немецком языке) (5-е изд.).
- ^ Маккендрик, JG (1903). Экспериментальная фонетика. В годовом отчете попечительского совета Смитсоновского института за год, закончившийся 30 июня 1902 г. (стр. 241–259). Смитсоновский институт.
- ^ Кэтфорд, JC (1988) Практическое введение в фонетику , Oxford University Press, стр. 161. ISBN 978-0198242178
- ^ Рейтер, Кристоф (2009): Роль формантных позиций и микромодуляций в смешении и частичной маскировке музыкальных инструментов. В: Журнал Акустического общества Америки (JASA), Vol. 126,4, с. 2237
- ^ Фланаган, Джеймс Л. (1972). Анализ речи, синтез и восприятие . дои : 10.1007/978-3-662-01562-9 . ISBN 978-3-662-01564-3 .
- ^ Томас, Эрик Р. (2011). Социофонетика: Введение . Пэлгрейв Макмиллан. п. 145. ИСБН 978-0-230-22455-1 .
- ^ Кавахара, Хидеки; Масуда-Кацусэ, Икуё; де Шевенье, Ален (апрель 1999 г.). «Реструктуризация речевых представлений с использованием адаптивного по высоте частотного сглаживания и извлечения F0 на основе мгновенной частоты: возможная роль повторяющейся структуры в звуках». Речевое общение . 27 (3–4): 187–207. дои : 10.1016/S0167-6393(98)00085-5 .
- ^ Ладефогед, Питер (2006) Курс фонетики (пятое издание) , Бостон, Массачусетс: Томсон Уодсворт, стр. 188. ISBN 1-4130-2079-8
- ^ Ладефогед, Питер (2001) Гласные и согласные: введение в звуки языка , Малдерн, Массачусетс: Блэквелл, с. 40. ISBN 0-631-21412-7
- ^ Детердинг, Дэвид (1997) «Форманты гласных монофтонгов в стандартном южно-британском английском произношении», Журнал Международной фонетической ассоциации , 27, стр. 47–55.
- ^ Хейворд, Катрина (2000) Экспериментальная фонетика , Харлоу, Великобритания: Пирсон, стр. 149. ISBN 0-582-29137-2
- ^ Ладефогед, П. (1967). Три области экспериментальной фонетики . Оксфорд. п. 87.
- ^ Хейворд, К. (2000). Экспериментальная фонетика . Лонгман. ISBN 0-582-29137-2 .
- ^ Сундберг, Дж. (1974). «Артикуляционная интерпретация« певческой форманты »», Журнал Акустического общества Америки , 55, 838–844.
- ^ Беле, Ирен Вельсвик (декабрь 2006 г.). «Форманта спикера». Дж. Голос . 20 (4): 555–578. дои : 10.1016/j.jvoice.2005.07.001 . ПМИД 16325374 .
- ^ Фриселл, Энтони (2007). Голос баритона . Бостон: Branden Books. п. 84. ИСБН 978-0-8283-2181-5 .
- ^ Сундберг, Йохан (1987). Наука о певческом голосе . ДеКалб, Иллинойс: Издательство Университета Северного Иллинойса . ISBN 0-87580-542-6 .
Внешние ссылки
[ редактировать ]- Форманты для удовольствия и прибыли
- Форманты и педали вау-вау
- Что такое формант? Обсуждение трех различных значений слова «формант».
- Формантная настройка певцов-сопрано из Университета Нового Южного Уэльса.
- Акустика гармонического или обертонового пения от Университета Нового Южного Уэльса.
- Материалы для измерения и построения формант гласных