Jump to content

Модель источник-фильтр

Модель источник-фильтр представляет речь как комбинацию источника звука, такого как голосовые связки , и линейного акустического фильтра, речевого тракта . Хотя эта модель является лишь приближением, она широко используется в ряде приложений, таких как синтез речи и анализ речи, из-за ее относительной простоты. Это также связано с линейным предсказанием . Разработка модели во многом обязана ранним работам Гуннара Фанта , хотя другие, особенно Кен Стивенс , также внесли существенный вклад в модели, лежащие в основе акустического анализа речи и синтеза речи. [1] Фант опирался на работы Цутому Чибы и Масато Кадзиямы, которые впервые показали связь между акустическими свойствами гласных и формой речевого тракта. [1]

Важным допущением, которое часто делается при использовании модели источник-фильтр, является независимость источника и фильтра. [1] В таких случаях модель правильнее называть «моделью независимого источника-фильтра». [ нужна ссылка ]

В 1942 году Тиба и Кадзияма опубликовали свои исследования акустики гласных и речевого тракта в своей книге « Гласный звук: его природа и структура» . Создав модели речевого тракта с помощью рентгеновской фотографии , они смогли предсказать формантные частоты различных гласных, установив связь между ними. Гуннар Фант, пионер в области речевого развития, использовал исследования Чибы и Каджиямы, включающие рентгеновскую фотографию речевого тракта, для интерпретации своих собственных данных о звуках русской речи в «Акустической теории речевого производства» , которая установила модель «источник-фильтр». [2]

Приложения

[ редактировать ]

В разной степени разные фонемы можно отличить по свойствам их источника (источников) и их спектральной форме . Звонкие звуки (например, гласные) имеют по крайней мере один источник из-за преимущественно периодического возбуждения голосовой щели, которое можно аппроксимировать последовательностью импульсов во временной области и гармониками в частотной области, а также фильтром, который зависит, например, от языка. положение и выпячивание губ. [3] С другой стороны, фрикативные звуки , такие как [s] и [f] , имеют по крайней мере один источник из-за турбулентного шума, возникающего при сужении ротовой полости или глотки . Так называемые звонкие фрикативные звуки , такие как [z] и [v] , имеют два источника — один в голосовой щели и один в надгортанном сужении.

Синтез речи

[ редактировать ]

При реализации модели производства речи источник-фильтр источник звука или сигнал возбуждения часто моделируется как периодическая последовательность импульсов для вокализованной речи или белый шум для невокализованной речи. Фильтр речевого тракта в простейшем случае аппроксимируется всеполюсным фильтром, где коэффициенты получаются путем выполнения линейного прогнозирования для минимизации среднеквадратической ошибки в воспроизводимом речевом сигнале. Свертка сигнала возбуждения с откликом фильтра затем дает синтезированную речь.

Моделирование производства человеческой речи

[ редактировать ]
Одна из возможных комбинаций источника и фильтра в голосовом тракте человека.

При воспроизведении человеческой речи источником звука являются голосовые связки , которые могут производить периодический звук при сжатии или апериодический звук (белый шум) при расслаблении. [4] Фильтром является остальная часть речевого тракта, которая может менять форму при манипуляциях с глоткой , ртом и полостью носа. [3] Фант грубо сравнивает источник и фильтр с фонацией и артикуляцией соответственно. Источник создает ряд гармоник различной амплитуды , которые проходят через речевой тракт и либо усиливаются, либо ослабляются, образуя звук речи. [4]

См. также

[ редактировать ]
  1. ^ Jump up to: а б с Арай, Такаюки (2004). «История Тибы и Кадзиямы и их влияние в современной науке о речи». От звука к смыслу: более 50 лет открытий в области речевой коммуникации (PDF) . стр. 115–120.
  2. ^ Фант, Гуннар (2001). «Т. Чиба и М. Кадзияма, пионеры речевой акустики» . Журнал Фонетического общества Японии . 5 (2). дои : 10.24467/онсейкенкю.5.2_4 . Проверено 3 июля 2020 г.
  3. ^ Jump up to: а б Фант, Гуннар (1970). Акустическая теория речевого производства с расчетами на основе рентгеновских исследований русской артикуляции . Де Грютер.
  4. ^ Jump up to: а б Жига, Элизабет К. (2012). Звуки языка: введение в фонетику и фонологию . Джон Уайли и сыновья. ISBN  978-1-118-34060-8 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f37660dbfcf747c68a0f87c02202add8__1666755840
URL1:https://arc.ask3.ru/arc/aa/f3/d8/f37660dbfcf747c68a0f87c02202add8.html
Заголовок, (Title) документа по адресу, URL1:
Source–filter model - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)