Jump to content

Момель

Momel ( Mo delling mel ody) — алгоритм, разработанный Дэниелом Херстом и Робертом Эспессером в CNRS Laboratoire Parole et Langage , [ 1 ] Экс-ан-Прованс : [ 1 ] для анализа и синтеза интонационных моделей.

При анализе необработанных кривых основных частот для изучения интонации необходимо учитывать тот факт, что говорящие одновременно воспроизводят интонационный образец и последовательность слогов, состоящих из сегментных звуков. Фактические необработанные кривые основных частот, которые можно проанализировать акустически, являются результатом взаимодействия этих двух компонентов, и это затрудняет сравнение интонационных моделей, когда они созданы из разных сегментных материалов. Сравните, например, интонационную структуру высказываний «Это для папы» и «Это для мамы» .

Алгоритм

[ редактировать ]

Алгоритм Момеля пытается решить эту проблему, разбивая необработанные кривые на два компонента:

  • макромелодический компонент , смоделированный как квадратичная сплайн-функция . Предполагается, что это соответствует общему контуру высоты звука высказывания и не зависит от природы составляющих фонем. Основная гипотеза заключается в том, что этот макромелодический компонент, в отличие от необработанных кривых основных частот, является одновременно непрерывным и плавным . Это примерно соответствует тому, что мы производим, если мы напеваем высказывание вместо того, чтобы произносить его.
  • микромелодический компонент , состоящий из отклонений от макромелодической кривой, — называемый микромелодическим профилем . Предполагается, что эта остаточная кривая целиком определяется сегментными составляющими высказывания и не зависит от макромелодического компонента.

Квадратичная сплайн-функция, используемая для моделирования макромелодического компонента, определяется последовательностью целевых точек (пар <s, Hz>, каждая пара которых связана двумя монотонными параболическими кривыми, причем сплайн-узел возникает (по умолчанию) в средней точке). между двумя целями. Первая производная определенной таким образом кривой равна нулю в каждой целевой точке, и две параболы имеют одинаковое значение и одну и ту же производную в сплайновом узле. Это фактически определяет самую простую математическую функцию, для которой кривые одновременно непрерывны и плавны.

Подразумеваемое

[ редактировать ]

С одной стороны, два высказывания «За маму!» и «За папу!» Таким образом, можно было смоделировать с теми же целевыми точками (следовательно, с тем же макромелодическим компонентом), а «Для мамы?» и «Для папы?» также будут иметь те же целевые точки, но, вероятно, будут отличаться от точек первой пары.

С другой стороны, высказывания «За маму!» и «Для мамы?» можно смоделировать с тем же микромелодическим профилем, но с другой целевой точкой, тогда как «За папу!» и «Для папы?» также будет иметь тот же микромелодический профиль, но будет отличаться от профиля первой пары.

Алгоритм Момеля выводит то, что его авторы называют фонетическим представлением интонационного паттерна, который нейтральен по отношению к производству и восприятию речи, поскольку, хотя он и не выведен явно из модели производства или восприятия, он содержит достаточную информацию, позволяющую его используется в качестве входных данных для моделей любого процесса. Относительно нейтральный с теоретической точки зрения характер алгоритма позволил использовать его в качестве первого шага в получении таких представлений, как модели Фудзисаки (Mixdorff 1999), ToBI . 2000). (Maghbouleh 1999, Wightman & al. 2000) или INTSINT (Hirst & al. 2000) или INTSINT (Hirst & al Эспессер 1993, Херст и др. 2000).

  • Херст, Дэниел и Роберт Эспессер, 1993. Автоматическое моделирование основной частоты с использованием квадратичной сплайн-функции. Travaux de l’Institut de Phonetique d’Aix 15, 71–85.
  • Херст, Дэниел, Альберт Ди Кристо и Роберт Эспессер 2000. Уровни представления и уровни анализа интонации. в М. Хорне (редактор) Просодия: теория и эксперимент . Kluwer Academic Publishers, Дордрехт. 51-87
  • Магбуле, А., 1998. Распознавание типа акцента ToBI. В: Труды ICSLP 98 .
  • Миксдорфф, Х., 1999. Новый подход к полностью автоматическому извлечению параметров модели Фудзисаки. В материалах ICASSP 1999 г.
  • Вайтман К. и Кэмпбелл Н., 1995. Улучшенная маркировка просодической структуры. IEEE Транс. по обработке речи и звука.
[ редактировать ]

Автоматическое аннотирование Momel может выполняться с помощью SPPAS.

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 41a9ededa0b929945de4c3078c050677__1661680200
URL1:https://arc.ask3.ru/arc/aa/41/77/41a9ededa0b929945de4c3078c050677.html
Заголовок, (Title) документа по адресу, URL1:
Momel - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)