Момель
Эта статья нуждается в дополнительных цитатах для проверки . ( ноябрь 2007 г. ) |
Momel ( Mo delling mel ody) — алгоритм, разработанный Дэниелом Херстом и Робертом Эспессером в CNRS Laboratoire Parole et Langage , [ 1 ] Экс-ан-Прованс : [ 1 ] для анализа и синтеза интонационных моделей.
Цель
[ редактировать ]При анализе необработанных кривых основных частот для изучения интонации необходимо учитывать тот факт, что говорящие одновременно воспроизводят интонационный образец и последовательность слогов, состоящих из сегментных звуков. Фактические необработанные кривые основных частот, которые можно проанализировать акустически, являются результатом взаимодействия этих двух компонентов, и это затрудняет сравнение интонационных моделей, когда они созданы из разных сегментных материалов. Сравните, например, интонационную структуру высказываний «Это для папы» и «Это для мамы» .
Алгоритм
[ редактировать ]Алгоритм Момеля пытается решить эту проблему, разбивая необработанные кривые на два компонента:
- макромелодический компонент , смоделированный как квадратичная сплайн-функция . Предполагается, что это соответствует общему контуру высоты звука высказывания и не зависит от природы составляющих фонем. Основная гипотеза заключается в том, что этот макромелодический компонент, в отличие от необработанных кривых основных частот, является одновременно непрерывным и плавным . Это примерно соответствует тому, что мы производим, если мы напеваем высказывание вместо того, чтобы произносить его.
- микромелодический компонент , состоящий из отклонений от макромелодической кривой, — называемый микромелодическим профилем . Предполагается, что эта остаточная кривая целиком определяется сегментными составляющими высказывания и не зависит от макромелодического компонента.
Квадратичная сплайн-функция, используемая для моделирования макромелодического компонента, определяется последовательностью целевых точек (пар <s, Hz>, каждая пара которых связана двумя монотонными параболическими кривыми, причем сплайн-узел возникает (по умолчанию) в средней точке). между двумя целями. Первая производная определенной таким образом кривой равна нулю в каждой целевой точке, и две параболы имеют одинаковое значение и одну и ту же производную в сплайновом узле. Это фактически определяет самую простую математическую функцию, для которой кривые одновременно непрерывны и плавны.
Подразумеваемое
[ редактировать ]С одной стороны, два высказывания «За маму!» и «За папу!» Таким образом, можно было смоделировать с теми же целевыми точками (следовательно, с тем же макромелодическим компонентом), а «Для мамы?» и «Для папы?» также будут иметь те же целевые точки, но, вероятно, будут отличаться от точек первой пары.
С другой стороны, высказывания «За маму!» и «Для мамы?» можно смоделировать с тем же микромелодическим профилем, но с другой целевой точкой, тогда как «За папу!» и «Для папы?» также будет иметь тот же микромелодический профиль, но будет отличаться от профиля первой пары.
Алгоритм Момеля выводит то, что его авторы называют фонетическим представлением интонационного паттерна, который нейтральен по отношению к производству и восприятию речи, поскольку, хотя он и не выведен явно из модели производства или восприятия, он содержит достаточную информацию, позволяющую его используется в качестве входных данных для моделей любого процесса. Относительно нейтральный с теоретической точки зрения характер алгоритма позволил использовать его в качестве первого шага в получении таких представлений, как модели Фудзисаки (Mixdorff 1999), ToBI . 2000). (Maghbouleh 1999, Wightman & al. 2000) или INTSINT (Hirst & al. 2000) или INTSINT (Hirst & al Эспессер 1993, Херст и др. 2000).
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Lpl: Лаборатория Parole Et Langage. Архивировано 7 января 2013 г. на archive.today.
- Херст, Дэниел и Роберт Эспессер, 1993. Автоматическое моделирование основной частоты с использованием квадратичной сплайн-функции. Travaux de l’Institut de Phonetique d’Aix 15, 71–85.
- Херст, Дэниел, Альберт Ди Кристо и Роберт Эспессер 2000. Уровни представления и уровни анализа интонации. в М. Хорне (редактор) Просодия: теория и эксперимент . Kluwer Academic Publishers, Дордрехт. 51-87
- Магбуле, А., 1998. Распознавание типа акцента ToBI. В: Труды ICSLP 98 .
- Миксдорфф, Х., 1999. Новый подход к полностью автоматическому извлечению параметров модели Фудзисаки. В материалах ICASSP 1999 г.
- Вайтман К. и Кэмпбелл Н., 1995. Улучшенная маркировка просодической структуры. IEEE Транс. по обработке речи и звука.
Внешние ссылки
[ редактировать ]Автоматическое аннотирование Momel может выполняться с помощью SPPAS.