ВОЗЬМИ
ARPABET (также пишется ARPAbet ) — это набор кодов фонетической транскрипции, разработанный Агентством перспективных исследовательских проектов (ARPA) в рамках их проекта по исследованию понимания речи в 1970-х годах. Он представляет фонемы и аллофоны общего американского английского языка с различными последовательностями символов ASCII . Были разработаны две системы: одна представляет каждый сегмент одним символом (чередующиеся прописные и строчные буквы), а другая - одним или двумя (без учета регистра), причем последняя получила гораздо более широкое распространение. [1]
ARPABET использовался в нескольких синтезаторах речи , включая Computalker для системы S-100, SAM для Commodore 64 , SAY для Amiga , TextAssist для ПК и Speakeasy от Intelligent Artefacts, в которых использовалась микросхема синтезатора речи Votrax SC-01. Он также используется в словаре произношения CMU . Пересмотренная версия ARPABET используется в корпусе TIMIT . [1]
Символы
[ редактировать ]Ударение обозначается цифрой, следующей сразу за гласной. Вспомогательные символы идентичны в 1- и 2-буквенном коде. В двухбуквенной записи сегменты разделяются пробелом.
ВОЗЬМИ | НАСИЛИЕ | Пример(ы) | |
---|---|---|---|
1 буква | 2-буквенный | ||
@ | АА | ɑ ~ ɒ | b al m, bot (со слиянием отца и беспокойства ) |
а | НО | ой | б а т |
А | АХ | ʌ | ты но |
с | К | ɔ | да история , |
В | Оу | а' | бой |
х | ТОПОР | а | сообщение |
— | АКСР [3] | ɚ | письмо , вперед |
И | ЯВЛЯЕТСЯ | ааа | кусать |
И | ЭХ | е | Б е т |
Р | ЯВЛЯЕТСЯ | ɝ | птица , передняя часть или d |
и | ЭЙ | еɪ | приманка |
я | IH | ɪ | кусочек |
Х | IX | ɨ | розы , кролик |
я | я | я | бить |
тот | ОЙ | о'' | лодка |
ТО | ООО | ɔɪ | мальчик |
В | ЭМ-М-М | ʊ | книга |
в | ТВОЙ | в | ботинок |
— | UX [3] | ʉ | чувак |
ВОЗЬМИ | НАСИЛИЕ | Пример | |
---|---|---|---|
1 буква | 2-буквенный | ||
б | Б | б | купить |
С | СН | тʃ | Китай |
д | Д | д | d |
Д | ДХ | д | ты |
Ф | DX | ɾ | масло |
л | ОН | л̩ | бутылка ле |
М | В | м̩ | ритм м |
Н | В | н̩ | кнопка |
ж | Ф | ж | драться |
г | Г | ɡ | парень |
час | ЧЧ или Ч [3] | час | высокий |
Дж | Дж.Х. | дʒ | даю |
к | К | к | знать ite |
л | л | л | ложь |
м | М | м | мой |
н | Н | н | но |
Г | NX или НГ [3] | ŋ | siМистер |
— | НХ [3] | ɾ̃ | победитель |
п | П | п | п.е ie |
вопрос | вопрос | ʔ | э - э- э |
р | Р | ɹ | ты |
с | С | с | вздох |
С | Ш | ʃ | застенчивый |
т | Т | т | галстук |
Т | ТД | я | бедро |
v | V | v | жизнь ie |
В | В | В | мудрый |
ЧАС | WH | ʍ | почему (без слияния вино-нытье ) |
и | И | дж | да, это так |
С | С | С | да oo |
С | ZH | ʒ | удовольствие |
АБ | Описание |
---|---|
0 | Никакого стресса |
1 | Первичный стресс |
2 | Вторичный стресс |
3... | Третичный и дальнейший стресс |
- | Тишина |
! | Неречевой сегмент |
+ | морфемы Граница |
/ | Граница слова |
# | высказывания Граница |
: | группы тонов Граница |
:1 или . | Падающий или нисходящий момент |
:2 или ? | Восходящий или внутренний перелом |
:3 или . | Падение-подъем или нетерминальный переход |
ТИОН
[ редактировать ]В TIMIT помимо перечисленных выше используются следующие символы: [4]
Символ | НАСИЛИЕ | Пример | Описание |
---|---|---|---|
АКС-Х | ə̥ | подозревать | Преданный /ə/ |
БКЛ | б̚ | получать | [б] закрытие |
ДКЛ | д̚ | ширина | [г] закрытие |
RU | нг | Стиральная тонна | Syllabic слоговый |
ГКЛ | ɡ̚ | сделать зуб | [ɡ] закрытие |
Х.В. | ɦ | предстоящий | Озвученный / ч / |
ККЛ | к̚ | сделать что- то | [к] закрытие |
ПКЛ | р̚ | принимать | [р] закрытие |
ТКЛ | т̚ | кошачий кусок | [т] закрытие |
БОЛЬШЕ НИКОГДА | — | — | Пауза |
И | — | — | Эпентетическая тишина |
ЧАС# | — | — | Маркер начала/конца |
См. также
[ редактировать ]- Сравнение кодировок ASCII международного фонетического алфавита
- SAMPA , зависит от языка
- X-SAMPA , кодирующий весь международный фонетический алфавит.
- Изменение произношения на английском языке
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Клаутау, Альдебаро (2001). «АЛФАВИТ и алфавит ТИМИТ» (PDF ) Архивировано из оригинала (PDF) 3 июня . Получено 8 , сентября
- ^ Перейти обратно: а б с Райс, Ллойд (апрель 1976 г.). «Аппаратное и программное обеспечение для синтеза речи» . Журнал доктора Добба по компьютерной гимнастике и ортодонтии . 1 (4): 6–8.
- ^ Перейти обратно: а б с д и Юрафски, Дэниел ; Мартин, Джеймс Х. (2000). Обработка речи и языка: введение в обработку естественного языка, компьютерную лингвистику и распознавание речи . Прентис Холл. стр. 94–5. ISBN 0-1309-5069-6 .
- ^ «Таблица всех фонематических и фонетических символов, используемых в лексиконе TIMIT» . Консорциум лингвистических данных. 12 октября 1990 года . Проверено 8 сентября 2017 г.