САМП
![]() | Эта статья включает список литературы , связанную литературу или внешние ссылки , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( Май 2018 г. ) |
Фонетический алфавит методов оценки речи ( SAMPA ) — это читаемый компьютером фонетический алфавит, в котором используются 7-битные печатные символы ASCII , основанный на Международном фонетическом алфавите (IPA). Первоначально он был разработан в конце 1980-х годов для шести европейских языков в рамках программы исследований и разработок информационных технологий ЕЭК ESPRIT . Максимальное количество символов было заимствовано у IPA; там, где это невозможно, используются другие имеющиеся знаки, например [ @
] для швы (IPA [ə] ), [ 2
] для гласного звука во французском deux «два» (IPA [ø] ), и [ 9
] для гласного звука во французском языке neuf «девять» (IPA [œ] ).
Сегодня официально SAMPA разработана для всех звуков следующих языков:
Персонажи [ "s{mp@
] представляет собой произношение названия SAMPA на английском языке, с начальным символом ["] обозначающим основное ударение. Как и IPA, SAMPA обычно заключается в квадратные скобки или косую черту , которые не являются частью собственно алфавита и просто означают, что это фонетическое слово. в отличие от обычного текста.
Функции
[ редактировать ]SAMPA была разработана в конце 1980-х годов в рамках Европейской комиссией финансируемого проекта ESPRIT 2589 «Методы оценки речи» (SAM) - отсюда и «Фонетический алфавит SAM» - с целью облегчить обмен данными по электронной почте и вычислительную обработку транскрипций в фонетике и речевых технологиях.
это частичная кодировка IPA SAMPA — . Первая версия SAMPA представляла собой объединение наборов кодов фонем датского, голландского, английского, французского, немецкого и итальянского языков; более поздние версии расширили SAMPA, включив в него другие европейские языки. Поскольку SAMPA основана на реестре фонем, каждая таблица SAMPA действительна только на том языке, для которого она была создана. Чтобы сделать эту IPA технику кодирования универсально применимой, была создана X-SAMPA , которая предоставляет одну единую таблицу без различий, специфичных для языка.
SAMPA была разработана как способ обойти неспособность текстовых кодировок представлять символы IPA. Следовательно, по мере того, как поддержка символов IPA в Юникоде становится все более распространенной, необходимость в отдельной, читаемой компьютером системе для представления IPA в ASCII уменьшается. Однако ввод текста зависит от определенных кодировок клавиатуры или устройств ввода. По этой причине SAMPA и X-SAMPA до сих пор широко используются. [1] [ нужен лучший источник ] в вычислительной фонетике и в речевых технологиях.
См. также
[ редактировать ]- Сравнение кодировок ASCII международного фонетического алфавита
- График САМПА
- Таблица SAMPA для английского языка , краткая версия
- X-SAMPA , независимая от языка нотация, похожая на SAMPA, но охватывающая весь репертуар IPA.
- Речевой корпус BABEL
Ссылки
[ редактировать ]- ^ «Персонализированное распознавание нестандартной речи в рамках проекта Euphonia» . Блог Google AI . Проверено 16 августа 2019 г.
- Ранчход, Элизабет и Дж. Мамед, Нуно (2002). Достижения в обработке естественного языка: Третья международная конференция, PortAL 2002, Фаро, Португалия, 23–26 июня 2002 г. Материалы ( Конспекты лекций по информатике ) . (1-е изд.). Спрингер. ISBN 3-540-43829-7 .
- Л. ДеМиллер, Анна и Реттиг, Джеймс (2000). Лингвистика: Путеводитель по справочной литературе (2-е изд.). Библиотеки без ограничений. ISBN 1-56308-619-0 .
- Ламбертс, Коэн и Голдстоун, Роб (2004). Справочник по познанию . Сейдж Публикации Лтд. ISBN 0-7619-7277-3 .
Внешние ссылки
[ редактировать ]
- Компьютерочитаемый фонетический алфавит SAMPA
- Фонематическая запись английского языка в SAMPA
- SAMPA для шотландцев. Архивировано 11 августа 2003 г. в Wayback Machine.
- Конвертер из (немецкого) письменного текста в SAMPA и IPA (Ajax-приложение)
- Конвертер IPA-SAMPA и диаграмма IPA-SAMPA