Символическое языковое представление
Эта статья нуждается в дополнительных цитатах для проверки . ( апрель 2024 г. ) |
Символическое лингвистическое представление — это представление высказывания , которое использует символы для представления лингвистической информации о высказывании, такой как информация о фонетике , фонологии , морфологии , синтаксисе или семантике . Символические лингвистические представления отличаются от несимволических представлений, таких как записи, поскольку они используют символы для представления лингвистической информации, а не измерений.
Символические представления широко используются в лингвистике. В синтаксических представлениях символы атомарных категорий часто относятся к синтаксической категории лексического элемента . Примеры включают лексические категории , такие как вспомогательные глаголы ( INFL ), [1] фразовые категории , такие как относительные предложения ( SRel ), и пустые категории, такие как WH-следы ( t WH ). Патент США 10133724. В некоторых формализмах, таких как Лексическая Функциональная Грамматика , эти символы могут относиться как к грамматическим функциям, так и к значениям грамматических категорий . В лингвистике пустые категории обозначаются ∅ .
Символические представления также появляются в фонетической транскрипции , описаниях фонологических процессов, хореях , фонемах , морфофонемах , естественных классах , семантических особенностях, таких как одушевленность и структурах квалиа теории генеративного лексикона . [2]
При обработке естественного языка лингвистические представления, такие как синтаксические представления, уже давно используются для улучшения результатов систем поиска информации, таких как поисковые системы и системы машинного перевода. [3] В последнее время при синтаксическом анализе нейронного округа на основе промежутков лексические элементы начинаются как токены словесных фрагментов или BPE тиктокены , а затем преобразуются в несколько других представлений: векторы слов (кодировщик слов), терминальные узлы (промежуточные векторы, столбы забора), нетерминальные узлы (промежуточный классификатор). ), дерево разбора ( нейронный CKY ). Предполагается, что отображение терминалов в нетерминалы позволяет узнать, какие конструкции разрешены языком. [4]
Символические лингвистические представления часто используются в компьютерной лингвистике . [ нужна ссылка ]
Другие представления в лингвистике, которые не являются символами или измерениями, включают правила и рейтинги .
Примечания
[ редактировать ]Внешние ссылки
[ редактировать ]Ссылки
[ редактировать ]- Селлс, Питер (1985). Лекции по современным синтаксическим теориям: введение в теорию правительственного связывания, грамматику обобщенной фразовой структуры и грамматику лексических функций . ЦСЛИ.
- Пустейовский, Джеймс (1995). Генеративный лексикон . МТИ Пресс. ISBN 9780262661409.
- Ватанабэ и др. (2000). Улучшение обработки естественного языка с помощью лингвистических аннотаций документов . В материалах семинара COLING-2000 по семантической аннотации и интеллектуальному контенту, страницы 20–27, Университетский центр, Люксембург. Международный комитет по компьютерной лингвистике.
- Юрафский, Дэниел; Мартин, Джеймс Х. (2024). Речь и языковая обработка. Проект от 3 февраля 2024 г.
- https://web.stanford.edu/~jurafsky/slp3/17.pdf#section.17.7
патент США 10133724 , Шон Л. Бетард; Эдвард Г. Кац и Кристофер Фиппс, «Синтаксическая классификация предложений естественного языка по отношению к целевому элементу», опубликовано 20 ноября 2018 г., передано International Business Machines Corp.