Грамматика структуры фраз, управляемых головой
Грамматика структуры фраз, управляемая головой ( HPSG ), представляет собой высоко лексикализованную грамматику, основанную на ограничениях. [1] [2] разработан Карлом Поллардом и Иваном Сагом . [3] [4] Это тип грамматики фразовой структуры , в отличие от грамматики зависимостей , и она является непосредственным преемником обобщенной грамматики фразовой структуры . HPSG опирается на другие области, такие как информатика ( теория типов данных и представление знаний ), и использует де Соссюра понятие знака Фердинанда . Он использует единый формализм и организован по модульному принципу, что делает его привлекательным для обработки естественного языка .
HPSG включает в себя принципы, грамматические правила и словарные статьи, которые обычно не считаются принадлежащими грамматике. В основе формализма лежит лексикализм. Это означает, что словарь — это больше, чем просто список статей; он сам по себе богато структурирован. Отдельные записи отмечены типами. Типы образуют иерархию. Ранние версии грамматики были очень лексикализированы с небольшим количеством грамматических правил (схем). Более поздние исследования имели тенденцию добавлять больше и более сложные правила, становясь больше похожими на строительную грамматику . [5]
Основной тип, с которым работает HPSG, — это знак. Слова и фразы — это два разных подтипа знака. Слово имеет два признака: [ФОН] (звук, фонетическая форма) и [СИНСЕМА] ( синтаксическая и семантическая информация), оба из которых разделены на подпризнаки. Знаки и правила формализованы как типизированные структуры признаков .
Пример грамматики [ править ]
HPSG генерирует строки путем объединения знаков, которые определяются их расположением в иерархии типов и внутренней структурой признаков, представленной матрицами значений атрибутов (AVM). [4] [6] В качестве значений функции принимают типы или списки типов, а эти значения, в свою очередь, могут иметь собственную структуру функций. Грамматические правила в значительной степени выражаются через ограничения, налагаемые знаками друг на друга. Структура признаков знака описывает его фонологические, синтаксические и семантические свойства. В общепринятых обозначениях AVM записываются с указанием функций в верхнем регистре и типов в нижнем регистре, выделенных курсивом. Пронумерованные индексы в AVM представляют собой значения, идентичные токенам.
В упрощенном AVM для слова (в данном случае глагола, а не существительного, как в «приятных прогулках на выходных») «прогулки» ниже, категориальная информация глагола (CAT) разделена на описывающие его характеристики (HEAD) и особенности, описывающие его аргументы (ВАЛЕНТНОСТЬ).

«Прогулки» — знак типового слова типа с головой глагола . Как непереходный глагол, «гуляет» не имеет дополнения, но требует подлежащего, которое является существительным в третьем лице единственного числа. Семантическое значение подлежащего (СОДЕРЖАНИЕ) совпадает с единственным аргументом глагола (человек, идущий). Следующий AVM для «она» представляет собой знак со значением SYNSEM, который может удовлетворить этим требованиям.

Признаки типа фразы объединяются с одним или несколькими дочерними и распространяют информацию вверх. Следующий AVM кодирует правило немедленного доминирования для head-subj-phrase , для которого требуется два дочерних элемента: главный дочерний элемент (глагол) и неглавный дочерний элемент, который удовлетворяет ограничениям SUBJ глагола.

Конечным результатом является знак с заголовком глагола, пустыми признаками подкатегоризации и фонологическим значением, которое упорядочивает двух дочерних элементов.
Хотя фактическая грамматика HPSG полностью состоит из структур признаков, лингвисты часто используют деревья для представления объединения знаков там, где эквивалентный AVM был бы громоздким.

Реализации [ править ]
Были написаны различные анализаторы, основанные на формализме HPSG, и в настоящее время исследуются возможности их оптимизации. Пример системы анализа немецких предложений предоставлен Свободным университетом Берлина . [7] Кроме того, CoreGram [8] Проект группы грамматики Свободного университета Берлина предоставляет грамматики с открытым исходным кодом, которые были реализованы в системе TRALE. В настоящее время существуют грамматики немецкого языка . [9] датский , [10] Мандаринский китайский , [11] Мальтийский , [12] и персидский [13] которые имеют общее ядро и являются общедоступными.
Большие грамматики HPSG различных языков разрабатываются в рамках инициативы Deep Linguistic Processing with HPSG Initiative ( DELPH-IN ). [14] Широкие грамматики английского языка, [15] Немецкий, [16] и японский [17] доступны по лицензии с открытым исходным кодом. Эти грамматики можно использовать с различными совместимыми парсерами HPSG с открытым исходным кодом: LKB , PET, [18] Туз, [19] и согласен . [20] Все они создают семантические представления в формате «Минимальной рекурсивной семантики», MRS. [21] Декларативная природа формализма HPSG означает, что эти вычислительные грамматики обычно можно использовать как для анализа , так и для генерации (создания поверхностных строк из семантических входных данных). Банки деревьев, также распространяемые DELPH-IN , используются для разработки и тестирования грамматик, а также для обучения моделей ранжирования для принятия решений о правдоподобных интерпретациях при синтаксическом анализе (или реализациях при генерации).
Enju — это свободно доступный вероятностный парсер HPSG с широким охватом для английского языка, разработанный лабораторией Tsujii при Токийском университете в Японии . [22]
См. также [ править ]
- Лексико-функциональная грамматика
- Семантика минимальной рекурсии
- Реляционная грамматика
- Семантика ситуации
- Синтаксис
- Трансформационная грамматика
- Тип Описание Язык
Ссылки [ править ]
- ^ «ГПСГ» .
- ^ Мюллер С., Абей А., Борсли Р.Д., Кениг Дж.П. (2021). Мюллер С., Абей А., Борсли Р.Д., Кениг Дж.П. (ред.). Грамматика структуры фраз, управляемых головой: Справочник (pdf) . Берлин: Language Science Press. дои : 10.5281/zenodo.5543318 . ISBN 978-3-96110-255-6 .
- ^ Поллард, Карл и Иван А. Саг. 1987. Информационный синтаксис и семантика. Том 1. Основы. Конспект лекций CLSI 13.
- ^ Jump up to: Перейти обратно: а б Поллард, Карл; Иван Александрович Саг. (1994). Грамматика структуры фраз, управляемых головой . Чикаго: Издательство Чикагского университета.
- ^ Саг, Иван А. 1997. Английские конструкции относительных предложений. [ мертвая ссылка ] . Журнал лингвистики. 33.2: 431-484
- ^ Саг, Иван А.; Томас Васов; и Эмили Бендер. (2003). Синтаксическая теория: формальное введение . 2-е изд. Чикаго: Издательство Чикагского университета.
- ^ Вавилонская система: HPSG Interactive
- ^ Проект CoreGram
- ^ В граммах
- ^ ДанГрам
- ^ Китайский
- ^ Мальтийский
- ^ Персидский
- ^ DELPH-IN: Глубокая обработка с открытым исходным кодом
- ^ Грамматика и лексика английского языка
- ^ Бертольд Крисманн
- ^ JacyTop - Глубокая лингвистическая обработка с помощью HPSG (DELPH-IN)
- ^ Анализатор ПЭТ DELPH-IN
- ^ Ace: механизм ограничения ответов
- ^ согласен с разработкой грамматики
- ^ Копестейк А., Фликинджер Д., Поллард К. и Саг ИА (2005). Семантика минимальной рекурсии: Введение . Исследования языка и вычислений, 3(2-3), 281-332.
- ↑ Tsuji Lab: домашняя страница парсера Enju. Архивировано 7 марта 2010 г. в Wayback Machine (получено 24 ноября 2009 г.).
Дальнейшее чтение [ править ]
- Карл Поллард , Иван А. Саг (1987): Информационный синтаксис и семантика. Том 1: Основы . Стэнфорд: Публикации CSLI.
- Карл Поллард , Иван А. Саг (1994): Грамматика структуры фраз, управляемых головой . Чикаго: Издательство Чикагского университета. ( [1] )
- Иван А. Саг , Томас Васов , Эмили М. Бендер (2003): Синтаксическая теория: формальное введение, второе издание . Чикаго: Издательство Чикагского университета. ( [2] )
- Левин, Роберт Д .; В. Детмар Мёрерс (2006). «Грамматика фразовой структуры, управляемой головой: лингвистический подход, формальные основы и вычислительная реализация» (PDF) . В Кейт Браун (ред.). Энциклопедия языка и лингвистики (второе изд.). Оксфорд: Эльзевир. Архивировано из оригинала (PDF) 5 сентября 2008 г. Проверено 7 марта 2008 г.
- Мюллер, Стефан (2013). «Объединение всего: некоторые замечания о более простом синтаксисе, строительной грамматике, минимализме и HPSG» . Язык . 89 (4): 920–950. дои : 10.1353/lan.2013.0061 . S2CID 55298660 .
Внешние ссылки [ править ]
- Онлайн-материалы ежегодной конференции HPSG https://processes.hpsg.xyz/issue/archive
- Домашняя страница HPSG штата Огайо
- Международная конференция по грамматике фразовой структуры, управляемой головой
- Сеть DELPH-IN для разработки грамматики HPSG
- Базовый обзор HPSG
- Сравнение HPSG с альтернативами и историческая перспектива
- Библиография публикаций HPSG
- Пакет LaTeX для рисования AVM - включает документацию.