Комбинаторная категориальная грамматика
![]() | Эта статья может быть слишком технической для понимания большинства читателей . ( Ноябрь 2018 г. ) |
Комбинаторная категориальная грамматика ( CCG ) — это эффективно анализируемый , но лингвистически выразительный грамматический формализм. Он имеет прозрачный интерфейс между поверхностным синтаксисом и базовым семантическим представлением, включая структуру предикатов-аргументов, количественную оценку и информационную структуру. Этот формализм генерирует структуры, основанные на округах (в отличие от структур, основанных на зависимостях) и, следовательно, является типом грамматики фразовой структуры (в отличие от грамматики зависимостей ).
CCG опирается на комбинаторную логику , которая обладает той же выразительной силой, что и лямбда-исчисление , но строит свои выражения по-другому. Первые лингвистические и психолингвистические аргументы в пользу базирования грамматики на комбинаторах были выдвинуты Стидманом и Сабольчи .
Более поздними видными сторонниками этого подхода являются Полин Джейкобсон и Джейсон Болдридж . В этих новых подходах комбинатор B (композитор) полезен для создания зависимостей на больших расстояниях, например: «Как вы думаете, о ком говорит Мэри?» а комбинатор W (дупликатор) полезен в качестве лексической интерпретации возвратных местоимений, как в «Мэри говорит о себе». Вместе с I (тождественным отображением) и C (перестановщиком) они образуют набор примитивных непереопределяемых комбинаторов. Джейкобсон интерпретирует личные местоимения как комбинатор I, а их связыванию способствует сложный комбинатор Z, как в «Мэри заблудилась». Z можно определить с помощью W и B.
формализма Части
Формализм CCG определяет ряд комбинаторов (наиболее распространенными являются применение, композиция и повышение типов). Они работают с синтаксически типизированными лексическими единицами посредством доказательств в стиле естественной дедукции . Цель доказательства — найти способ применения комбинаторов к последовательности лексических единиц до тех пор, пока ни одна лексическая единица не останется неиспользованной в доказательстве. Результирующий тип после завершения доказательства является типом всего выражения. Таким образом, доказательство того, что некоторая последовательность слов является предложением некоторого языка, равносильно доказательству того, что слова сводятся к S. типу
Синтаксические типы [ править ]
Синтаксический тип лексического элемента может быть либо примитивным, например S , N или NP , либо сложным, например S\NP или NP/N .
Комплексные типы, схематизированные как X/Y и X\Y которые принимают аргумент типа Y и возвращают объект типа X. , обозначают типы функторов , Косая черта означает, что аргумент должен отображаться справа, а обратная косая черта означает, что аргумент должен отображаться слева. Здесь любой тип может заменять X и Y , что делает синтаксические типы в CCG рекурсивной системой типов.
Комбинаторы приложений [ править ]
Комбинаторы приложений, часто обозначаемые > для прямого применения и < для обратного применения, применяют лексический элемент с типом функтора к аргументу соответствующего типа. Определение применения дается как:
Комбинаторы композиции [ править ]
Комбинаторы композиции, часто обозначаемые для передового состава и для обратной композиции аналогичны композиции функций из математики и могут быть определены следующим образом:
Комбинаторы повышения типов [ править ]
Комбинаторы повышения типов, часто обозначаемые как для передового набора текста и для обратного повышения типа преобразуйте типы аргументов (обычно примитивные типы) в типы функторов, которые принимают в качестве аргумента функторы, которые до повышения типа принимали бы их в качестве аргументов.
Пример [ править ]
Предложение «собака укусила Джона» имеет множество возможных доказательств. Ниже приведены некоторые из них. Разнообразие доказательств демонстрирует тот факт, что в CCG предложения не имеют единой структуры, как в других моделях грамматики.
Пусть типы этих лексических единиц будут
Мы можем провести простейшее доказательство (слегка изменив обозначения для краткости):
Решив набрать и составить некоторые из них, мы могли бы получить полностью инкрементальное доказательство слева направо. Возможность построить такое доказательство является аргументом в пользу психолингвистической правдоподобности CCG, поскольку слушатели фактически конструируют частичные интерпретации (синтаксические и семантические) высказываний до того, как они будут завершены.
Формальные свойства [ править ]
![]() | Этот раздел нуждается в расширении . Вы можете помочь, добавив к нему . ( июнь 2008 г. ) |
Известно, что CCG способны генерировать язык (это неконтекстно-свободный индексированный язык ). Грамматику этого языка можно найти у Виджая-Шанкера и Вейра (1994). [1]
Виджай-Шанкер и Вейр (1994) [1] демонстрирует, что линейные индексированные грамматики , комбинаторные категориальные грамматики, древовидные грамматики и головные грамматики являются слабо эквивалентными формализмами, поскольку все они определяют одни и те же строковые языки. Кульманн и др. (2015) [2] показать, что эта эквивалентность и способность CCG описывать , в решающей степени полагаются на возможность ограничить использование комбинационных правил определенными категориями способами, не объясненными выше.
См. также [ править ]
- Категориальная грамматика
- Комбинаторная логика
- Встроенный автомат с выдвижным механизмом
- Грамматика ссылок
- Тип переключатель
Ссылки [ править ]
- ^ Jump up to: а б Виджей-Шанкер, К. и Вейр, Дэвид Дж. 1994. Эквивалентность четырех расширений контекстно-свободных грамматик. Архивировано 17 декабря 2018 г. в Wayback Machine . Теория математических систем 27 (6): 511–546.
- ^ Кульманн М., Коллер А. и Сатта Г. 2015. Лексикализация и генеративная сила в CCG. Архивировано 20 декабря 2019 г. в Wayback Machine . Компьютерная лингвистика 41 (2): 215–247.
- Болдридж, Джейсон (2002), « Лексически определенный деривационный контроль в комбинаторной категориальной грамматике ». Кандидатская диссертация. унив. Эдинбурга.
- Карри, Хаскелл Б. и Ричард Фейс (1958), Комбинаторная логика, Vol. 1. Северная Голландия.
- Джейкобсон, Полина (1999), « На пути к семантике без переменных ». Лингвистика и философия 22, 1999. 117–184.
- Стидман, Марк (1987), « Комбинаторные грамматики и паразитические пробелы ». Естественный язык и лингвистическая теория 5, 403–439.
- Стидман, Марк (1996), Структура поверхности и интерпретация. Массачусетский технологический институт Пресс.
- Стидман, Марк (2000), Синтаксический процесс. Массачусетский технологический институт Пресс.
- Сабольчи, Анна (1989), « Связанные переменные в синтаксисе (есть ли они?) ». Семантика и контекстное выражение, под ред. Барч, ван Бентем и ван Эмде Боас. Форис, 294–318.
- Сабольчи, Анна (1992), « Комбинаторная грамматика и проекция из лексикона ». Лексические вопросы. Конспекты лекций CSLI 24, изд. Саг и Сабольчи. Стэнфорд, Публикации CSLI. 241–269.
- Сабольчи, Анна (2003), « Связывание на лету: перекрестная анафора в семантике без переменных ». Чувствительность ресурсов в привязке и анафоре, под ред. Круйфф и Эрле. Клювер, 215–229.
Дальнейшее чтение [ править ]
- Майкл Моортгат, Логика категориального типа , Глава вторая в книге Дж. ван Бентема и А. тер Мейлена (ред.) Справочник по логике и языку . Эльзевир, 1997, ISBN 0-262-22053-9
- homepages.inf.ed.ac.uk
Внешние ссылки [ править ]
- Сайт комбинаторной категориальной грамматики
- Вики-страница ACL CCG (вероятно, более актуальная, чем эта)
- Семантический анализ с использованием комбинаторных категориальных грамматик - Учебное пособие, описывающее общие принципы построения семантических анализаторов