Обобщенная контекстно-свободная грамматика
Обобщенная контекстно-свободная грамматика (GCFG) — это грамматический формализм, который расширяет контекстно-свободные грамматики путем добавления потенциально неконтекстно-свободных функций композиции для перезаписи правил. [1] Головная грамматика (и ее слабые эквиваленты) является примером такой GCFG, которая, как известно, особенно хорошо справляется с широким спектром свойств естественного языка, не относящихся к CF.
Описание [ править ]
GCFG состоит из двух компонентов: набора функций композиции, объединяющих строковые кортежи, и набора правил перезаписи. Все функции композиции имеют вид , где представляет собой либо один строковый кортеж, либо использование (потенциально другой) функции композиции, которая сводится к строковому кортежу. Правила перезаписи выглядят так , где , , ... являются строковыми кортежами или нетерминальными символами.
Семантика перезаписи GCFG довольно проста. Появление нетерминального символа перезаписывается с использованием правил перезаписи, как в контекстно-свободной грамматике, что в конечном итоге дает только композиции (функции композиции, применяемые к строковым кортежам или другим композициям). Затем применяются функции композиции, последовательно сводящие кортежи к одному кортежу.
Пример [ править ]
Простой перевод контекстно-свободной грамматики в GCFG можно выполнить следующим образом. Учитывая грамматику в ( 1 ), которая генерирует язык палиндромов , где это строка, обратная , мы можем определить функцию композиции conc, как в ( 2a ), и правила перезаписи, как в ( 2b ).
( 1 ) |
( 2а ) |
( 2б ) |
Производство Abbba в CF
- С
- аса
- АбСба
- аббСбба
- аббба
и соответствующее производство GCFG равно
Линейные бесконтекстные системы переписывания LCFRS ( )
Вейр (1988) [1] описывает два свойства композиционных функций: линейность и регулярность. Функция, определенная как является линейным тогда и только тогда, когда каждая переменная появляется не более одного раза по обе стороны от = , что делает линейный, но не . Функция, определенная как является регулярным, если левая и правая части имеют одни и те же переменные, что делает обычный, но нет или .
Грамматика, в которой все функции композиции одновременно линейны и регулярны, называется линейной системой контекстно-свободной переписывания (LCFRS). LCFRS является подклассом GCFG, т. е. имеет строго меньшую вычислительную мощность, чем GCFG в целом.
С другой стороны, LCFRS строго более выразительны, чем грамматики с линейным индексом и их слабо эквивалентные вариантов грамматики, примыкающие к дереву (TAG). [2] Головная грамматика — еще один пример LCFRS, который строго менее мощный, чем класс LCFRS в целом.
LCFRS слабо эквивалентны (локальным по множеству) многокомпонентным TAG ( MCTAG ), а также с множественной контекстно-свободной грамматикой (MCFG [1] ). [3] и минималистские грамматики (MG). Языки, созданные LCFRS (и их слабые эквиваленты), можно анализировать за полиномиальное время . [4]
См. также [ править ]
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б Вейр, Дэвид Джереми (сентябрь 1988 г.). Характеристика слегка контекстно-зависимых грамматических формализмов (PDF) (доктор философии). Бумага. Том. ААИ8908403. Пенсильванский университет в Анн-Арборе.
- ^ Лаура Каллмейер (2010). Синтаксический анализ за пределами контекстно-свободных грамматик . Springer Science & Business Media. п. 33. ISBN 978-3-642-14846-0 .
- ^ Лаура Каллмейер (2010). Синтаксический анализ за пределами контекстно-свободных грамматик . Springer Science & Business Media. п. 35-36. ISBN 978-3-642-14846-0 .
- ^ Йохан ФАК ван Бентем; Алиса тер Меулен (2010). Справочник по логике и языку (2-е изд.). Эльзевир. п. 404. ИСБН 978-0-444-53727-0 .