Встроенный автомат с выдвижным механизмом
Встроенный автомат с выталкиванием вниз или EPDA — это вычислительная модель для синтаксического анализа языков, созданных с помощью древовидных грамматик (TAG). Он похож на -свободной грамматики контекстно автомат с выталкивающим анализом , но вместо использования простого стека для хранения символов он имеет стек итерированных стеков, в которых хранятся символы, что дает TAG генеративную способность между контекстно-свободными и контекстно-зависимыми грамматиками. или подмножество слегка контекстно-зависимых грамматик .Встроенные автоматы с выталкиванием вниз не следует путать с автоматами со вложенным стеком, которые обладают большей вычислительной мощностью. [ нужна ссылка ]
История и приложения
[ редактировать ]EPDA были впервые описаны К. Виджаем-Шанкером в его докторской диссертации 1988 года. [1] С тех пор они были применены для более полных описаний классов умеренно контекстно-зависимых грамматик и сыграли важную роль в уточнении иерархии Хомского . Таким образом, могут быть определены различные подграмматики, такие как линейно-индексированная грамматика . [2]
Хотя естественные языки традиционно анализировались с использованием контекстно-свободных грамматик (см. Трансформационно-генеративная грамматика и компьютерная лингвистика ), эта модель не очень хорошо работает для языков со перекрестными зависимостями, таких как нидерландский, ситуаций, для которых EPDA хорошо подходит. Подробный лингвистический анализ доступен у Джоши, Шабеса (1997). [3]
Теория
[ редактировать ]EPDA — это конечный автомат с набором стеков, доступ к которым можно получить через встроенный стек . Каждый стек содержит элементы алфавита стека. , и поэтому мы определяем элемент стека как , где звездочка — Клини замыкание алфавита .
Затем каждый стек можно определить через его элементы, поэтому мы обозначаем стек в автомате с помощью символа двойного кинжала: , [ нужны разъяснения ] где будет следующим доступным символом в стеке. Встроенный стек Таким образом, стеки можно обозначить через . [ нужны разъяснения ]
Мы определяем EPDA семеркой (7-кортеж)
- где
- — конечное множество состояний ;
- – конечное множество входного алфавита ;
- — конечный стековый алфавит ;
- это начальное состояние ;
- – множество конечных состояний ;
- это начальный символ стека
- – функция перехода , где являются конечными подмножествами .
Таким образом, функция перехода принимает состояние, следующий символ входной строки и верхний символ текущего стека и генерирует следующее состояние, стеки, которые должны быть помещены и извлечены во встроенный стек , нажатие и извлечение текущего стека. и стеки, которые будут считаться текущими стеками при следующем переходе. Более концептуально, встроенный стек помещается и извлекается, текущий стек при необходимости помещается обратно во встроенный стек , а любые другие стеки, которые вы хотите, помещаются поверх него, при этом последний стек является тем, из которого считывается в следующей итерации. . Таким образом, стеки можно помещать как выше, так и ниже текущего стека.
Данная конфигурация определяется
где это текущее состояние, s — это стеки во встроенном стеке , причем текущий стек и для входной строки , — это часть строки, уже обработанная машиной, и — это часть, подлежащая обработке, причем ее заголовок является текущим считанным символом. Обратите внимание, что пустая строка неявно определяется как завершающий символ, где, если машина находится в конечном состоянии, когда считывается пустая строка, вся входная строка принимается , а если нет, то она отклоняется . Такие принятые строки являются элементами языка.
где и определяет функцию перехода, применяемую столько раз, сколько необходимо для анализа строки.
Неофициальное описание EPDA можно также найти у Джоши, Шабеса (1997), [3] Раздел 7, с. 23-25.
EPDA k -порядка и иерархия Вейра
[ редактировать ]![]() | Этот раздел может потребовать очистки Википедии , чтобы соответствовать стандартам качества . Конкретная проблема заключается в следующем: необходимо переписать на основе Каллмейера, стр. 199. ( Август 2014 г. ) |
Более точно определенная иерархия языков, соответствующих слабо контекстно-зависимому классу, была определена Дэвидом Дж. Вейром. [4] На основе работы Набиля А. Хаббаза: [5] [6] Иерархия языка управления Вейра представляет собой иерархию, состоящую из счетного набора языковых классов. [ объяснить ] где Уровень-1 определен как контекстно-свободный, а Уровень-2 — это класс присоединения дерева и трех других грамматик.
Ниже приведены некоторые свойства языков уровня k в иерархии:
- Языки уровня k правильно содержатся в языковом классе уровня ( k + 1).
- Языки уровня k можно анализировать в время
- Уровень- k содержит язык , но не
- Уровень- k содержит язык , но не
Эти свойства хорошо соответствуют (по крайней мере, для малых k > 1) условиям умеренно контекстно-зависимых языков, установленным Джоши, и по мере того, как k увеличивается, языковой класс в некотором смысле становится менее контекстно-зависимым.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Виджай-Шанкер, К. (январь 1988 г.). «Исследование древовидных грамматик» . доктор философии Диссертация . Пенсильванский университет .
- ^ Вейр, Дэвид Дж. (1994). «Линейные итерированные отжимания» (PDF) . Вычислительный интеллект . 10 (4): 431–439. дои : 10.1111/j.1467-8640.1994.tb00007.x . S2CID 205570628 . Проверено 20 октября 2012 г.
- ^ Jump up to: а б Джоши, Аравинд К.; Ив Шабес (1997). «Грамматики, прилегающие к дереву» (PDF) . Справочник формальных языков . Том. 3. Спрингер. стр. 69–124. дои : 10.1007/978-3-642-59126-6_2 . ISBN 978-3-642-63859-6 . Проверено 7 февраля 2014 г.
- ^ Вейр, DJ (1992), «Геометрическая иерархия за пределами контекстно-свободных языков», Theoretical Computer Science , 104 (2): 235–261, doi : 10.1016/0304-3975(92)90124-X .
- ^ Набиль Антон Хаббаз (1972). Обобщенные контекстно-свободные языки (доктор философии). Университет Айовы.
- ^ Набиль Антон Хаббаз (1974). «Геометрическая иерархия языков». Дж. Компьютер. Сист. Наука . 8 (2): 142–157. дои : 10.1016/s0022-0000(74)80052-8 .
Дальнейшее чтение
[ редактировать ]- Лаура Каллмейер (2010). Синтаксический анализ за пределами контекстно-свободных грамматик . Springer Science & Business Media. ISBN 978-3-642-14846-0 .