Рекурсивная переходная сеть с фильтрацией
Рекурсивная переходная сеть с фильтрацией и извлечением ( FPRTN ), [1] или просто сеть с фильтрацией ( FPN ), представляет собой рекурсивную переходную сеть ( RTN ) [2] расширен за счет сопоставления состояний с ключами, где для возврата из перехода к подпрограмме требуется, чтобы состояния приемника и возврата были сопоставлены с одним и тем же ключом. RTN — это конечные автоматы , которые можно рассматривать как автоматы с конечным числом состояний, расширенные стеком возвращаемых состояний; а также потреблять переходы и -переходы, RTN могут определять переходы вызовов. Эти переходы выполняют переход подпрограммы , помещая целевое состояние перехода в стек и переводя машину в вызываемое состояние. Каждый раз, когда достигается состояние акцептора, состояние возврата наверху стека выскакивает, при условии, что стек не пуст, и машина переводится в это состояние.
В этой статье мы называем рекурсивные переходные сети с фильтрацией и извлечением FPN , хотя эта аббревиатура неоднозначна (например: нечеткие сети Петри ). Сети с фильтрацией и FPRTN являются однозначной альтернативой.
Формальное определение
[ редактировать ]ФПН — это структура где
- представляет собой конечное множество состояний,
- представляет собой конечный набор ключей,
- — конечный входной алфавит,
- — частичная функция перехода, будучи пустым символом,
- это карта состояний с ключами,
- – набор начальных состояний, а
- — это набор состояний принятия.
Переходы
[ редактировать ]Переходы представляют собой возможность вывода ФПН из исходного состояния. в целевое состояние возможно, выполнив дополнительное действие. В зависимости от этого действия различают следующие типы явно -определенных переходов:
- -переходы – это переходы вида и не выполнять никаких дополнительных действий,
- потребляющие переходы - это переходы вида и использовать входной символ , и
- переходы вызовов — это переходы вида и выполнить переход подпрограммы в вызываемое состояние прежде чем достичь .
Поведение переходов вызовов определяется двумя видами неявно определенных переходов:
- за каждый переход вызова FPN неявно определяет переход , который выводит машину из к толкая в стек и
- для каждой пары состояний FPN неявно определяет всплывающий переход , который выводит машину из к выскакивая из стека, если только это состояние на вершине стека и .
Push-переходы инициализируют переходы подпрограммы , а pop-переходы эквивалентны операторам возврата .
Цель
[ редактировать ]Текст ( естественный язык ) может быть обогащен метаинформацией путем применения RTN с выводом ; например, RTN, вставляющая теги XML , может использоваться для преобразования обычного текста в структурированный документ XML. RTN с выходными данными, представляющими естественного языка, грамматику будет разграничивать и добавлять синтаксическую структуру каждого текстового предложения (см. синтаксический анализ ). Другие RTN с выводом могут просто отмечать текстовые сегменты, содержащие соответствующую информацию (см. Извлечение информации ). Применение RTN с выходными данными, представляющими неоднозначную грамматику, приводит к набору возможных переводов или интерпретаций входных данных. Вычисление этого набора имеет экспоненциальную стоимость в худшем случае , даже для анализатора Эрли для RTN с выходом, [3] из-за случаев, когда количество переводов увеличивается экспоненциально по отношению к длине ввода; например, количество интерпретаций предложения естественного языка увеличивается экспоненциально по отношению к количеству неразрешенных вложений предложных фраз : [4] [5]
- в предложении девочка видела обезьяну в подзорную трубу , неизвестно, пользовалась ли девочка телескопом или обезьяна держала его (2 1 интерпретации),
- в предложении девочка увидела обезьяну в подзорную трубу в саду , также неизвестно, была ли обезьяна в саду или действие происходило в саду (2 2 интерпретации),
- в предложении девочка увидела обезьяну в подзорную трубу в саду под деревом , также неизвестно, была ли обезьяна под деревом или действие происходило под деревом (2 3 интерпретации),
- и т. д.
FPN служат компактным представлением этого набора переводов, позволяя вычислять его в кубическом времени с помощью парсера, подобного Эрли. [1] Состояния FPN соответствуют состояниям выполнения (см. шаги инструкции ) анализатора Эрли для RTN без вывода, а переходы FPN соответствуют возможным переводам входных символов. карта результирующего FPN дает соответствие между представленными выходными сегментами и распознанными входными сегментами: с учетом распознанной входной последовательности и путь FPN начиная с состояния и заканчивая состоянием , представляет возможный перевод входного сегмента . Функция фильтрованного извлечения необходима для того, чтобы пути FPN не представляли трансляции разъединенных или перекрывающихся входных сегментов: вызов FPN может содержать несколько путей трансляции из вызываемого состояния в состояние принимающего, где соответствующие им входные сегменты имеют одинаковые начальную точку, но не обязательно имеют одинаковую длину. состояниями возврата являются только состояния возврата, соответствующие той же точке ввода, что и состояние получателя, завершающее вызов Действительными .
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Хавьер М. Састре, «Эффективный синтаксический анализ с использованием рекурсивных переходных сетей с фильтрацией» , Конспект лекций по искусственному интеллекту , 5642 : 241-244, 2009 г.
- ^ Уильям А. Вудс, «Грамматики сети переходов для анализа естественного языка» , Communications of the ACM , ACM Press , 13 :10:591-606, 1970
- ^ Хавьер М. Састре и Микель Л. Форкада, «Эффективный синтаксический анализ с использованием рекурсивных переходных сетей с выводом» , Конспект лекций по информатике , 5603 : 192-204, 2009 г.
- ^ Адвайт Ратнапархи, « Статистические модели для неконтролируемого прикрепления предложных фраз » , ACL-36: Материалы 36-го ежегодного собрания Ассоциации компьютерной лингвистики и 17-й Международной конференции по компьютерной лингвистике, стр. 1079-1085, 1998.
- ^ Мириам Батт, « Чанк/мелкий анализ » , конспекты лекций, 2002 г.