~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ C87501795CB89E104D61ADDE84A2A192__1706208900 ✰
Заголовок документа оригинал.:
✰ Range concatenation grammar - Wikipedia ✰
Заголовок документа перевод.:
✰ Грамматика конкатенации диапазонов — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Range_concatenation_grammars ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/c8/92/c87501795cb89e104d61adde84a2a192.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/c8/92/c87501795cb89e104d61adde84a2a192__translat.html ✰
Дата и время сохранения документа:
✰ 15.06.2024 02:46:28 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 25 January 2024, at 21:55 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Грамматика конкатенации диапазонов — Википедия Jump to content

Грамматика конкатенации диапазонов

Из Википедии, бесплатной энциклопедии

Грамматика конкатенации диапазонов (RCG) - это грамматический формализм, разработанный Пьером Булье. [1] в 1998 году как попытка охарактеризовать ряд явлений естественного языка, таких как китайские числа и скремблирование немецкого порядка слов , которые находятся за пределами умеренно контекстно-зависимых языков . [2]

С теоретической точки зрения, любой язык, который можно анализировать за полиномиальное время, принадлежит к подмножеству RCG, называемому грамматиками конкатенации положительного диапазона, и наоборот. [4]

Гренинка Хотя RCG задуманы как вариант грамматик буквального движения (LMG), они рассматривают грамматический процесс скорее как доказательство, чем как произведение. В то время как LMG создают терминальную строку из начального предиката, RCG стремятся свести начальный предикат (который предикаты терминальной строки) к пустой строке, которая представляет собой доказательство принадлежности терминальных строк языку.

Описание [ править ]

Формальное определение [ править ]

Грамматика конкатенации положительного диапазона (PRCG) представляет собой кортеж. , где:

  • , и являются непересекающимися конечными множествами (соответственно) имен предикатов , терминальных символов и имен переменных . Каждое имя предиката имеет связанную с ним арность, задаваемую функцией .
  • — имя начального предиката и проверьте .
  • представляет собой конечное множество предложений вида , где являются предикатами вида с и .

Грамматика конкатенации отрицательного диапазона (NRCG) определяется как PRCG, но с тем дополнением, что некоторые предикаты, встречающиеся в правой части предложения, могут иметь форму . Такие предикаты называются отрицательными предикатами .

Грамматика конкатенации диапазонов может быть положительной или отрицательной. Хотя PRCG технически являются NRCG, ​​эти термины используются для обозначения отсутствия (PRCG) или присутствия (NRCG) отрицательных предикатов.

Диапазон одним словом это пара , с , где длина . Переменные привязываются к диапазонам, а не к произвольным строкам нетерминалов. Два диапазона и можно объединить , если и только если , и тогда мы имеем: . При создании экземпляра предложения, где аргумент состоит из нескольких элементов из , их диапазоны должны объединиться.

На слово , с , пунктирное обозначение диапазонов: .

Распознавание строк [ править ]

Перезаписываемые строки предикатов представляют ограничения, которым проверяемая строка должна удовлетворять (если она положительна), а в случае отрицательных предикатов – не удовлетворять. Порядок предикатов не имеет значения. Шаги перезаписи сводятся к замене одного ограничения нулем или более простыми ограничениями.

Как и LMG, положения RCG имеют общую схему. , где в RCG, это либо пустая строка, либо строка предикатов. Аргументы состоят из строк терминальных символов и/или переменных символов, шаблон которых соответствует фактическим значениям аргументов, как в LMG. Соседние переменные составляют семейство совпадений с разделами, так что аргумент , с двумя переменными, соответствует буквальной строке тремя разными способами: . Это привело бы к трем различным вариантам реализации пункта, содержащего этот аргумент. .

Термины-предикаты бывают двух форм: положительные (которые создают пустую строку в случае успеха) и отрицательные (которые создают пустую строку в случае неудачи/если положительный термин не создает пустую строку). Отрицательные термины обозначаются так же, как и положительные, но с чертой, как в .

Семантика перезаписи для RCG довольно проста и идентична соответствующей семантике LMG. Учитывая строку предиката , где символы являются терминальными строками, если существует правило в грамматике, которой соответствует строка предиката, строка предиката заменяется на , заменяя совпадающие переменные в каждом .

Например, учитывая правило , где и являются переменными символами и и являются терминальными символами, строка предиката можно переписать как , потому что Матчи когда . Аналогично, если бы существовало правило , можно было бы переписать как .

Доказательство/распознавание строки делается, показывая, что создает пустую строку. Для отдельных шагов перезаписи, когда возможны совпадения нескольких альтернативных переменных, рассматривается любая перезапись, которая может привести к успеху всего доказательства. Таким образом, если существует хотя бы один способ создать пустую строку из исходной строки , доказательство считается успешным, независимо от того, сколько существует других способов потерпеть неудачу.

Пример [ править ]

RCG способны распознавать нелинейный индексный язык. следующее:

Пусть x, y и z будут переменными символами:

Тогда доказательством для abbabbabb будет

Или, используя более правильное точечное обозначение диапазонов:

Для строки буквы, есть различные реализации этого первого пункта, но только тот, который делает все буквы, каждая из которых позволяет вывести результат .

Свойства [ править ]

Любую контекстно-свободную грамматику (CFG) можно преобразовать в грамматику конкатенации диапазонов:

  • Для каждого нетерминала CFG, RCG имеет арность предикат .
  • Для каждого правила CFG , у RCG есть .
  • Для каждого правила CFG (где терминал), RCG имеет .

Пересечение и объединение двух языков конкатенации диапазонов тривиально представляют собой языки конкатенации диапазонов:

  • Для пересечение и , у вас есть .
  • Для союз и , у вас есть и .

Возможно, языки конкатенации отрицательных диапазонов также закрываются при установленном дополнении.

Следствием вышесказанного является то, что неразрешимо , является ли язык конкатенации (положительных) диапазонов непустым, поскольку неразрешимо, непусто ли пересечение двух контекстно-свободных языков. Следовательно, грамматики конкатенации диапазонов не являются порождающими.

Ссылки [ править ]

  1. ^ Булье, Пьер (январь 1998 г.). Предложение по синтаксической магистрали обработки естественного языка (PDF) (технический отчет). Том. 3342. ИНРИА Рокенкур (Франция).
  2. ^ Пьер Булье (1999). «Китайские числа, MIX, скремблирование и грамматики объединения диапазонов» (PDF) . Учеб. ЕАКЛ . стр. 53–60. Архивировано из оригинала (PDF) 15 мая 2003 г.
  3. ^ Эберхард Берч и Марк-Ян Недерхоф (октябрь 2001 г.). «О сложности некоторых расширений разбора RCG» (PDF) . Материалы Седьмого международного семинара по технологиям синтаксического анализа (Пекин) . стр. 66–77.
  4. ^ Лаура Каллмейер (2010). Синтаксический анализ за пределами контекстно-свободных грамматик . Springer Science & Business Media. п. 37. ИСБН  978-3-642-14846-0 . цитируя Берча, Недерхоф (2001) [3]
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: C87501795CB89E104D61ADDE84A2A192__1706208900
URL1:https://en.wikipedia.org/wiki/Range_concatenation_grammars
Заголовок, (Title) документа по адресу, URL1:
Range concatenation grammar - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)