Jump to content

LL грамматика

Грамматика C [1] не LL(1): в нижней части показан анализатор, который обработал токены " int v;main(){" и собирается выбрать правило для получения нетерминала " Stmt". Смотрим только на первый токен просмотра вперед" v", он не может решить, какой из двух вариантов " Stmt", чтобы выбрать, поскольку возможны два продолжения ввода. Их можно различить, взглянув на второй токен просмотра вперед (желтый фон).

В теории формального языка LL -грамматика — это контекстно-свободная грамматика , которая может быть проанализирована анализатором LL , который анализирует входные данные слева направо и создает самое левое производное предложение (следовательно, LL по сравнению с анализатором LR) . которое строит крайний правый вывод). Язык, имеющий грамматику LL, называется языком LL . Они образуют подмножества детерминированных контекстно-свободных грамматик (DCFG) и детерминированных контекстно-свободных языков (DCFL) соответственно. Говорят, что данная грамматика или язык «является грамматикой/языком LL» или просто «является LL», чтобы указать, что он принадлежит к этому классу.

Парсеры LL — это парсеры на основе таблиц, аналогичные парсерам LR. В качестве альтернативы LL-грамматики можно охарактеризовать как те, которые могут быть проанализированы с помощью анализатора с прогнозированием анализатора с рекурсивным спуском без возврата — и их можно легко написать вручную. Эта статья о формальных свойствах LL-грамматик; для синтаксического анализа см. анализатор LL или анализатор рекурсивного спуска .

Формальное определение

[ редактировать ]

Конечный случай

[ редактировать ]

Учитывая натуральное число ,контекстно -свободная грамматика является LL(k)-грамматикой , если

  • для каждой строки символа терминала длиной до символы,
  • для каждого нетерминального символа , и
  • для каждой строки символа терминала ,

существует не более одного производственного правила так что для некоторых строк терминальных символов ,

  • строка может быть получен из начального символа ,
  • может быть получено из после первого применения правила , и
  • первый символы и из соглашаться. [2]

Альтернативное, но эквивалентное формальное определение следующее: является LL(k)-грамматикой , если для произвольных дифференцирований

когда первый символы согласен с мнением , затем . [3] [4]

Неформально, когда парсер вывел , с его крайний левый нетерминал и уже израсходовано со входа, а затем, посмотрев на это и смотрю на следующее символы текущего ввода синтаксический анализатор может с уверенностью идентифицировать производственное правило для .

Когда идентификация правила возможна даже без учета прошлых входных данных , то грамматика называется сильной LL(k)-грамматикой . [5] В формальном определении сильной LL( k ) грамматики универсальный квантор для опускается, и добавляется к квантору «для некоторых» для .Для каждой LL( k ) грамматики структурно эквивалентную сильную LL( k ) грамматику. можно построить [6]

Класс языков LL( k ) образует строго возрастающую последовательность множеств: LL(0) ⊊ LL(1) ⊊ LL(2) ⊊ …. [7] Можно решить, является ли данная грамматика G LL( k ), но неразрешимо, является ли произвольная грамматика LL( k ) для некоторого k . Также разрешимо, если данная LR( k ) грамматика также является LL( m ) грамматикой для некоторого m . [8]

Каждая LL( k ) грамматика также является LR( k ) грамматикой. Грамматика LL(1) без ε также является грамматикой SLR(1). Грамматика LL(1) с символами, имеющими как пустые, так и непустые производные, также является грамматикой LALR(1). Грамматика LL(1) с символами, имеющими только пустой вывод, может быть или не быть LALR(1). [9]

В LL-грамматиках не может быть правил, содержащих левую рекурсию . [10] Каждую LL( k ) грамматику, свободную от ε, можно преобразовать в эквивалентную LL( k ) грамматику в нормальной форме Грейбаха (которая по определению не имеет правил с левой рекурсией). [11]

Обычный случай

[ редактировать ]

Позволять быть терминальным алфавитом. Раздел из называется регулярным разбиением, если для любого язык является регулярным.

Позволять быть контекстно-свободной грамматикой и позволить быть обычным разделом . Мы говорим, что это LL( ) грамматика , если для произвольных выводов

такой, что отсюда следует, что . [12]

Грамматика G называется LL-регулярной (LLR), если существует регулярное разбиение такой, что G есть LL( ). Язык является LL-регулярным, если он порожден LL-регулярной грамматикой.

Грамматики LLR однозначны и не могут быть леворекурсивными.

Каждая LL( k ) грамматика является LLR. Каждая LL( k )-грамматика детерминирована, но существует LLR-грамматика, которая не является детерминированной. [13] Следовательно, класс грамматик LLR строго больше, чем объединение LL( k ) для каждого k .

Решаемо, будет ли при правильном разбиении , данная грамматика — это LL( ). Однако неясно, является ли произвольная грамматика G LLR. Это связано с тем, что решение вопроса о том, порождает ли грамматика G регулярный язык, которое было бы необходимо для нахождения регулярного разбиения для G , можно свести к проблеме соответствия Поста .

Любая LLR-грамматика является LR-регулярной (LRR, соответствующая [ объяснить ] эквивалентно для грамматик LR( k ), но существует грамматика LR(1), которая не является LLR. [13]

Исторически грамматики LLR последовали за изобретением грамматик LRR. Учитывая регулярное разбиение, можно построить машину Мура , преобразующую синтаксический анализ справа налево, идентифицируя экземпляры регулярных постановок. Как только это будет сделано, анализатора LL(1) будет достаточно для обработки преобразованных входных данных за линейное время. Таким образом, анализаторы LLR могут обрабатывать класс грамматик, строго больший, чем анализаторы LL( k ), оставаясь при этом одинаково эффективными.Несмотря на это, теория LLR не имеет серьезных приложений. Одна из возможных и очень правдоподобных причин заключается в том, что, хотя существуют генеративные алгоритмы для анализаторов LL( k ) и LR( k ), проблема создания анализатора LLR/LRR неразрешима, если заранее не построить регулярный раздел. Но даже проблема построения подходящего регулярного разбиения по заданной грамматике неразрешима.

Простые детерминированные языки

[ редактировать ]

Контекстно-свободная грамматика называется простой детерминированной . [14] или просто просто , [15] если

  • оно находится в нормальной форме Грейбаха (т. е. каждое правило имеет вид ), и
  • разные правые части для одного и того же нетерминала всегда начинайте с разных терминалов .

Набор строк называется простым детерминированным или просто простым языком, если он имеет простую детерминированную грамматику.

Класс языков, имеющих грамматику LL(1) без ε в нормальной форме Грейбаха, равен классу простых детерминированных языков. [16] В этот языковой класс входят регулярные множества, не содержащие ε. [15] Для него эквивалентность разрешима, а включение — нет. [14]

Приложения

[ редактировать ]

Грамматики LL, особенно грамматики LL(1), представляют большой практический интерес, поскольку их легко анализировать либо с помощью анализаторов LL, либо с помощью анализаторов рекурсивного спуска, а также многих компьютерных языков. [ объяснить ] по этой причине они разработаны как LL(1). Языки, основанные на грамматиках с высоким значением k , традиционно считались [ нужна ссылка ] быть трудным для анализа, хотя сейчас это менее верно, учитывая доступность и широкое использование [ нужна ссылка ] генераторов синтаксических анализаторов, поддерживающих грамматики LL( k ) для произвольного k .

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Керниган и Ритчи 1988 , Приложение A.13 «Грамматика», стр. 193 и далее. Верхняя часть изображения показывает упрощенный отрывок в нотации, подобной EBNF .
  2. ^ Розенкранц и Стернс (1970 , стр. 227). Опр.1. Авторы не рассматривают случай k =0.
  3. ^ где " " обозначает выводимость посредством крайних левых выводов, а , , и
  4. ^ Уэйт и Гус (1984 , стр. 123) Def. 5.22
  5. ^ Розенкранц и Стернс (1970 , стр. 235) Def.2
  6. ^ Розенкранц и Стернс (1970 , стр. 235) Теорема 2
  7. ^ Rosenkrantz & Stearns (1970 , стр. 246–247): Использование " " для обозначения "или", набора строк имеет , но нет ε-свободных грамматика, для каждого .
  8. ^ Розенкранц и Стернс (1970 , стр. 254–255)
  9. ^ Битти (1982)
  10. ^ Rosenkrantz & Stearns (1970 , стр. 241) Лемма 5
  11. ^ Розенкранц и Стернс (1970 , стр. 242) Теорема 4
  12. ^ Поплавски, Дэвид (1977). «Свойства LL-регулярных языков». Университет Пердью. {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  13. ^ Jump up to: а б Дэвид А. Поплавски (август 1977 г.). Свойства LL-регулярных языков (Технический отчет). Университет Пердью , факультет компьютерных наук.
  14. ^ Jump up to: а б Коренджак и Хопкрофт (1966)
  15. ^ Jump up to: а б Хопкрофт и Ульман (1979 , стр. 229) Упражнение 9.3.
  16. ^ Розенкранц и Стернс (1970 , стр. 243)

Источники

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
  • Сиппу, Сеппо; Сойсалон-Сойнинен, Эльяс (1990). Теория синтаксического анализа: синтаксический анализ LR(k) и LL(k) . Springer Science & Business Media. ISBN  978-3-540-51732-0 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dd94b7b483ebf8827509881b5d9dd840__1701935340
URL1:https://arc.ask3.ru/arc/aa/dd/40/dd94b7b483ebf8827509881b5d9dd840.html
Заголовок, (Title) документа по адресу, URL1:
LL grammar - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)