~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 68D0EE83E9EF4D681572099214F21F50__1717134120 ✰
Заголовок документа оригинал.:
✰ Parse tree - Wikipedia ✰
Заголовок документа перевод.:
✰ Дерево разбора — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Parse_tree ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/68/50/68d0ee83e9ef4d681572099214f21f50.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/68/50/68d0ee83e9ef4d681572099214f21f50__translat.html ✰
Дата и время сохранения документа:
✰ 21.06.2024 06:45:06 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 31 May 2024, at 08:42 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Дерево разбора — Википедия Jump to content

Дерево разбора

Из Википедии, бесплатной энциклопедии
Дерево разбора в SAAB

или Дерево разбора дерево разбора [1] или дерево вывода , или конкретное синтаксическое дерево — это упорядоченное корневое дерево , которое представляет синтаксическую структуру строки в соответствии с некоторой контекстно-свободной грамматикой . Сам термин «дерево разбора» используется главным образом в компьютерной лингвистике ; термин « синтаксическое дерево» в теоретическом синтаксисе более распространен .

Конкретные синтаксические деревья отражают синтаксис языка ввода, что отличает их от абстрактных синтаксических деревьев, используемых в компьютерном программировании. В отличие от диаграмм предложений Рида-Келлога, используемых для обучения грамматике, деревья синтаксического анализа не используют отдельные формы символов для разных типов составляющих .

Деревья синтаксического анализа обычно строятся на основе либо отношения избирательного округа грамматик округа ( грамматики фразовой структуры ), либо отношения зависимости грамматик зависимостей . Деревья разбора могут быть созданы для предложений на естественных языках (см. «Обработка естественного языка »), а также во время обработки компьютерных языков, таких как языки программирования .

Родственной концепцией является фразовый маркер или P-маркер , используемый в трансформационной генеративной грамматике . Маркер фразы — это лингвистическое выражение, отмеченное в соответствии с его фразовой структурой. Это может быть представлено в виде дерева или выражения в квадратных скобках. Маркеры фраз генерируются путем применения правил структуры фраз и сами подлежат дальнейшим правилам трансформации. [2] Набор возможных деревьев разбора синтаксически неоднозначного предложения называется «лесом разбора». [3]

Номенклатура [ править ]

Простое дерево разбора

Дерево разбора состоит из узлов и ветвей. [4] На рисунке дерево разбора представляет собой всю структуру, начиная с S и заканчивая каждым из листовых узлов (Джон, мяч, хит). В дереве синтаксического анализа каждый узел является корневым узлом, узлом ветвления или листовым узлом. В приведенном выше примере S — корневой узел, NP и VP — узлы ветвления, а John, ball, the и hit — все листовые узлы.

Узлы также можно называть родительскими узлами и дочерними узлами. Родительский узел — это узел, под которым есть хотя бы один другой узел , связанный ветвью. В этом примере S является родительским элементом как NP, так и VP. Дочерним узлом является узел , над которым имеется хотя бы один узел, с которым он связан ветвью дерева. Опять же, из нашего примера, hit является дочерним узлом V.

Нетерминальная функция — это функция (узел), которая является либо корнем, либо ветвью этого дерева, тогда как терминальная функция — это функция (узел) в дереве разбора, которое является листом.

Для бинарных деревьев (где каждый родительский узел имеет два непосредственных дочерних узла) количество возможные деревья разбора предложения из n слов задаются каталонским числом .

Деревья разбора на основе округов [ править ]

Деревья разбора грамматик округов на основе округов ( грамматики фразовой структуры ) различают терминальные и нетерминальные узлы. Внутренние узлы помечены нетерминальными категориями грамматики, а листовые узлы помечены терминальными категориями. На изображении ниже представлено дерево разбора на основе округов; он показывает синтаксическую структуру английского предложения John hit the ball :

Дерево разбора ПСЖ

Дерево разбора — это вся структура, начиная с S и заканчивая каждым из листовых узлов ( John , hit , the , ball ). В дереве используются следующие сокращения:

  • NP для именной группы . Первый (крайний левый) NP, единственное существительное «Джон», служит подлежащим в предложении. Второе – объект предложения.

Каждый узел в дереве является корневым узлом, узлом ветвления или листовым узлом. [5] Корневой узел — это узел, не имеющий над собой ветвей. В предложении всегда есть только один корневой узел. Узел ветвления — это родительский узел, который соединяется с двумя или более дочерними узлами. Однако листовой узел — это конечный узел, который не доминирует над другими узлами дерева. S — корневой узел, NP и VP — узлы ветвления, а Джон (N), хит (V), ( D ) и шар (N) — все это конечные узлы. Листья являются лексическими лексемами предложения. Родительский узел — это узел, под которым есть хотя бы еще один узел, связанный ветвью. В этом примере S является родительским элементом как N, так и VP. Дочерний узел — это узел, непосредственно над которым имеется хотя бы один узел, с которым он связан ветвью дерева. В примере hit термины мать и дочь является дочерним узлом V. Для этих отношений также иногда используются .

Деревья разбора на основе зависимостей [ править ]

Деревья разбора грамматик зависимостей на основе зависимостей [6] рассматривают все узлы как терминальные, что означает, что они не признают различия между терминальными и нетерминальными категориями. В среднем они проще, чем деревья синтаксического анализа на основе округов, поскольку содержат меньше узлов. Дерево разбора на основе зависимостей для приведенного выше примера предложения выглядит следующим образом:

Дерево разбора DG

В этом дереве синтаксического анализа отсутствуют фразовые категории (S, VP и NP), которые можно увидеть в приведенном выше аналоге на основе округов. Как и в случае с деревом на основе округов, составная признается структура. Любое полное поддерево дерева является его составной частью. Таким образом, это дерево синтаксического анализа на основе зависимостей признает существительное-субъект Джон и существительное-объект словосочетание мяч в качестве составляющих, так же, как это делает дерево синтаксического анализа на основе округов.

Различие между избирателями и зависимостями имеет далеко идущие последствия. Вопрос о том, необходима ли или полезна дополнительная синтаксическая структура, связанная с деревьями синтаксического анализа на основе округов, является предметом споров.

Маркеры фраз [ править ]

Фразовые маркеры, или P-маркеры, были введены в раннюю трансформационную порождающую грамматику , разработанную Ноамом Хомским и другими. Маркер фразы, представляющий глубокую структуру предложения, создается путем применения правил структуры фразы . Затем это приложение может подвергнуться дальнейшим преобразованиям.

Маркеры фраз могут быть представлены в виде деревьев (как в приведенном выше разделе о деревьях синтаксического анализа на основе округов ), но вместо этого часто задаются в форме «выражений в квадратных скобках», которые занимают меньше места в памяти. Например, выражение в квадратных скобках, соответствующее приведенному выше дереву на основе округов, может выглядеть примерно так:

Как и в случае с деревьями, точная конструкция таких выражений и количество отображаемых деталей могут зависеть от применяемой теории и от моментов, которые автор запроса желает проиллюстрировать.

См. также [ править ]

Примечания [ править ]

  1. ^ См. Чизуэлл и Ходжес 2007: 34.
  2. ^ Ноам Хомский (26 декабря 2014 г.). Аспекты теории синтаксиса . МТИ Пресс. ISBN  978-0-262-52740-8 .
  3. ^ Билло, Сильви и Бернар Ланг. « Структура общих лесов при неоднозначном парсинге ».
  4. ^ «Пакет parsetree для рисования деревьев в LaTeX» . www1.essex.ac.uk .
  5. ^ См. Carnie (2013:118ff.) для ознакомления с основными понятиями синтаксических деревьев (например, корневой узел, терминальный узел, нетерминальный узел и т. д.).
  6. ^ См., например, Ágel et al. 2003/2006.

Ссылки [ править ]

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 68D0EE83E9EF4D681572099214F21F50__1717134120
URL1:https://en.wikipedia.org/wiki/Parse_tree
Заголовок, (Title) документа по адресу, URL1:
Parse tree - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)