Поверхностный разбор
Эта статья нуждается в дополнительных цитатах для проверки . ( февраль 2016 г. ) |
Поверхностный синтаксический анализ (также фрагментарный или легкий синтаксический анализ ) — это анализ предложения , который сначала идентифицирует составные части предложения (существительные, глаголы, прилагательные и т. д.), а затем связывает их с единицами более высокого порядка, имеющими дискретные грамматические значения ( группы существительных или фразы) . , группы глаголов и т. д.). В то время как самые элементарные алгоритмы фрагментации просто связывают составные части на основе элементарных шаблонов поиска (например, как указано в регулярных выражениях ), подходы, использующие методы машинного обучения (классификаторы, тематическое моделирование и т. д.), могут учитывать контекстную информацию и, таким образом, Составляйте фрагменты таким образом, чтобы они лучше отражали смысловые отношения между основными составляющими. [1] То есть эти более продвинутые методы решают проблему, заключающуюся в том, что комбинации элементарных составляющих могут иметь разные значения более высокого уровня в зависимости от контекста предложения.
Это метод, широко используемый при обработке естественного языка . Это похоже на концепцию лексического анализа компьютерных языков. Под названием «гипотеза мелкой структуры» она также используется в качестве объяснения того, почему изучающие второй язык часто не могут правильно разобрать сложные предложения. [2]
Ссылки [ править ]
Цитаты [ править ]
- ^ Юрафски, Дэниел ; Мартин, Джеймс Х. (2000). Речевая и языковая обработка . Сингапур: Pearson Education Inc., стр. 577–586.
- ^ Класен, Фельзер, Харальд, Клаудия (2006). «Грамматическая обработка у изучающих язык». Прикладная психолингвистика . 27 : 3–42. дои : 10.1017/S0142716406060024 . S2CID 15990215 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )
Источники [ править ]
- «NP Chunking (современное состояние)» . Ассоциация компьютерной лингвистики . Проверено 30 января 2016 г.
- Эбни, Стивен (1991). «Разбор по частям | Анализ на основе принципов» (PDF) . www.vinartus.net . стр. 257–278.
Внешние ссылки [ править ]
- Apache OpenNLP OpenNLP включает в себя блокировщик.
- Общая архитектура GATE для текстовой инженерии GATE включает в себя блокировщик.
- NLTK на фрагменты Разделение
- Иллинойс Shallow Parser Shallow Parser Демо-версия