Анализ данных, ориентированный на данные
Data-ориентированный синтаксический анализ ( DOP , также Data-ориентированная обработка ) — вероятностная модель в компьютерной лингвистике . DOP был задуман Ремко Ша в 1990 году с целью разработки грамматической структуры, ориентированной на производительность . В отличие от других вероятностных моделей, DOP учитывает все поддеревья, содержащиеся в древовидном банке, а не ограничивается, например, двухуровневыми поддеревьями (например, PCFG ), что позволяет получать более контекстно-зависимую информацию. [ 1 ]
Разработано несколько вариантов ДОП. Первоначальная версия, разработанная Ренсом Бодом в 1992 году, была основана на грамматике подстановки деревьев . [ 2 ] а совсем недавно DOP был объединен с лексико-функциональной грамматикой (LFG). Полученный DOP-LFG находит применение в машинном переводе . Другая работа по обучению и оценке параметров DOP также нашла применение в машинном переводе.
Ссылки
[ редактировать ]- ^ Р. Бод, Р. Ша и К. Симаан, Анализ данных, ориентированный на данные, CSLI Publications, 2003, стр. 1–5.
- ^ Р. Бод, Вычислительная модель языковой производительности: синтаксический анализ, ориентированный на данные, в: COLING 1992, том 3: 15-я Международная конференция по компьютерной лингвистике, https://www.aclweb.org/anthology/C92-3126.pdf
Внешние ссылки
[ редактировать ]- Ремко Ша Исследование ДОП
- Домашняя страница ДОП
- Халил Симаан: Изучение моделей DOP на деревьях; Вычислительная сложность
- Энди Уэй (1999). Гибридная архитектура для надежного машинного перевода с использованием LFG-DOP. Журнал экспериментального и теоретического искусственного интеллекта 11 (3): 441–471.