ЛОЛИТА
Эта статья в значительной степени или полностью опирается на один источник . ( март 2024 г. ) |
LOLITA — это система обработки естественного языка, разработанная Даремским университетом в период с 1986 по 2000 год. Название является аббревиатурой от «Крупномасштабный объектно-ориентированный лингвистический интерактор , переводчик и анализатор».
LOLITA была разработана Роберто Гарильяно и его коллегами в период с 1986 по 2000 год. Она задумывалась как инструмент общего назначения для обработки неограниченного текста, который мог бы стать основой самых разных приложений . В его основе лежала семантическая сеть , содержащая около 90 000 взаимосвязанных понятий. Текст можно разобрать и проанализировать, а затем включить в семантическую сеть, где о нем можно будет рассуждать (Лонг и Гарильяно, 1993). Фрагменты семантической сети также могут быть переведены обратно на английский или испанский язык .
С использованием системы было создано несколько приложений, в том числе анализаторы финансовой информации и инструменты извлечения информации для « Конкурсов конференций по пониманию сообщений » Darpa ( MUC-6 и MUC-7 ). Последний включал обработку оригинальных статей Wall Street Journal для выполнения таких задач, как выявление ключевых изменений в должностях в бизнесе и обобщение статей. ЛОЛИТА была одной из немногих систем в мире, конкурировавших во всех разделах задач. Описание системы и анализ результатов MUC-6 были написаны Каллаганом (Callaghan, 1998).
LOLITA была ранним примером серьезного приложения, написанного на языке : оно состояло примерно из 50 000 строк Haskell и около 6 000 строк C. функциональном Это также сложное и требовательное приложение, в разработке которого неоценимую роль сыграли многие аспекты Haskell.
ЛОЛИТА была разработана для обработки неограниченного текста, поэтому двусмысленность на различных уровнях была неизбежной и значительной. Лень была необходима для борьбы со взрывом синтаксической двусмысленности, возникающим из-за большой грамматики , и она также широко использовалась при семантической двусмысленности. Система использовала несколько « предметно-ориентированных встроенных языков » для семантической и прагматической обработки, а также для генерации текста на естественном языке из семантической сети. Также важным было умение работать со сложными абстракциями и быстро создавать прототипы новых алгоритмов анализа . [1]
Более поздние системы, основанные на той же конструкции, включают Concepts и SenseGraph.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ История Haskell: ленивость с классами, раздел 11.5
Внешние ссылки
[ редактировать ]- Отчет о проделанной работе Лолиты № 1, 1992 г.
- [1] Сборник статей о параллелизме в Haskell, Lolita часто является одним из или основных тестовых примеров.
- Моделирование убеждений для планов дискурса - (Гарагани, 1997)