ЛОЛИТА

LOLITA — это система обработки естественного языка, разработанная Даремским университетом в период с 1986 по 2000 год. Название является аббревиатурой от «Крупномасштабный объектно-ориентированный лингвистический интерактор , переводчик и анализатор».

LOLITA была разработана Роберто Гарильяно и его коллегами в период с 1986 по 2000 год. Она задумывалась как инструмент общего назначения для обработки неограниченного текста, который мог бы стать основой самых разных приложений . В его основе лежала семантическая сеть , содержащая около 90 000 взаимосвязанных понятий. Текст можно разобрать и проанализировать, а затем включить в семантическую сеть, где о нем можно будет рассуждать (Лонг и Гарильяно, 1993). Фрагменты семантической сети также могут быть переведены обратно на английский или испанский язык .

С использованием системы было создано несколько приложений, в том числе анализаторы финансовой информации и инструменты извлечения информации для « Конкурсов конференций по пониманию сообщений » Darpa ( MUC-6 и MUC-7 ). Последний включал обработку оригинальных статей Wall Street Journal для выполнения таких задач, как выявление ключевых изменений в должностях в бизнесе и обобщение статей. ЛОЛИТА была одной из немногих систем в мире, конкурировавших во всех разделах задач. Описание системы и анализ результатов MUC-6 были написаны Каллаганом (Callaghan, 1998).

LOLITA была ранним примером серьезного приложения, написанного на языке : оно состояло примерно из 50 000 строк Haskell и около 6 000 строк C. функциональном Это также сложное и требовательное приложение, в разработке которого неоценимую роль сыграли многие аспекты Haskell.

ЛОЛИТА была разработана для обработки неограниченного текста, поэтому двусмысленность на различных уровнях была неизбежной и значительной. Лень была необходима для борьбы со взрывом синтаксической двусмысленности, возникающим из-за большой грамматики , и она также широко использовалась при семантической двусмысленности. Система использовала несколько « предметно-ориентированных встроенных языков » для семантической и прагматической обработки, а также для генерации текста на естественном языке из семантической сети. Также важным было умение работать со сложными абстракциями и быстро создавать прототипы новых алгоритмов анализа . ^[1]

Более поздние системы, основанные на той же конструкции, включают Concepts и SenseGraph.

См. также

Компьютерная лингвистика

Ссылки

^ История Haskell: ленивость с классами, раздел 11.5

Внешние ссылки

Отчет о проделанной работе Лолиты № 1, 1992 г.
[1] Сборник статей о параллелизме в Haskell, Lolita часто является одним из или основных тестовых примеров.
Моделирование убеждений для планов дискурса - (Гарагани, 1997)

[1] История Haskell: ленивость с классами, раздел 11.5

[1]