Jump to content

ЛОЛИТА

LOLITA — это система обработки естественного языка, разработанная Даремским университетом в период с 1986 по 2000 год. Название является аббревиатурой от «Крупномасштабный объектно-ориентированный лингвистический интерактор , переводчик и анализатор».

LOLITA была разработана Роберто Гарильяно и его коллегами в период с 1986 по 2000 год. Она задумывалась как инструмент общего назначения для обработки неограниченного текста, который мог бы стать основой самых разных приложений . В его основе лежала семантическая сеть , содержащая около 90 000 взаимосвязанных понятий. Текст можно разобрать и проанализировать, а затем включить в семантическую сеть, где о нем можно будет рассуждать (Лонг и Гарильяно, 1993). Фрагменты семантической сети также могут быть переведены обратно на английский или испанский язык .

С использованием системы было создано несколько приложений, в том числе анализаторы финансовой информации и инструменты извлечения информации для « Конкурсов конференций по пониманию сообщений » Darpa ( MUC-6 и MUC-7 ). Последний включал обработку оригинальных статей Wall Street Journal для выполнения таких задач, как выявление ключевых изменений в должностях в бизнесе и обобщение статей. ЛОЛИТА была одной из немногих систем в мире, конкурировавших во всех разделах задач. Описание системы и анализ результатов MUC-6 были написаны Каллаганом (Callaghan, 1998).

LOLITA была ранним примером серьезного приложения, написанного на языке : оно состояло примерно из 50 000 строк Haskell и около 6 000 строк C. функциональном Это также сложное и требовательное приложение, в разработке которого неоценимую роль сыграли многие аспекты Haskell.

ЛОЛИТА была разработана для обработки неограниченного текста, поэтому двусмысленность на различных уровнях была неизбежной и значительной. Лень была необходима для борьбы со взрывом синтаксической двусмысленности, возникающим из-за большой грамматики , и она также широко использовалась при семантической двусмысленности. Система использовала несколько « предметно-ориентированных встроенных языков » для семантической и прагматической обработки, а также для генерации текста на естественном языке из семантической сети. Также важным было умение работать со сложными абстракциями и быстро создавать прототипы новых алгоритмов анализа . [1]

Более поздние системы, основанные на той же конструкции, включают Concepts и SenseGraph.

См. также

[ редактировать ]
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 29fbdfc6862bd13ab96ed34c1b286730__1711031040
URL1:https://arc.ask3.ru/arc/aa/29/30/29fbdfc6862bd13ab96ed34c1b286730.html
Заголовок, (Title) документа по адресу, URL1:
LOLITA - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)