Повсеместная лаборатория обработки знаний
Другое имя | УКП Лаборатория |
---|---|
Головное учреждение | Технический университет Дармштадта |
Основатель(и) | Ирина Гуревич |
Учредил | 2006 |
Веб-сайт | http://www.ukp.tu-darmstadt.de/ |
Лаборатория обработки повсеместных знаний (также UKP Lab ) — исследовательская лаборатория на факультете компьютерных наук Технического университета Дармштадта . Основана в 2006 году Ириной Гуревич .
Исследовательская деятельность
[ редактировать ]UKP Lab разрабатывает методы обработки естественного языка для автоматического понимания письменного текста и применяет их к управлению информацией, например, к поиску информации , ответам на вопросы и структурированию информации в Wiki . [ 1 ]
Лаборатория обработки повсеместных знаний входит в число ведущих исследовательских институтов в области использования контента Web 2.0 в качестве источника лексико-семантической информации для обработки естественного языка (NLP). Arc.Ask3.Ru и Викисловарь используются как совместно созданные лексико-семантические ресурсы и используются для улучшения ресурсов, созданных экспертами, таких как WordNet . Эти ресурсы используются для разработки семантически улучшенных алгоритмов поиска информации и ответов на вопросы. Примером может служить семантический поиск : если пользователь вводит в поисковую систему запрос «пирог-фрукты», стандартная поисковая система найдет страницы, содержащие слова «пирог», но не слово «фрукты», предоставляя множество страниц по запросу «яблоко». пирог». Интеллектуальная поисковая система «поймет», что пользователя интересуют рецепты пирогов, в которых не используются никакие фрукты, и найдет соответствующие документы. [ 2 ]
Дальнейшие исследования в лаборатории UKP включают автоматическую оценку качества текста, анализ настроений и анализ мнений. Научно-исследовательская деятельность организована по следующим научным направлениям:
- Образовательная обработка естественного языка
- Многоязычное управление семантической информацией
- Обработка естественного языка для вики
Особое внимание в UKP Lab уделяется использованию новых алгоритмов обработки естественного языка в реальных приложениях. UKP Lab сотрудничает с партнерами из академических кругов и промышленности для улучшения различных сценариев применения, таких как управление взаимоотношениями с клиентами , цифровые гуманитарные науки , образовательные приложения или общественная безопасность.
Программное обеспечение
[ редактировать ]Частью исследовательских усилий UKP Lab является разработка программного обеспечения для обработки естественного языка (NLP) . Следующие пакеты программного обеспечения доступны бесплатно для исследовательских целей:
ДКПро
[ редактировать ]Репозиторий программного обеспечения для обработки знаний Дармштадта (DKPro) — это сообщество программных проектов с открытым исходным кодом, направленных на обработку естественного языка. Он предлагает надежные, готовые к использованию компоненты NLP, построенные на базе архитектуры управления неструктурированной информацией IBM (UIMA) в качестве общей и открытой среды .
DKPro содержит базовые компоненты обработки естественного языка, такие как разметка частей речи и лемматизация . Кроме того, пакет предлагает компоненты, поддерживающие обработку пользовательского дискурса. Пользовательский контент содержит орфографические ошибки, сокращения и смайлы, которые запрещают прямое применение стандартных компонентов НЛП. DKPro предоставляет необходимые инструменты предварительной обработки.
Arc.Ask3.Ru API
[ редактировать ]Библиотека Википедии Java (JWPL) [ 3 ] также был разработан в UKP Lab. Это Java для Википедии на основе интерфейс прикладного программирования , обеспечивающий программный доступ ко всей информации, содержащейся в Википедии .
Викисловарь API
[ редактировать ]Параллельно с JWPL существует библиотека викисловарей Java (JWKTL). [ 3 ] предлагает программный доступ к информации, содержащейся в английской и немецкой версиях Викисловаря .
Ссылки
[ редактировать ]- ^ Новости Hessen-IT, 03/2008 .
- ^ Пример из: Impulses for Science 2010 (Фонд Volkswagen) .
- ^ Jump up to: а б Справочная публикация: [1] Зеш, Мюллер, Гуревич: Извлечение лексико-семантических знаний из Википедии и Викисловаря, Труды LREC 2008.