Языковая посуда
LanguageWare — это технология обработки естественного языка (NLP), разработанная IBM , которая позволяет приложениям обрабатывать текст на естественном языке. Он включает в себя набор библиотек Java, которые обеспечивают ряд функций НЛП : идентификация языка , сегментация/токенизация текста, нормализация, извлечение сущностей и отношений , а также семантический анализ и устранение неоднозначности. Механизм анализа использует подход конечного автомата на нескольких уровнях, что улучшает его производительность, сохраняя при этом достаточно небольшой размер.
Поведение системы определяется набором настраиваемых лексико-семантических ресурсов, которые описывают характеристики и предметную область обрабатываемого языка. Набор ресурсов по умолчанию входит в состав LanguageWare и описывает характеристики родного языка, такие как морфология, и основной словарный запас языка. Были созданы дополнительные ресурсы, в которых собраны дополнительные словари, терминологии, правила и грамматики, которые могут быть общими для языка или специфичными для одной или нескольких областей.
Набор инструментов настройки на основе Eclipse , LanguageWare Resource Workbench, доступен на платформе AlphaWorks от IBM. [1] сайт и позволяет компилировать знания предметной области в эти ресурсы и тем самым включать их в процесс анализа.
LanguageWare можно развернуть как набор UIMA -совместимых аннотаторов, подключаемых модулей Eclipse или веб-служб .
См. также
[ редактировать ]- Обнаружение данных и построитель запросов
- Конечный автомат
- Официальный язык
- IBM Омнифинд
- Лингвистика
- Семантическая сеть
- Семантика
- Сервис-ориентированная архитектура
- Веб-сервисы
- ПЛАВАНИЕ
Ссылки
[ редактировать ]- ^ «Сообщество AlphaWorks» . Alphaworks.ibm.com. 20 октября 2009 г.
Внешние ссылки
[ редактировать ]- IBM LanguageWare Resource Workbench на AlphaWorks
- IBM LanguageWare Miner для многомерных социо-семантических сетей на AlphaWorks
- Информационный центр JumpStart для IBM LanguageWare на IBM.com
- Домашняя страница UIMA в Apache Software Foundation
- UIMA Framework — это SourceForge.
- IBM OmniFind Yahoo! Издание (БЕСПЛАТНАЯ поисковая система для предприятий). Архивировано 17 февраля 2007 г. на Wayback Machine.
- Группа семантических информационных систем и языковой инженерии
- SemanticDesktop.org
Похожие статьи
[ редактировать ]- Бранимир К. Богураев Обработка конечных состояний на основе аннотаций в крупномасштабной архитектуре НЛП, Отчет об исследованиях IBM, 2004 г.
- Александр Трусов, Михаил Согрин, «IBM LanguageWare Ontological Network Miner»
- Шейла Кинселла, Андреас Харт, Александр Трусов, Михаил Согрин, Джон Джадж, Конор Хейс, Джон Г. Бреслин, «Навигация и аннотирование семантически доступных сетей людей и связанных объектов»
- Михаил Котельников, Александр Полонский, Малте Кизель, Макс Фёлкель, Хайко Халлер, Михаил Согрин, Пер Ланнеро, Брайан Дэвис, «Интерактивные семантические вики» [ постоянная мертвая ссылка ]
- Себастьян Трюг, Йос ван ден Овер, Стефан Лорьер, «Социально-семантический рабочий стол: Непомук»
- Симус Лоулесс, Винсент Уэйд, «Обнаружение, сбор и доставка динамического контента» [ мертвая ссылка ]
- Р. Мак, С. Мукерджи, А. Соффер, Н. Урамото, Э. Браун, А. Коден, Дж. Купер, А. Инокучи, Б. Айер, Ю. Масс, Х. Мацузава и Л. В. Субраманиам, «Текст аналитика для медико-биологических наук с использованием архитектуры управления неструктурированной информацией»
- Алекс Невидомский, «Структура UIMA и обнаружение знаний в IBM», 4-й симпозиум по интеллектуальному анализу текста, Fraunhofer SCAI, 2006 г.