Языковая посуда

LanguageWare — это технология обработки естественного языка (NLP), разработанная IBM , которая позволяет приложениям обрабатывать текст на естественном языке. Он включает в себя набор библиотек Java, которые обеспечивают ряд функций НЛП : идентификация языка , сегментация/токенизация текста, нормализация, извлечение сущностей и отношений , а также семантический анализ и устранение неоднозначности. Механизм анализа использует подход конечного автомата на нескольких уровнях, что улучшает его производительность, сохраняя при этом достаточно небольшой размер.

Поведение системы определяется набором настраиваемых лексико-семантических ресурсов, которые описывают характеристики и предметную область обрабатываемого языка. Набор ресурсов по умолчанию входит в состав LanguageWare и описывает характеристики родного языка, такие как морфология, и основной словарный запас языка. Были созданы дополнительные ресурсы, в которых собраны дополнительные словари, терминологии, правила и грамматики, которые могут быть общими для языка или специфичными для одной или нескольких областей.

Набор инструментов настройки на основе Eclipse , LanguageWare Resource Workbench, доступен на платформе AlphaWorks от IBM. ^[1] сайт и позволяет компилировать знания предметной области в эти ресурсы и тем самым включать их в процесс анализа.

LanguageWare можно развернуть как набор UIMA -совместимых аннотаторов, подключаемых модулей Eclipse или веб-служб .

См. также

Ссылки

^ «Сообщество AlphaWorks» . Alphaworks.ibm.com. 20 октября 2009 г.

Языковая посуда

См. также

Ссылки

Внешние ссылки

Похожие статьи