Поликарп
Эта статья нуждается в дополнительных цитатах для проверки . ( июнь 2020 г. ) |
Poliqarp — с открытым исходным кодом поисковая система , предназначенная для обработки корпусов текстов , в том числе Национального корпуса польского языка, созданного в Институте компьютерных наук Польской академии наук . [1] [2]
Функции
[ редактировать ]- Пользовательский язык запросов [3]
- Двухуровневые регулярные выражения :
- работая на уровне символов в словах
- работая на уровне слов в высказываниях/абзацах
- Хорошая производительность
- Компактное представление корпуса (по сравнению с аналогичными проектами)
- Переносимость между операционными системами: Linux / BSD / Win32.
- Отсутствие переносимости через порядок байтов (текущая версия работает только на устройствах с прямым порядком байтов)
Ссылки
[ редактировать ]- ^ «Поисковая система Поликарпа для данных NKJP» . nkjp.pl. Проверено 1 декабря 2020 г.
- ^ «Поликарп 1.1» . nlp.ipipan.waw.pl . Проверено 1 декабря 2020 г.
- ^ Янус, Дэниел; Пшепёрковский, Адам (25 июня 2007 г.). «Поликарп: индексатор корпуса с открытым исходным кодом и поисковая система с синтаксическими расширениями» . Материалы 45-го ежегодного собрания ACL по интерактивным плакатам и демонстрационным сессиям . Ассоциация компьютерной лингвистики. стр. 85–88 . Проверено 1 декабря 2020 г.