Jump to content

Лемур Проект

Проект Lemur — это результат сотрудничества Центра интеллектуального поиска информации Массачусетского университета в Амхерсте и Института языковых технологий Университета Карнеги-Меллон . Проект Lemur разрабатывает поисковые системы, панели инструментов браузера, инструменты анализа текста и ресурсы данных, которые поддерживают исследования и разработку программного обеспечения для поиска информации и анализа текста. Проект наиболее известен своими поисковыми системами Indri и Galago, наборами данных ClueWeb09 и ClueWeb12, а также библиотекой ранжирования RankLib. Программное обеспечение и наборы данных широко используются в научных и исследовательских приложениях, а также в некоторых коммерческих приложениях.

Философия разработки программного обеспечения Lemur Project подчеркивает современную точность, гибкость и эффективность. Например, поисковая система Indri обеспечивает точный поиск больших текстовых коллекций «из коробки», а данные хранятся в доступной форме, что позволяет разрабатывать новые стратегии поиска. Программное обеспечение проекта Lemur распространяется по лицензиям с открытым исходным кодом, что обеспечивает гибкость ученым и разработчикам программного обеспечения.

Для создания Lemur использовались языки программирования C , C++ и Java . Он поставляется вместе с исходными файлами и инструкциями по сборке. Предоставленный исходный код может быть изменен с целью разработки новых библиотек. Он совместим с различными операционными системами, включая Linux и Windows.

Lemur поддерживает следующие функции:

Компоненты

[ редактировать ]

Lemur Project состоит из следующих компонентов:

  • Поисковая система Indri на C++
  • Среда исследования поисковой системы Galago на Java
  • Библиотека обучения ранжированию RankLib
  • Устанавливаем приложение для интеллектуального анализа данных
  • Наборы данных ClueWeb09 и ClueWeb12
  • Панель инструментов журнала запросов

Последняя версия

[ редактировать ]

Обновления компонентов проекта Lemur производятся два раза в год, в июне и декабре.Последняя версия поисковой системы Indri — 5.17.Последняя версия поисковой системы Galago — версия 3.18.Последняя версия библиотеки ранжирования RankLib — 2.14.Последняя версия приложения для интеллектуального анализа данных Sifaka — 1.8.

Поисковая система Индри

[ редактировать ]

Поисковая система Indri — один из компонентов, разработанных проектом Lemur Project. Это открытый исходный код. Язык запросов, используемый в Indri, позволяет исследователям индексировать данные или структурировать документы с помощью простых инструкций командной строки. Indri предлагает гибкость в плане адаптации к различным текущим приложениям. Его также можно распределить по кластеру узлов для повышения производительности. Поисковая система Indri может обрабатывать большие коллекции данных и понимать различные форматы данных, такие как HTML и XML .

API Indri поддерживает различные языки программирования и сценариев, такие как C++, Java , C# и PHP .

Особенности поисковой системы Indri

[ редактировать ]
  • Может использовать несколько представлений документов
  • Явное взвешивание терминов
  • Надежный язык запросов
  • Формально обоснованный
  • Высокоэффективный
  • Может быть эффективно реализовано

См. также

[ редактировать ]
[ редактировать ]


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e672b37663a0964cc3c1f327876ca127__1672920300
URL1:https://arc.ask3.ru/arc/aa/e6/27/e672b37663a0964cc3c1f327876ca127.html
Заголовок, (Title) документа по адресу, URL1:
Lemur Project - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)