Апач Солр
![]() | |
Разработчик(и) | Фонд программного обеспечения Apache |
---|---|
Стабильная версия | 9.6.1 [1] / 29 мая 2024 г |
Репозиторий | Репозиторий Солра |
Написано в | Ява |
Операционная система | Кросс-платформенный |
Тип | поиска и индексирования API |
Лицензия | Лицензия Апач 2.0 |
Веб-сайт | сольр |
Solr (произносится как «солнечный») — это с открытым исходным кодом платформа корпоративного поиска , написанная на Java . Его основные функции включают полнотекстовый поиск , выделение совпадений, фасетный поиск , индексацию в реальном времени, динамическую кластеризацию, интеграцию баз данных, NoSQL . функции [2] и богатая обработка документов (например, Word, PDF). Обеспечивая распределенный поиск и репликацию индексов, Solr обеспечивает масштабируемость и отказоустойчивость . [3] Solr широко используется для корпоративного поиска и аналитики и имеет активное сообщество разработчиков и регулярные выпуски.
Solr работает как автономный сервер полнотекстового поиска. В своей основе он использует библиотеку поиска Lucene Java для полнотекстового индексирования и поиска, а также имеет REST -подобные API-интерфейсы HTTP / XML и JSON , которые позволяют использовать его с большинством популярных языков программирования. Внешняя конфигурация Solr позволяет адаптировать его ко многим типам приложений без написания Java-кода, а также имеет архитектуру плагинов для поддержки более продвинутой настройки.
Apache Solr разрабатывается открытым и совместным проектом Apache Solr в Apache Software Foundation .
История [ править ]
В 2004 году Solr был создан Йоником Сили из CNET Networks как собственный проект для добавления возможностей поиска на веб-сайт компании. [4]
В январе 2006 года CNET Networks решила открыто опубликовать исходный код, передав его Apache Software Foundation . [5] Как и любой новый проект Apache, он вступил в инкубационный период, который помог решить организационные, юридические и финансовые вопросы.
В январе 2007 года Solr вышел из инкубационного статуса в самостоятельный проект верхнего уровня (TLP) и начал стабильно расти за счет накопления функций, тем самым привлекая пользователей, участников и коммиттеров. Хотя это был совершенно новый публичный проект, он послужил основой для нескольких веб-сайтов с высокой посещаемостью. [6]
В сентябре 2008 года был выпущен Solr 1.3, включающий в себя, среди прочего, возможности распределенного поиска и улучшения производительности. [7]
В январе 2009 года Йоник Сили вместе с Грантом Ингерсоллом и Эриком Хэтчером присоединился к Lucidworks (ранее Lucid Imagination), первой компании, предоставляющей коммерческую поддержку и обучение поисковым технологиям Apache Solr. [ нужна ссылка ] С тех пор предложений по поддержке Solr было множество. [8]
В ноябре 2009 года вышел Solr 1.4. В этой версии представлены улучшения в индексировании, поиске и фасетировании, а также множество других улучшений, таких как расширенная обработка документов ( PDF , Word , HTML ), кластеризация результатов поиска на основе Carrot2 , а также улучшенная интеграция с базой данных. В релизе также представлено множество дополнительных плагинов. [9]
В марте 2010 года проекты Lucene и Solr объединились. [10] Отдельные загрузки продолжались, но теперь продукты разрабатывались совместно одной группой коммиттеров.
В 2011 году схема нумерации версий Solr была изменена, чтобы соответствовать схеме Lucene. После Solr 1.4 следующая версия Solr была обозначена как 3.1, чтобы Solr и Lucene имели один и тот же номер версии. [11]
В октябре 2012 года была выпущена версия Solr 4.0, включающая новую функцию SolrCloud. [12] В 2013 и 2014 годах было выпущено несколько выпусков Solr в линейке 4.x, в которых постоянно расширялся набор функций и повышалась надежность.
В феврале 2015 года вышел Solr 5.0. [13] первый выпуск, в котором Solr упакован как отдельное приложение, [14] прекращение официальной поддержки развертывания Солра как войны . Solr 5.3 имел встроенную подключаемую структуру аутентификации и авторизации. [15]
В апреле 2016 года был выпущен Solr 6.0. [16] Добавлена поддержка выполнения параллельных SQL-запросов в коллекциях SolrCloud. Включает поддержку StreamExpression и новый драйвер JDBC для интерфейса SQL.
В сентябре 2017 года был выпущен Solr 7.0. [17] В этом выпуске, среди прочего, добавлена поддержка нескольких типов реплик, автоматическое масштабирование и математический движок.
В марте 2019 года была выпущена Solr 8.0, включающая множество исправлений ошибок и обновлений компонентов. [18] Узлы Solr теперь могут слушать и обслуживать запросы HTTP/2. Имейте в виду, что по умолчанию внутренние запросы также отправляются с использованием HTTP/2. Кроме того, был добавлен вход в интерфейс администратора с поддержкой BasicAuth и Kerberos. построение математических выражений в Apache Zeppelin Теперь возможно .
В ноябре 2020 года Bloomberg передал Solr Оператора проекту Lucene/Solr. Оператор Solr помогает развернуть и запустить Solr в Kubernetes .
В феврале 2021 года Solr был создан как отдельный проект Apache (TLP), независимый от Lucene.
В мае 2022 года вышел Solr 9.0. [19] как первый выпуск, независимый от Lucene, требующий Java 11 и имеющий такие особенности, как «нейронный» поиск KNN, улучшенную модульность, больше плагинов безопасности и многое другое.
Операции [ править ]
Для поиска документа Apache Solr последовательно выполняет следующие операции:
- Индексирование: преобразует документы в машиночитаемый формат.
- Запрос: понимание условий запроса, заданного пользователем. Этими терминами могут быть, например, изображения или ключевые слова.
- Сопоставление: Solr сопоставляет пользовательский запрос с документами, хранящимися в базе данных, чтобы найти соответствующий результат.
- Ранжирование: как только система выполняет поиск проиндексированных документов, она ранжирует результаты по их релевантности.
Сообщество [ править ]
В Solr работают как частные лица, так и компании, которые вносят новые функции и исправляют ошибки. [20] [21] [22] [23] [24]
Интеграция Solr [ править ]
Solr входит в состав встроенного поиска во многих приложениях, таких как системы управления контентом и системы управления корпоративным контентом . Дистрибутивы Hadoop от Cloudera , [25] Хортонворкс [26] и MapR используют Solr в качестве поисковой системы для своих продуктов, предназначенных для работы с большими данными . DataStax DSE интегрирует Solr в качестве поисковой системы с Cassandra . [27] Solr поддерживается в качестве конечной точки в различных средах обработки данных и средах корпоративной интеграции . [ нужна ссылка ]
Solr предоставляет стандартные HTTP REST-подобные API с поддержкой XML и JSON и интегрируется с любой системой или языком программирования, поддерживающими эти стандарты. Для простоты использования также доступны клиентские библиотеки для Java , C# , PHP , Python , Ruby и большинства других популярных языков программирования. [28]
См. также [ править ]
Ссылки [ править ]
- ^ https://solr.apache.org/news.html#apache-solrtm-961-available .
{{cite web}}
: Отсутствует или пусто|title=
( помощь ) - ^ «Предварительная версия Solr 4: SolrCloud, NoSQL и многое другое | SearchHub | Поиск с открытым исходным кодом Lucene/Solr» . Архивировано из оригинала 6 июля 2014 г. Проверено 10 июля 2014 г.
- ^ "Апач Солр -" . apache.org . Проверено 16 января 2017 г.
- ^ Тума, Джон (9 августа 2018 г.). «Что такое Apache Solr» . Середина . Проверено 16 октября 2022 г.
- ^ «[SOLR-1] Вклад кода CNET — ASF JIRA» . apache.org . Проверено 16 января 2017 г.
- ^ «Публичные серверы — Solr Wiki» . apache.org . Проверено 16 января 2017 г.
- ^ "Апач Солр -" . apache.org . Проверено 16 января 2017 г.
- ^ «Поддержка — Solr Wiki» . apache.org . Проверено 16 января 2017 г.
- ^ "Апач Солр -" . apache.org . Проверено 16 января 2017 г.
- ^ «[ГОЛОСОВАНИЕ] объединить разработку lucene/solr (дубль 3) — Йоник Сили — org.apache.lucene.general — MarkMail» . markmail.org . Архивировано из оригинала 24 апреля 2021 года . Проверено 16 января 2017 г.
- ^ Solr3.1 — Solr Wiki . Wiki.apache.org (16 мая 2013 г.). Проверено 21 июля 2013 г.
- ^ Апач Лусене . Lucene.apache.org. Проверено 21 июля 2013 г.
- ^ «Апач Солр — Новости» . apache.org . Проверено 16 января 2017 г.
- ^ «[SOLR-6733] Зонтичная проблема — Solr как отдельное приложение — ASF JIRA» . apache.org . Проверено 16 января 2017 г.
- ^ «Объявление о выпуске Solr 5.3» . lucene.apache.org . Проверено 24 сентября 2015 г.
- ^ «Апач Солр — Новости» . apache.org . Проверено 16 января 2017 г.
- ^ «Апач Солр — Новости» .
- ^ «Примечания к выпуску Apache Solr 8.0» .
- ^ «12 мая 2022 г. доступен Apache Solr™ 9.0.0» .
- ^ «Сольр-вопросы, получившие наибольшее количество голосов» . stackoverflow.com . Проверено 16 января 2017 г.
- ^ «Революция Lucene/Solr 2016» . lucenerevolution.org . Архивировано из оригинала 5 сентября 2017 года . Проверено 16 января 2017 г.
- ^ «Встреча SFBay Apache Lucene/Solr» . сайт встречи . Проверено 16 января 2017 г.
- ^ «Сообщество Осло Сольр» . сайт встречи . Проверено 16 января 2017 г.
- ^ «LinkedIn Solr Group» . linkedin.com . Проверено 16 января 2017 г.
- ^ «Hadoop для всех: поиск внутри Cloudera — инженерный блог Cloudera» . Cloudera.com . 24 июня 2013 года . Проверено 16 января 2017 г.
- ^ «Перенос корпоративного поиска в корпоративный Hadoop — Hortonworks» . hortonworks.com . 2 апреля 2014 года . Проверено 16 января 2017 г.
- ^ «DataStax Enterprise: Cassandra с подробностями интеграции с Solr» . datastax.com . 12 апреля 2012 года . Проверено 6 февраля 2017 г.
- ^ «Интеграция Solr — Solr Wiki» . apache.org . Проверено 16 января 2017 г.
Библиография [ править ]
- Грейнджер, Трей; Поттер, Тимоти (март 2014 г.). Солр в действии (1-е изд.). Публикации Мэннинга . п. 664. ИСБН 9781617291029 .
- Смайли, Дэвид; Пью, Эрик; Париса, Кранти; Митчелл, Мэтт (февраль 2014 г.). Корпоративный поисковый сервер Apache Solr 4 (1-е изд.). Пакт Паблишинг . п. 451. ИСБН 9781782161363 .
- Серафини, Альфредо (декабрь 2013 г.). Руководство для начинающих Apache Solr (1-е изд.). Пакт Паблишинг . п. 324. ИСБН 9781782162520 .
- Рафалович, Александр (июнь 2013 г.). Мгновенное руководство по Apache Solr для индексирования данных (1-е изд.). Пакт Паблишинг . п. 90. ИСБН 9781782164845 .
- Куч, Рафал (январь 2013 г.). Поваренная книга Apache Solr 4 (1-е изд.). Пакт Паблишинг . стр. 328. ISBN 9781782161325 .
- Смайли, Дэвид; Пью, Эрик (20 ноября 2011 г.). Корпоративный поисковый сервер Apache Solr 3 (1-е изд.). Пакт Паблишинг . п. 418. ИСБН 978-1-84951-606-8 .
- Куч, Рафал (22 июля 2011 г.). Поваренная книга Apache Solr 3.1 (1-е изд.). Пакт Паблишинг . стр. 300. ISBN 978-1-84951-218-3 .
- Смайли, Дэвид; Пью, Эрик (19 августа 2009 г.). Solr 1.4 Enterprise Search Server (1-е изд.). Пакт Паблишинг . п. 336. ИСБН 978-1-84719-588-3 .