ЯСи
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Оригинальный автор(ы) | Майкл Кристианс |
---|---|
Разработчик(и) | ЯСи сообщество |
Первоначальный выпуск | 2003 год [ 1 ] |
Стабильная версия | 1,924
/ 14 декабря 2020 г |
Репозиторий | github |
Написано в | Ява |
Операционная система | Кросс-платформенный |
Тип | Оверлейная сеть , Поисковая система |
Лицензия | GPL-2.0 или новее |
Веб-сайт | ярый |
YaCy (произносится как «я вижу») — бесплатная распределенная поисковая система, построенная на принципах одноранговых (P2P) сетей, созданная Майклом Кристеном в 2003 году. [ 2 ] [ 3 ] Движок написан на Java и по состоянию на сентябрь 2006 г. распространяется на нескольких сотнях компьютеров. [update][ нужно обновить ] , так называемые ЯСы-пиры.
Каждый YaCy-пир самостоятельно сканирует Интернет , анализирует и индексирует найденные веб-страницы, а также сохраняет результаты индексации в общей базе данных (так называемом индексе), которая используется совместно с другими YaCy-пирами, используя принципы одноранговой сети . Этот децентрализованный подход обеспечивает конфиденциальность и устраняет необходимость в центральном сервере. [ 4 ]
По сравнению с полураспределенными поисковыми системами сеть YaCy имеет распределенную архитектуру. Все узлы YaCy равны, и центрального сервера не существует. Его можно запустить либо в режиме сканирования , либо в качестве локального прокси-сервера , индексируя веб-страницы, посещаемые человеком, запустившим YaCy на своем компьютере. Для защиты конфиденциальности пользователя предусмотрено несколько механизмов. Доступ к функциям поиска осуществляется через локально запущенный веб-сервер, который предоставляет поле поиска для ввода условий поиска и возвращает результаты поиска в формате, аналогичном популярным поисковым системам. [ 5 ]
Компоненты системы
[ редактировать ]Поисковая система YaCy основана на четырех элементах: [ 6 ]
- Гусеничный
- Поисковый робот, перемещающийся между веб-страницами и анализирующий их содержимое. [ 7 ]
- Индексатор
- Он создает обратный индекс слов (RWI), т. е. каждое слово из RWI имеет список соответствующих URL-адресов и информацию о ранжировании. Слова сохраняются как хеши слов. [ 8 ]
- Интерфейс поиска и администрирования
- Сделан в виде веб-интерфейса, предоставляемого локальным HTTP- сервлетом с механизмом сервлетов. [ 9 ]
- Хранение данных
- Используется для хранения базы данных индекса обратного слова с использованием распределенной хэш-таблицы .
Поисковые технологии
[ редактировать ]- YaCy — это комплексное поисковое устройство с пользовательским интерфейсом, индексированием, администрированием и мониторингом.
- YaCy собирает веб-страницы с помощью веб-сканера. Затем документы анализируются и индексируются, а индекс поиска сохраняется локально. Если ваш одноранговый узел является частью одноранговой сети, ваш локальный поисковый индекс также объединяется с общим индексом этой сети.
- Начинается поиск, затем локальный индекс дополняется глобальным индексом поиска от узлов в поисковой сети YaCy.
- YaCy Grid — это реализация второго поколения однорангового поиска YaCy. Установка YaCy Grid включает микросервисы , которые взаимодействуют с помощью программы Master Connect (MCP).
- YaCy Parser — это микросервис, который можно развернуть с помощью Docker . Когда компонент Parser запускается, он ищет MCP и подключается к нему. По умолчанию поиск MCP осуществляется на локальном хосте, но вы можете настроить его самостоятельно.
Архитектура платформы YaCy
[ редактировать ]YaCy использует комбинацию методов создания сетей, администрирования и поддержки индексации поисковой системы, включая внесение в черный список, модерацию и общение с сообществом. Вот как YaCy выполняет эти операции:
- Компоненты сообщества
- Веб-форумы [ 10 ]
- Статистика
- XML API
- Обслуживание
- Веб-сервер
- Индексирование
- Гусеничный с балансиром
- Одноранговая серверная связь
- Организация контента
- Черный список и фильтрация
- Интерфейс поиска
- Закладки
- Мониторинг результатов поиска
Распределение
[ редактировать ]YaCy доступен в пакетах для Linux, Windows и Macintosh, а также в виде образа Docker. YaCy также можно установить в других операционных системах, собрав его вручную или используя tar-архив . [ 11 ] YaCy требует Java 8, рекомендуется OpenJDK 8.
Пакет Debian можно установить из репозитория, доступного на поддомене сайта проекта. [ 12 ] [ 13 ] Пакет еще не поддерживается в официальном репозитории пакетов Debian. [ 14 ]
См. также
[ редактировать ]- Dooble — веб-браузер с открытым исходным кодом и встроенным виджетом поисковой системы YaCy.
Ссылки
[ редактировать ]- ^ «Я разрабатываю поисковую систему на основе P2P. Кто участвует?» . Heise Online (на немецком языке). 15 декабря 2003 г. Проверено 9 мая 2018 г.
- ^ «YaCy бросает вызов Google с помощью поисковой системы с открытым исходным кодом» . Регистр . 29 ноября 2011 г. Проверено 16 апреля 2012 г.
- ^ «YaCy: Речь идет о свободе, а не о победе над Google» . Мир ПК . 03.12.2011 . Проверено 16 апреля 2012 г.
- ^ «Дом – ЯСи» . yacy.net . Проверено 1 июля 2024 г.
- ^ «FAQ — ЯСы» . yacy.net . Проверено 4 июля 2024 г.
- ^ «Технологическая архитектура YaCy» . YaCy.net. Архивировано из оригинала 05 февраля 2012 г. Проверено 14 февраля 2012 г.
- ^ GitHub: YaCy Grid Crawler , Поисковая система YaCy, 28 февраля 2021 г., стр. yacy / yacy_grid_crawler , получено 11 марта 2021 г.
- ^ GitHub: YaCy Grid Parser , YaCy Search Engine, 28 февраля 2021 г., стр. YaCy Grid — это реализация YaCy второго поколения , получено 11 марта 2021 г.
- ^ GitHub: YaCY Search , Поисковая система YaCy, 28 февраля 2021 г., стр. yacy / yacy-search, разветвленный от Cream/yacy-search , получено 11 марта 2021 г.
- ^ "forum.yacy.de" . Проверено 6 июня 2017 г.
- ^ «Скачать — ЯСи» . yacy.net . Проверено 27 июля 2021 г.
- ^ "В:DebianInstall " ЯСиВики . Получено 6 октября.
- ^ «Разработчик:Обмен задачами» . ЯСиВики . Проверено 6 октября 2019 г.
- ^ «#452422 — Запрос предложений: yacy — распределенный веб-сканер и поисковая система» . Журналы отчетов об ошибках Debian . Проверено 2 мая 2020 г.
Дальнейшее чтение
[ редактировать ]Внешние ссылки
[ редактировать ]- Анонимные сети
- Распределенное хранилище данных
- Бесплатное программное обеспечение для поисковых систем
- Бесплатные веб-сканеры
- Интернет-ресурсы, основанные в 2003 году.
- Поисковые системы Интернета
- Программное обеспечение платформы Java
- Кроссплатформенное программное обеспечение
- Программное обеспечение, использующее лицензию GPL
- Программное обеспечение Java (язык программирования)
- Одноранговое программное обеспечение