Jump to content

Распределенная поисковая система

Распределенная поисковая система — это поисковая система , в которой нет центрального сервера. В отличие от традиционных централизованных поисковых систем, такие работы, как сканирование , интеллектуальный анализ данных , индексирование и запросов обработка , распределяются между несколькими узлами децентрализованным образом, где нет единой точки контроля.

Presearch, запущенная в 2017 году, представляет собой поисковую систему на базе стандарта ERC20 (PRE), работающую на основе распределенной сети узлов, управляемых сообществом, которые агрегируют результаты из различных источников. Это обеспечивает поиск на presearch.com/. Планируется, что это станет предшественником, в котором каждый узел будет сотрудничать в глобальном децентрализованном индексе. [1] В среднем Presearch выполняет 5 миллионов поисковых запросов в день и имеет 2,2 миллиона зарегистрированных пользователей. 1 сентября 2021 г. Presearch был добавлен в качестве опции по умолчанию в список поисковых систем Android для ЕС. [2] 27 мая 2022 года Presearch официально перешла со своей тестовой сети на основную. Это означает, что весь поисковый трафик через службу теперь проходит через децентрализованную сеть узлов Presearch, управляемых добровольцами. [3]

15 декабря 2003 года Майкл Кристен объявил о разработке поисковой системы на основе P2P , получившей впоследствии название YaCy на онлайн-форумах Heise . [4] [5]

Seeks представлял собой прокси-сервер веб-поиска с открытым исходным кодом и распределенный инструмент для совместной работы для веб-поиска. В 2016 году он перестал быть пригодным для использования выпуском.

ИнфраПоиск

[ редактировать ]

В апреле 2000 года несколько программистов (в том числе Джин Кан и Стив Уотерхаус ) создали прототип веб-поисковой системы P2P на основе Gnutella под названием InfraSearch . Позже технология была приобретена Sun Microsystems и включена в проект JXTA . [6] Он должен был работать в базах данных участвующих веб-сайтов, создавая P2P -сеть, доступ к которой можно было получить через веб-сайт InfraSearch. [7] [8] [9]

Опенкола

[ редактировать ]

31 мая 2000 года компания Steelbridge Inc. объявила о разработке OpenCOLA — совместной дистрибутивной поисковой системы с открытым исходным кодом. [10] Он запускается на компьютере пользователя, сканирует веб-страницы и ссылки, которые пользователь помещает в свою папку opencola, и делится полученным индексом по своей P2P- сети. [11]

В феврале 2001 года Вольф Гарбе опубликовал идею одноранговой поисковой системы. [12] запустил прототип Faroo в 2004 году, [13] и выпустил его в 2005 году. [14] [15]

Цели создания распределенной поисковой системы включают в себя:

1. создать независимую поисковую систему, поддерживаемую сообществом;

2. сделать операцию поиска открытой и прозрачной, используя программное обеспечение с открытым исходным кодом;

3. распределить доходы от рекламы между обслуживающими узлами, что может помочь создать более надежную веб-инфраструктуру;

4. позволить исследователям вносить вклад в разработку общедоступных алгоритмов ранжирования с открытым исходным кодом и контролировать обучение параметров алгоритма.

Проблемы

[ редактировать ]

1. Объем данных, подлежащих обработке, огромен. Размер видимой сети оценивается в 5 ПБ и включает около 10 миллиардов страниц.

2. Задержка распределенной операции должна быть конкурентоспособной с задержкой коммерческих поисковых систем.

3. Необходимо разработать механизм, который не позволит злоумышленникам повредить распределенные структуры данных или ранг.

См. также

[ редактировать ]
  1. ^ «Presearch — это децентрализованная поисковая система» .
  2. ^ 297 акций; 4.3креда (01.09.2021). «Google добавляет Presearch в качестве опции по умолчанию на устройствах Android в ЕС» . Журнал поисковых систем . Проверено 10 ноября 2021 г. {{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  3. ^ Кан, Майкл (26 мая 2022 г.). «Следующий Google? Децентрализованная поисковая система Presearch выходит из фазы тестирования» . Журнал ПК .
  4. ^ «ЯСи: Новости» . Архивировано из оригинала 24 ноября 2005 г.
  5. ^ Майкл Кристианс. «Я разрабатываю поисковую систему на основе P2P. Кто участвует?» . Хайз онлайн .
  6. ^ Джастин Хиббард. «Могут ли одноранговые вырасти?» . Красная селедка . [ постоянная мертвая ссылка ]
  7. ^ Саймон Фауст. «Подвиньтесь Yahoo, вот и InfraSearch» . Дмузыка . Архивировано из оригинала 13 октября 2000 г.
  8. ^ Шон М. Дуган. «Одноранговые сети снова произведут революцию в Интернете» . Инфомир . Архивировано из оригинала 18 октября 2000 г.
  9. ^ Джон Борланд. «Технология, подобная Napster, выводит веб-поиск на новый уровень» . Cnet .
  10. ^ Дэвид Эйкин . «Программное обеспечение запущено с небольшим треском» . Финансовый пост . [ мертвая ссылка ]
  11. ^ Пол Хельцель. «OpenCola — немного кода и улыбка» . Обзор технологий .
  12. ^ Волчий сноп. «BINGOOO – Превращение Всемирной паутины в виртуальную базу данных» (на немецком языке). Бизнес-информатика . Архивировано из оригинала 2 февраля 2014 г. Проверено 21 декабря 2010 г. ... Мы выступаем против концепции распределенной одноранговой поисковой системы...
  13. ^ Бернард Ланн. «Технические вопросы и ответы с основателем FAROO» . ЧитатьWriteWeb . Архивировано из оригинала 14 февраля 2011 г. ...Когда я начал работать над первым прототипом в 2004 году...
  14. ^ «ФАРУ: История» . Архивировано из оригинала 22 марта 2008 г.
  15. ^ «Пересмотр: определение стартовых точек сканера на основе посещенных страниц путем мониторинга HTTP-трафика» . Фару.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 7401d4e3aadc1eb84a10739a40c037b2__1706933220
URL1:https://arc.ask3.ru/arc/aa/74/b2/7401d4e3aadc1eb84a10739a40c037b2.html
Заголовок, (Title) документа по адресу, URL1:
Distributed search engine - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)