~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 8A5F8C3A5021123E84A8D1EDF90A310A__1715858760 ✰
Заголовок документа оригинал.:
✰ Enterprise search - Wikipedia ✰
Заголовок документа перевод.:
✰ Поиск предприятий — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Enterprise_search ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/8a/0a/8a5f8c3a5021123e84a8d1edf90a310a.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/8a/0a/8a5f8c3a5021123e84a8d1edf90a310a__translat.html ✰
Дата и время сохранения документа:
✰ 22.06.2024 06:29:37 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 16 May 2024, at 14:26 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Поиск предприятий — Википедия Jump to content

Корпоративный поиск

Из Википедии, бесплатной энциклопедии

Корпоративный поиск — это программная технология для поиска источников данных внутри компании, обычно в интрасети и базы данных содержимом . Поиск обычно предлагается только внутренним пользователям компании. [1] [2] Корпоративный поиск можно противопоставить веб-поиску , который применяет технологию поиска к документам в открытой сети, и настольному поиску , который применяет технологию поиска к содержимому на одном компьютере.

Корпоративные поисковые системы индексируют данные и документы из различных источников, таких как файловые системы , интрасети , системы управления документами , электронная почта и базы данных . Многие корпоративные поисковые системы объединяют структурированные и неструктурированные данные . в своих коллекциях [3] Корпоративные поисковые системы также используют средства контроля доступа для обеспечения соблюдения политики безопасности для своих пользователей. [4]

Поиск предприятия можно рассматривать как разновидность вертикального поиска предприятия.

Компоненты поисковой системы предприятия [ править ]

В корпоративной поисковой системе контент проходит различные этапы от исходного репозитория до результатов поиска:

Осведомленность о контенте [ править ]

Осведомленность о контенте (или «сбор контента») обычно представляет собой модель «выталкивания» или «вытягивания». В модели push исходная система интегрируется с поисковой системой таким образом, что она подключается к ней и отправляет новый контент непосредственно в ее API . Эта модель используется, когда важна индексация в реальном времени. В модели извлечения программное обеспечение собирает контент из источников с помощью соединителя, такого как веб-искатель или соединитель базы данных . Соединитель обычно опрашивает источник с определенными интервалами в поисках нового, обновленного или удаленного контента. [5]

Обработка и анализ контента [ править ]

Содержимое из разных источников может иметь множество разных форматов или типов документов, например XML, HTML, форматы документов Office или простой текст. На этапе обработки контента входящие документы преобразуются в обычный текст с использованием фильтров документов. Также часто необходимо нормализовать контент различными способами, чтобы улучшить запоминаемость или точность . Они могут включать в себя стемминг , лемматизацию , расширение синонимов , извлечение сущностей , разметку частей речи .

В рамках обработки и анализа применяется токенизация для разделения контента на токены , которые являются базовой единицей сопоставления. Также принято нормализовать токены к нижнему регистру, чтобы обеспечить поиск без учета регистра, а также нормализовать акценты, чтобы обеспечить лучшее запоминание.

Индексация [ править ]

Результирующий текст сохраняется в индексе , который оптимизирован для быстрого поиска без сохранения полного текста документа. Индекс может содержать словарь всех уникальных слов в корпусе, а также информацию о ранжировании и частоте терминов .

Обработка запросов [ править ]

Используя веб-страницу, пользователь отправляет запрос в систему. Запрос состоит из любых терминов, которые вводит пользователь, а также действий навигации, таких как фасетирование и разбиение на страницы.

Соответствие [ править ]

Обработанный запрос затем сравнивается с сохраненным индексом, и поисковая система возвращает результаты (или «попадания»), ссылающиеся на совпадающие исходные документы. Некоторые системы могут представить документ в том виде, в котором он был проиндексирован.

См. также [ править ]

Ссылки [ править ]

  1. ^ Крушвиц, Удо; Халл, Чарли (2017). «В поисках предприятия». Основы и тенденции в области информационного поиска . 11 : 1–142. дои : 10.1561/1500000053 .
  2. ^ «Что такое корпоративный поиск?» .
  3. ^ «Новое лицо корпоративного поиска: объединение структурированной и неструктурированной информации» (PDF) . Архивировано из оригинала (PDF) 28 октября 2015 г. Проверено 27 мая 2013 г.
  4. ^ «Требования безопасности к корпоративному поиску: часть 1 – Разработка новых идей» .
  5. ^ «Понимание сбора и индексирования контента» .
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 8A5F8C3A5021123E84A8D1EDF90A310A__1715858760
URL1:https://en.wikipedia.org/wiki/Enterprise_search
Заголовок, (Title) документа по адресу, URL1:
Enterprise search - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)