Jump to content

Поисковая посуда

Поисковая посуда
Разработчик(и) Быстрый поиск и передача , Convera , Excalibur Technologies, ConQuest Software, Microsoft
Стабильная версия
8.2 / 13 октября 2006 г. ( 13.10.2006 )
Написано в С , С++ , Ява
Операционная система Кросс-платформенный
Тип Поиск и индексирование

RetrivalWare — это корпоративная поисковая система, в которой основное внимание уделяется обработке естественного языка и семантическим сетям . Она была коммерчески доступна с 1992 по 2007 год и особенно известна тем, что ее использовали правительственные спецслужбы. [ 1 ]

Первоначально RetrivalWare был создан Полом Нельсоном. [ 2 ] Кеннет Кларк, [ 3 ] и Эдвин Аддисон [ 4 ] как часть программного обеспечения ConQuest. Разработка началась в 1989 году, но в широком масштабе программное обеспечение не было коммерчески доступно до 1992 года. Первоначальное финансирование было предоставлено Римской лабораторией в виде гранта на исследования инноваций в сфере малого бизнеса . [ 5 ]

6 июля 1995 года ConQuest Software была объединена с компанией Excalibur Technologies, принадлежащей NASDAQ. [ 6 ] и продукт был переименован в RetrivalWare. 21 декабря 2000 года Excalibur Technologies была объединена с подразделением Interactive Media Services корпорации Intel и образовала Convera Corporation . [ 7 ] Наконец, 9 апреля 2007 года программное обеспечение и бизнес RetrivalWare были приобретены компанией Fast Search & Transfer , после чего продукт был официально снят с производства. [ 8 ] Корпорация Microsoft продолжает поддерживать продукт для своей существующей клиентской базы.

Годовой доход RetrivalWare достиг своего пика в 2001 году и составил около 40 миллионов долларов США. [ 9 ]

Использование техник естественного языка

[ редактировать ]

RetrivalWare — это система текстового поиска с ранжированием релевантности с усовершенствованиями обработки, взятыми из областей обработки естественного языка (NLP) и семантических сетей . на основе словаря Алгоритмы НЛП включают стемминг (также известный как лемматизация ) и идентификацию фраз на основе словаря. Семантические сети используются RetrivalWare для расширения слов запроса, введенных пользователем, до связанных терминов с весами терминов, определяемыми расстоянием от исходных терминов пользователя. Помимо автоматического расширения, был доступен режим обратной связи, в котором пользователи могли выбрать значение слова перед выполнением расширения. Первые семантические сети были построены с использованием WordNet .

Кроме того, в RetrivalWare реализована форма поиска n-грамм (под названием APRP — обработка адаптивного распознавания образов). [ 10 ] ), предназначенный для поиска документов с ошибками оптического распознавания символов . Термины запроса делятся на наборы по 2 грамма, которые используются для поиска одинаково совпадающих терминов из инвертированного индекса . Полученные совпадения взвешиваются на основе аналогичных показателей и затем используются для поиска документов.

Все эти функции были доступны не позднее 1993 года. [ 11 ] и программное обеспечение ConQuest заявило, что это первая коммерческая система текстового поиска, реализовавшая эти методы. [ 12 ]

Другие примечательные особенности

[ редактировать ]

Другие примечательные особенности RetrivalWare включают распределенные поисковые серверы, [ 11 ] синхронизаторы для индексации внешних систем управления контентом и реляционных баз данных , [ 13 ] гетерогенная модель безопасности, [ 13 ] категоризация документов , [ 13 ] сопоставление документов с запросами в реальном времени (профилирование), [ 11 ] многоязычный поиск (запросы, содержащие термины на нескольких языках, поиск документов, содержащих термины на нескольких языках) и межъязыковый поиск (запросы на одном языке, поиск документов на другом языке). [ 14 ]

Участие в ТРЭК

[ редактировать ]

Компания RetrivalWare участвовала в конференции по текстовому поиску в 1992 г. (TREC-1), 1993 г. (TREC-2) и 1995 г. (TREC-4). [ 15 ]

В ТРЭК-1 [ 16 ] и ТРЭК-4, [ 17 ] Запуск RetrivalWare для запросов, введенных вручную, дал наилучшие результаты на основе средних значений в 11 баллов по всем поисковым системам, которые участвовали в специальной категории, где поисковым системам предоставляется единственная возможность обрабатывать ранее неизвестные запросы к существующей базе данных.

  1. ^ Визе, Дэвид А. (3 декабря 2004 г.). «Агентства находят то, что ищут» . Вашингтон Пост . Проверено 22 мая 2010 г. [ мертвая ссылка ]
  2. ^ «Пол Нельсон, руководитель отдела инноваций, контент-аналитики в Accenture Analytics» . Проверено 1 декабря 2020 г.
  3. ^ «Арден и Кен» . comcast.net. 23 июля 2011 г. Архивировано из оригинала 23 июля 2011 г.
  4. ^ «Эд Аддисон, серийный предприниматель, венчурный капиталист, руководитель бизнеса, профессор» .
  5. ^ . Джон МакГрат присоединился к компании в 1993 году в качестве вице-президента по продажам и маркетингу. Компания быстро увеличила доходы от федеральных контрактов США, издателей и корпоративных клиентов, которым требовалась повышенная точность и производительность поиска текста. ЗАЯВКА СБИР ЗА 1991 ФГ - РЕЗЮМЕ НАГРАДЫ ФАЗЫ I - ПРОЕКТЫ ВВС - ТОМ III (PDF) , 6 июля 1992 г., стр. 70–71, заархивировано из оригинала (PDF) 4 июня 2011 г. - Обратите внимание, что «Синхронетика» было первоначальным названием ConQuest Software Incorporated.
  6. ^ «Excalibur Technologies объединяется с ConQuest Software; лидеры в области поиска текстовой и мультимедийной информации объединяют усилия для расширения продуктов, каналов и рынков» (пресс-релиз). Деловой провод. 06.07.1995.
  7. ^ «Intel и Excalibur образуют Convera Corporation» . Силиконовая долина / Бизнес-журнал Сан-Хосе. 21 декабря 2000 г.
  8. ^ «FAST приобретает бизнес Convera по поиску программного обеспечения» . Information Today, Inc., 9 апреля 2007 г. Хотя FAST продолжит поддерживать платформу RetrivalWare, она не будет продолжать ее разработку или добавлять новые функции. Клиентам RetrivalWare будет предложен путь обновления до собственного предложения FAST.
  9. ^ Convera Corp · 10-K · На 01.01.01 , 01.01.2001 — указывает, что на продукцию Convera приходилось 85% общего дохода в 51,5 миллиона долларов.
  10. ^ Excalibur объявляет о выпуске Excalibur RetrivalWare 6.5 с RetrivalWare FileRoom - содержит описание APRP
  11. ^ Jump up to: а б с Отчет о конференции по текстовому поиску, организованной ConQuest Software Inc. (TREC2). Полный текст доклада можно найти здесь.
  12. ^ «Помощник по домашним заданиям дебютирует на Prodigy с использованием поисковой системы ConQuest» (пресс-релиз). Деловой провод. 9 февраля 1995 г. ConQuest — единственная поисковая система, которая использует словари, тезаурусы и другие лексические ресурсы для создания семантической базы знаний, содержащей более 440 000 значений слов и 1,6 миллиона словесных связей.
  13. ^ Jump up to: а б с «Excalibur RetrivalWare: больше, чем просто поиск информации» . КММир. 01.10.1999.
  14. ^ «Мультимедийный поиск, извлечение, категоризация» . КММир. 25 марта 2002 г.
  15. ^ Фланк, Шэрон (1998). «Многоуровневый подход к поиску информации на основе НЛП» . Материалы 36-го ежегодного собрания Ассоциации компьютерной лингвистики . Том. 1. dl.acm.org. п. 397. дои : 10.3115/980845.980913 . S2CID   581537 . Проверено 1 декабря 2020 г.
  16. ^ Отчет о конференции по поиску текста, организованной ConQuest Software Inc. (TREC-1). Полный текст материалов можно найти здесь.
  17. ^ Система Excalibur TREC-4, подготовка и результаты - PDF-версию можно найти здесь. Архивировано 27 ноября 2010 г. на Wayback Machine , а полный текст можно найти здесь.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8a1622840955f5d80f4e7d4ee5023702__1672792440
URL1:https://arc.ask3.ru/arc/aa/8a/02/8a1622840955f5d80f4e7d4ee5023702.html
Заголовок, (Title) документа по адресу, URL1:
RetrievalWare - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)