Поисковая посуда
Разработчик(и) | Быстрый поиск и передача , Convera , Excalibur Technologies, ConQuest Software, Microsoft |
---|---|
Стабильная версия | 8.2
/ 13 октября 2006 г. |
Написано в | С , С++ , Ява |
Операционная система | Кросс-платформенный |
Тип | Поиск и индексирование |
RetrivalWare — это корпоративная поисковая система, в которой основное внимание уделяется обработке естественного языка и семантическим сетям . Она была коммерчески доступна с 1992 по 2007 год и особенно известна тем, что ее использовали правительственные спецслужбы. [ 1 ]
История
[ редактировать ]Первоначально RetrivalWare был создан Полом Нельсоном. [ 2 ] Кеннет Кларк, [ 3 ] и Эдвин Аддисон [ 4 ] как часть программного обеспечения ConQuest. Разработка началась в 1989 году, но в широком масштабе программное обеспечение не было коммерчески доступно до 1992 года. Первоначальное финансирование было предоставлено Римской лабораторией в виде гранта на исследования инноваций в сфере малого бизнеса . [ 5 ]
6 июля 1995 года ConQuest Software была объединена с компанией Excalibur Technologies, принадлежащей NASDAQ. [ 6 ] и продукт был переименован в RetrivalWare. 21 декабря 2000 года Excalibur Technologies была объединена с подразделением Interactive Media Services корпорации Intel и образовала Convera Corporation . [ 7 ] Наконец, 9 апреля 2007 года программное обеспечение и бизнес RetrivalWare были приобретены компанией Fast Search & Transfer , после чего продукт был официально снят с производства. [ 8 ] Корпорация Microsoft продолжает поддерживать продукт для своей существующей клиентской базы.
Годовой доход RetrivalWare достиг своего пика в 2001 году и составил около 40 миллионов долларов США. [ 9 ]
Использование техник естественного языка
[ редактировать ]RetrivalWare — это система текстового поиска с ранжированием релевантности с усовершенствованиями обработки, взятыми из областей обработки естественного языка (NLP) и семантических сетей . на основе словаря Алгоритмы НЛП включают стемминг (также известный как лемматизация ) и идентификацию фраз на основе словаря. Семантические сети используются RetrivalWare для расширения слов запроса, введенных пользователем, до связанных терминов с весами терминов, определяемыми расстоянием от исходных терминов пользователя. Помимо автоматического расширения, был доступен режим обратной связи, в котором пользователи могли выбрать значение слова перед выполнением расширения. Первые семантические сети были построены с использованием WordNet .
Кроме того, в RetrivalWare реализована форма поиска n-грамм (под названием APRP — обработка адаптивного распознавания образов). [ 10 ] ), предназначенный для поиска документов с ошибками оптического распознавания символов . Термины запроса делятся на наборы по 2 грамма, которые используются для поиска одинаково совпадающих терминов из инвертированного индекса . Полученные совпадения взвешиваются на основе аналогичных показателей и затем используются для поиска документов.
Все эти функции были доступны не позднее 1993 года. [ 11 ] и программное обеспечение ConQuest заявило, что это первая коммерческая система текстового поиска, реализовавшая эти методы. [ 12 ]
Другие примечательные особенности
[ редактировать ]Другие примечательные особенности RetrivalWare включают распределенные поисковые серверы, [ 11 ] синхронизаторы для индексации внешних систем управления контентом и реляционных баз данных , [ 13 ] гетерогенная модель безопасности, [ 13 ] категоризация документов , [ 13 ] сопоставление документов с запросами в реальном времени (профилирование), [ 11 ] многоязычный поиск (запросы, содержащие термины на нескольких языках, поиск документов, содержащих термины на нескольких языках) и межъязыковый поиск (запросы на одном языке, поиск документов на другом языке). [ 14 ]
Участие в ТРЭК
[ редактировать ]Компания RetrivalWare участвовала в конференции по текстовому поиску в 1992 г. (TREC-1), 1993 г. (TREC-2) и 1995 г. (TREC-4). [ 15 ]
В ТРЭК-1 [ 16 ] и ТРЭК-4, [ 17 ] Запуск RetrivalWare для запросов, введенных вручную, дал наилучшие результаты на основе средних значений в 11 баллов по всем поисковым системам, которые участвовали в специальной категории, где поисковым системам предоставляется единственная возможность обрабатывать ранее неизвестные запросы к существующей базе данных.
Ссылки
[ редактировать ]- ^ Визе, Дэвид А. (3 декабря 2004 г.). «Агентства находят то, что ищут» . Вашингтон Пост . Проверено 22 мая 2010 г. [ мертвая ссылка ]
- ^ «Пол Нельсон, руководитель отдела инноваций, контент-аналитики в Accenture Analytics» . Проверено 1 декабря 2020 г.
- ^ «Арден и Кен» . comcast.net. 23 июля 2011 г. Архивировано из оригинала 23 июля 2011 г.
- ^ «Эд Аддисон, серийный предприниматель, венчурный капиталист, руководитель бизнеса, профессор» .
- ^ . Джон МакГрат присоединился к компании в 1993 году в качестве вице-президента по продажам и маркетингу. Компания быстро увеличила доходы от федеральных контрактов США, издателей и корпоративных клиентов, которым требовалась повышенная точность и производительность поиска текста. ЗАЯВКА СБИР ЗА 1991 ФГ - РЕЗЮМЕ НАГРАДЫ ФАЗЫ I - ПРОЕКТЫ ВВС - ТОМ III (PDF) , 6 июля 1992 г., стр. 70–71, заархивировано из оригинала (PDF) 4 июня 2011 г. - Обратите внимание, что «Синхронетика» было первоначальным названием ConQuest Software Incorporated.
- ^ «Excalibur Technologies объединяется с ConQuest Software; лидеры в области поиска текстовой и мультимедийной информации объединяют усилия для расширения продуктов, каналов и рынков» (пресс-релиз). Деловой провод. 06.07.1995.
- ^ «Intel и Excalibur образуют Convera Corporation» . Силиконовая долина / Бизнес-журнал Сан-Хосе. 21 декабря 2000 г.
- ^ «FAST приобретает бизнес Convera по поиску программного обеспечения» . Information Today, Inc., 9 апреля 2007 г.
Хотя FAST продолжит поддерживать платформу RetrivalWare, она не будет продолжать ее разработку или добавлять новые функции. Клиентам RetrivalWare будет предложен путь обновления до собственного предложения FAST.
- ^ Convera Corp · 10-K · На 01.01.01 , 01.01.2001 — указывает, что на продукцию Convera приходилось 85% общего дохода в 51,5 миллиона долларов.
- ^ Excalibur объявляет о выпуске Excalibur RetrivalWare 6.5 с RetrivalWare FileRoom - содержит описание APRP
- ^ Jump up to: а б с Отчет о конференции по текстовому поиску, организованной ConQuest Software Inc. (TREC2). Полный текст доклада можно найти здесь.
- ^ «Помощник по домашним заданиям дебютирует на Prodigy с использованием поисковой системы ConQuest» (пресс-релиз). Деловой провод. 9 февраля 1995 г.
ConQuest — единственная поисковая система, которая использует словари, тезаурусы и другие лексические ресурсы для создания семантической базы знаний, содержащей более 440 000 значений слов и 1,6 миллиона словесных связей.
- ^ Jump up to: а б с «Excalibur RetrivalWare: больше, чем просто поиск информации» . КММир. 01.10.1999.
- ^ «Мультимедийный поиск, извлечение, категоризация» . КММир. 25 марта 2002 г.
- ^ Фланк, Шэрон (1998). «Многоуровневый подход к поиску информации на основе НЛП» . Материалы 36-го ежегодного собрания Ассоциации компьютерной лингвистики . Том. 1. dl.acm.org. п. 397. дои : 10.3115/980845.980913 . S2CID 581537 . Проверено 1 декабря 2020 г.
- ^ Отчет о конференции по поиску текста, организованной ConQuest Software Inc. (TREC-1). Полный текст материалов можно найти здесь.
- ^ Система Excalibur TREC-4, подготовка и результаты - PDF-версию можно найти здесь. Архивировано 27 ноября 2010 г. на Wayback Machine , а полный текст можно найти здесь.