IBM Веб-фонтан
WebFountain — интернет -аналитическая система , реализованная IBM для исследования неструктурированных данных во Всемирной паутине . IBM описывает WebFountain как:
. . . набор исследовательских технологий, которые собирают, хранят и анализируют огромные объемы неструктурированного и полуструктурированного текста. Он построен на открытой расширяемой платформе, которая позволяет выявлять тенденции, закономерности и взаимосвязи на основе данных. [ 1 ]
Этот проект представляет собой одну из первых комплексных попыток каталогизировать и интерпретировать неструктурированные данные непрерывно Интернета. С этой целью поддерживающие его исследователи из IBM исследовали новые системы для точного поиска подмножеств информации в Интернете, анализа тенденций в реальном времени и анализа метауровня доступной информации в Интернете.
Factiva , компания по поиску информации, принадлежащая Dow Jones и Reuters , лицензировала WebFountain в сентябре 2003 года и занимается созданием программного обеспечения, использующего движок WebFountain для оценки корпоративной репутации. [ 2 ] Сообщается, что Factiva предлагает годовую подписку на сервис за 200 000 долларов. С тех пор Factiva решила изучить другие технологии и разорвала отношения с WebFountain.
WebFountain разработан в исследовательском кампусе IBM Альмадене в районе залива Калифорнии в .
IBM разработала программное обеспечение под названием UIMA (архитектура управления неструктурированной информацией), которое можно использовать для анализа неструктурированной информации. Возможно, это поможет выполнить анализ тенденций в документах, определить тему и суть документов, обеспечить нечеткий поиск в неструктурированных документах. [ 3 ]
Ссылки
[ редактировать ]- ^ Красные книги IBM | Обзор IBM WebFountain и WebFountain Appliance. Архивировано 27 октября 2011 г. на Wayback Machine.
- ^ IBM намеревается разобраться в новостях Web-CNET . News.cnet.com. Проверено 18 октября 2010 г.
- ^ IBM Open Sources WebFountain (UIMA). Архивировано 7 июля 2011 г. на Wayback Machine . IBM Open Sources WebFountain (UIMA) — программное обеспечение для анализа неструктурированного текста.
Внешние ссылки
[ редактировать ]- исследовательского центра IBM Almaden Обзор WebFountain
- WebFountain в поисковом блоге Джона Баттела
- Статья в Зднете "Питье из пожарного гидранта"
- Статья Cnet на archive.today (заархивировано 21 июля 2012 г.) IBM намеревается разобраться в Интернете, 5 февраля 2004 г.
- IBM присоединяется к пространству корпоративного мониторинга, выпустив решение для мониторинга общедоступных изображений , Search Engine Watch, 9 ноября 2005 г.