Мартин Портер
Мартин Ф. Портер — изобретатель Портера Стеммера . [1] один из наиболее распространенных алгоритмов стемминга английского языка, [2] [3] и среда программирования Snowball . Его статья 1980 года «Алгоритм удаления суффиксов», в которой предлагается алгоритм стемминга, цитировалась более 8000 раз (Google Scholar). [4]
Поисковая система Маската возникла в результате исследования, проведенного Портером в Кембриджском университете , и была коммерциализирована в 1984 году компанией Cambridge CD Publishing; впоследствии он был продан компании MAID, которая стала Dialog Corporation . [5] Затем в 2000 году часть Dialog была выделена в BrightStation . [6] [7] который перевел Open Muscat на модель разработки с закрытым исходным кодом в 2001 году. [8] Впоследствии группа разработчиков под руководством Портера [9] инициировал проект на основе Open Muscat под названием Xapian и выпустил первую официальную версию 30 сентября 2002 года. [10]
В 2000 году он был удостоен премии Тони Кента Стрикса . [11]
Портер изучал математику в колледже Святого Иоанна в Кембридже (1963–66) и получил диплом в области компьютерных наук (1967) и докторскую степень. в Кембриджской компьютерной лаборатории . Он проработал в Университете Лидса год , а затем вернулся в Кембриджский литературно-лингвистический вычислительный центр (1971–1974) и в Музей Седжвика в качестве программиста (1974–1976). В 1977 году он стал директором Консультативного отдела музейной документации (MDA). [12]
Мартин Портер вместе с Джоном Снайдером является соучредителем компании Grapeshot, занимающейся контекстным таргетингом и рекомендациями контента. [13] Джон Снайдер указан в качестве генерального директора, а Мартин Портер указан в качестве главного научного сотрудника. Grapeshot получила 250 000 фунтов стерлингов в виде субсидий правительства Великобритании и впоследствии привлекла 16 миллионов фунтов стерлингов от британских инвесторов. [14] 15 мая 2018 г. корпорация Oracle завершила приобретение Grapeshot.
Ссылки
[ редактировать ]- ^ Алгоритм стемминга Портера
- ^ Кристофер Д. Мэннинг, Прабхакар Рагхаван и Хинрих Шютце (2008). Введение в поиск информации . Издательство Кембриджского университета .
- ^ Дэниел Джурафски и Джеймс Х. Мартин (2009). Речевая и языковая обработка . Пирсон, с. 102.
- ^ Статьи в Google Scholar, по состоянию на 9 февраля 2012 г.
- ^ Ави Раппопорт, консалтинг по инструментам поиска. «Smartlogik Discover (APR) — отчет SearchTools» . Searchtools.com . Проверено 9 февраля 2012 г.
- ^ Роб Бакли (март 2001 г.). «Байесовская дымка» . инфоэкономика . Проверено 10 апреля 2022 г.
- ^ Пол Фаррелли (23 сентября 2000 г.). «Яркое в конце туннеля» . Хранитель . Проверено 10 апреля 2022 г.
- ^ «Проект Xapian: История» . Проверено 10 апреля 2022 г.
- ^ Портер, Мартин (30 марта 2006 г.). «Возвращение к Ловинсу». В Тейт, Джон (ред.). Намечая новый курс: обработка естественного языка и поиск информации: Очерки в честь Карен Сперк Джонс . Амстердам: Kluwer: Springer Science & Business Media. п. 61. ИСБН 9781402034671 .
- ^ «НОВОСТИ Xapian Core» . Проверено 10 апреля 2022 г.
- ^ UKeiIG Премия Тони Кента Стрикса. Архивировано 25 сентября 2014 г. в Wayback Machine (по состоянию на февраль 2012 г.).
- ^ Музей , Том XXX, № 3/4, 1978, Музеи и компьютеры , стр.224.
- ^ Картечка (по состоянию на октябрь 2012 г.)
- ^ [1] Парламентский обзор 2018 г. - Картечь