Джерард Солтон
Джерард Солтон | |
---|---|
Рожденный | Герхард Антон Салманн 8 марта 1927 г. Нюрнберг , Германия |
Умер | 28 августа 1995 г. Итака, Нью-Йорк , США | ( 68 лет
Образование | Бруклинский колледж Гарвардский университет |
Известный | отец информационного поиска [ 2 ] Премия Джерарда Солтона |
Научная карьера | |
Поля | поиск информации |
Учреждения | Корнелльский университет |
Диссертация | Автоматическая система обработки данных для учета доходов коммунальных предприятий (1958 г.) |
Докторантура | Говард Эйкен |
Докторанты |
Джерард А. «Джерри» Солтон (8 марта 1927 – 28 августа 1995) был профессором компьютерных наук в Корнелльском университете . Солтон был, пожалуй, ведущим ученым-компьютерщиком, работавшим в области поиска информации в свое время, и «отцом поиска информации». [ 2 ] Его группа в Корнелле разработала систему информационного поиска SMART , которую он инициировал, когда учился в Гарварде . Это была самая первая система, использовавшая для поиска информации популярную сейчас модель векторного пространства .
Образование и карьера
[ редактировать ]Солтон родился Герхард Антон Зальманн в Нюрнберге, Германия . Он приехал в Соединенные Штаты в 1947 году и был натурализован в 1952 году. Он получил степени бакалавра (1950 г.) и магистра (1952 г.) по математике в Бруклинском колледже , а также степень доктора философии. Он окончил Гарвард по прикладной математике в 1958 году, был последним из Говарда Эйкена докторантов и преподавал там до 1965 года, когда поступил в Корнелльский университет и стал соучредителем его факультета компьютерных наук.
Солтон был, пожалуй, наиболее известен благодаря разработке широко используемой сейчас модели векторного пространства для поиска информации. [ 3 ] В этой модели и документы, и запросы представлены как векторы количества терминов, а сходство между документом и запросом определяется косинусом между вектором термина и вектором документа. В этой статье он также представил TF-IDF , или частоту терминов, обратную частоте документа, модель, в которой оценка термина в документе представляет собой отношение количества терминов в этом документе к частоте встречаемости терминов. количество документов, в которых встречается этот термин. (Понятие обратной частоты документов, меры специфичности, было введено в 1972 году Карен Спарк-Джонс . [ 4 ] ) Позже в жизни он увлекся автоматическим обобщением и анализом текста, [ 5 ] а также автоматическое создание гипертекста. [ 6 ] За свою жизнь он опубликовал более 150 научных статей и 5 книг.
Почести и награды
[ редактировать ]Солтон был главным редактором «Коммуникаций ACM» и «Журнала ACM» , а также возглавлял специальную группу по поиску информации (SIGIR). Он был заместителем редактора журнала ACM Transactions on Information Systems . Он был членом ACM (избран в 1995 г.), [ 7 ] получил Премию за заслуги перед Американским обществом информатики (1989 г.) и был первым лауреатом премии SIGIR за выдающийся вклад в изучение информационного поиска (1983 г.), которая теперь называется премией Джерарда Солтона .
Библиография
[ редактировать ]- Солтон, Автоматическая организация и поиск информации , 1968.
- Джерард Солтон (1975). Теория индексации . Общество промышленной и прикладной математики. п. 56 . ISBN 9780898710151 .
- --- и Майкл Дж. МакГилл, Введение в современный поиск информации , 1983. ISBN 0-07-054484-0
- Джерард Солтон (1989). Автоматическая обработка текста . Издательство Аддисон-Уэсли. п. 530 . ISBN 978-0-201-12227-5 .
- Джерард Солтон на DBLP библиографическом сервере
- Г. Салтон, А. Вонг и К.С. Ян (1975), « Векторная пространственная модель для автоматического индексирования », Communications of the ACM , vol. 18, номер. 11, страницы 613–620. (Статья, в которой была представлена модель векторного пространства)
- Г. Солтон. (1980). «На пути к динамической библиотеке». В книге Ф. Уилфрида Ланкастера, под ред. « Роль библиотеки в электронном обществе: Клиника библиотечных приложений обработки данных». Урбана-Шампейн: Высшая школа библиотечного дела Университета Иллинойса.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Алла, Джеймс. Автоматическое построение гипертекста . Корнеллский университет . Проверено 3 декабря 2023 г.
- ^ Jump up to: а б «Отец информационного поиска» (PDF) . cs.cornell.edu . Проверено 10 марта 2015 г.
один из основателей отдела и отец информационного поиска.
- ^ Солтон, Дж .; Вонг, А.; Ян, CS (1975). «Модель векторного пространства для автоматического индексирования». Коммуникации АКМ . 18 (11): 613. дои : 10.1145/361219.361220 . hdl : 1813/6057 . S2CID 6473756 .
- ^ Сперк Джонс, К. (1972). «Статистическая интерпретация специфичности термина и ее применение в поиске». Журнал документации . 28 : 11–21. CiteSeerX 10.1.1.115.8343 . дои : 10.1108/eb026526 . S2CID 2996187 .
- ^ Солтон, Дж .; Аллан, Дж.; Бакли, К.; Сингхал, А. (1994). «Автоматический анализ, создание тем и обобщение машиночитаемых текстов». Наука . 264 (5164): 1421–1426. Бибкод : 1994Sci...264.1421S . дои : 10.1126/science.264.5164.1421 . ПМИД 17838425 . S2CID 32296317 .
- ^ «Джерард Солтон» . Cs.cornell.edu . Проверено 14 сентября 2013 г.
- ^ «Стипендиаты Джерарда Солтона ACM 1995» . acm.org . Проверено 10 марта 2015 г.
вклад более 30 лет в организацию и поиск информации
Внешние ссылки
[ редактировать ]- В памяти
- Фракталы перемен: поиск в глубине памяти
- «Самая влиятельная статья, которую Джерард Солтон никогда не писал». Дубин Д. Эта статья Дэвида Дубина «Тенденции в библиотеке» 2004 года (2004;52(4):748-764) служит историческим обзором метаморфозы модели значения дискриминации терминов (TDV) в модель векторного пространства как модель поиска информации. (VSM как IR-модель). Эта статья ставит под сомнение то, что, по мнению исследовательского сообщества в области информационного поиска, изначально предназначалось для моделирования модели векторного пространства Солтона. То, что намного позже стало моделью поиска информации, изначально было ориентированной на данные математико-вычислительной моделью, используемой в качестве объяснительного устройства. Кроме того, в статье Дубина указывается, что часто цитируемая статья Солтона 1975 года не существует, а, вероятно, представляет собой комбинацию двух других статей, ни одна из которых на самом деле не относится к VSM как к модели IR.
- 1927 рождений
- 1995 смертей
- Американские ученые-компьютерщики
- Выпускники Гарвардской школы инженерии и прикладных наук имени Джона А. Полсона
- Преподаватели Гарвардского университета
- Преподаватели Корнеллского университета
- 1995 г. Члены Ассоциации вычислительной техники.
- Исследователи информационного поиска
- Выпускники Бруклинского колледжа
- Ученые из Нюрнберга
- Смертность от рака легких в Нью-Йорке (штат)