Jump to content

Джерард Солтон

(Перенаправлено с Джеральда Солтона )
Джерард Солтон
Рожденный
Герхард Антон Салманн

( 1927-03-08 ) 8 марта 1927 г.
Нюрнберг , Германия
Умер 28 августа 1995 г. ) ( 1995-08-28 ) ( 68 лет
Образование Бруклинский колледж
Гарвардский университет
Известный отец информационного поиска [ 2 ]
Премия Джерарда Солтона
Научная карьера
Поля поиск информации
Учреждения Корнелльский университет
Диссертация Автоматическая система обработки данных для учета доходов коммунальных предприятий   (1958 г.)
Докторантура Говард Эйкен
Докторанты

Джерард А. «Джерри» Солтон (8 марта 1927 – 28 августа 1995) был профессором компьютерных наук в Корнелльском университете . Солтон был, пожалуй, ведущим ученым-компьютерщиком, работавшим в области поиска информации в свое время, и «отцом поиска информации». [ 2 ] Его группа в Корнелле разработала систему информационного поиска SMART , которую он инициировал, когда учился в Гарварде . Это была самая первая система, использовавшая для поиска информации популярную сейчас модель векторного пространства .

Образование и карьера

[ редактировать ]

Солтон родился Герхард Антон Зальманн в Нюрнберге, Германия . Он приехал в Соединенные Штаты в 1947 году и был натурализован в 1952 году. Он получил степени бакалавра (1950 г.) и магистра (1952 г.) по математике в Бруклинском колледже , а также степень доктора философии. Он окончил Гарвард по прикладной математике в 1958 году, был последним из Говарда Эйкена докторантов и преподавал там до 1965 года, когда поступил в Корнелльский университет и стал соучредителем его факультета компьютерных наук.

Солтон был, пожалуй, наиболее известен благодаря разработке широко используемой сейчас модели векторного пространства для поиска информации. [ 3 ] В этой модели и документы, и запросы представлены как векторы количества терминов, а сходство между документом и запросом определяется косинусом между вектором термина и вектором документа. В этой статье он также представил TF-IDF , или частоту терминов, обратную частоте документа, модель, в которой оценка термина в документе представляет собой отношение количества терминов в этом документе к частоте встречаемости терминов. количество документов, в которых встречается этот термин. (Понятие обратной частоты документов, меры специфичности, было введено в 1972 году Карен Спарк-Джонс . [ 4 ] ) Позже в жизни он увлекся автоматическим обобщением и анализом текста, [ 5 ] а также автоматическое создание гипертекста. [ 6 ] За свою жизнь он опубликовал более 150 научных статей и 5 книг.

Почести и награды

[ редактировать ]

Солтон был главным редактором «Коммуникаций ACM» и «Журнала ACM» , а также возглавлял специальную группу по поиску информации (SIGIR). Он был заместителем редактора журнала ACM Transactions on Information Systems . Он был членом ACM (избран в 1995 г.), [ 7 ] получил Премию за заслуги перед Американским обществом информатики (1989 г.) и был первым лауреатом премии SIGIR за выдающийся вклад в изучение информационного поиска (1983 г.), которая теперь называется премией Джерарда Солтона .

Библиография

[ редактировать ]
  • Солтон, Автоматическая организация и поиск информации , 1968.
  • Джерард Солтон (1975). Теория индексации . Общество промышленной и прикладной математики. п. 56 . ISBN  9780898710151 .
  • --- и Майкл Дж. МакГилл, Введение в современный поиск информации , 1983. ISBN   0-07-054484-0
  • Джерард Солтон (1989). Автоматическая обработка текста . Издательство Аддисон-Уэсли. п. 530 . ISBN  978-0-201-12227-5 .
  • Джерард Солтон на DBLP библиографическом сервере Отредактируйте это в Викиданных
  • Г. Салтон, А. Вонг и К.С. Ян (1975), « Векторная пространственная модель для автоматического индексирования », Communications of the ACM , vol. 18, номер. 11, страницы 613–620. (Статья, в которой была представлена ​​модель векторного пространства)
  • Г. Солтон. (1980). «На пути к динамической библиотеке». В книге Ф. Уилфрида Ланкастера, под ред. « Роль библиотеки в электронном обществе: Клиника библиотечных приложений обработки данных». Урбана-Шампейн: Высшая школа библиотечного дела Университета Иллинойса.

См. также

[ редактировать ]
  1. ^ Алла, Джеймс. Автоматическое построение гипертекста . Корнеллский университет . Проверено 3 декабря 2023 г.
  2. ^ Jump up to: а б «Отец информационного поиска» (PDF) . cs.cornell.edu . Проверено 10 марта 2015 г. один из основателей отдела и отец информационного поиска.
  3. ^ Солтон, Дж .; Вонг, А.; Ян, CS (1975). «Модель векторного пространства для автоматического индексирования». Коммуникации АКМ . 18 (11): 613. дои : 10.1145/361219.361220 . hdl : 1813/6057 . S2CID   6473756 .
  4. ^ Сперк Джонс, К. (1972). «Статистическая интерпретация специфичности термина и ее применение в поиске». Журнал документации . 28 : 11–21. CiteSeerX   10.1.1.115.8343 . дои : 10.1108/eb026526 . S2CID   2996187 .
  5. ^ Солтон, Дж .; Аллан, Дж.; Бакли, К.; Сингхал, А. (1994). «Автоматический анализ, создание тем и обобщение машиночитаемых текстов». Наука . 264 (5164): 1421–1426. Бибкод : 1994Sci...264.1421S . дои : 10.1126/science.264.5164.1421 . ПМИД   17838425 . S2CID   32296317 .
  6. ^ «Джерард Солтон» . Cs.cornell.edu . Проверено 14 сентября 2013 г.
  7. ^ «Стипендиаты Джерарда Солтона ACM 1995» . acm.org . Проверено 10 марта 2015 г. вклад более 30 лет в организацию и поиск информации
[ редактировать ]
  • В памяти
  • Фракталы перемен: поиск в глубине памяти
  • «Самая влиятельная статья, которую Джерард Солтон никогда не писал». Дубин Д. Эта статья Дэвида Дубина «Тенденции в библиотеке» 2004 года (2004;52(4):748-764) служит историческим обзором метаморфозы модели значения дискриминации терминов (TDV) в модель векторного пространства как модель поиска информации. (VSM как IR-модель). Эта статья ставит под сомнение то, что, по мнению исследовательского сообщества в области информационного поиска, изначально предназначалось для моделирования модели векторного пространства Солтона. То, что намного позже стало моделью поиска информации, изначально было ориентированной на данные математико-вычислительной моделью, используемой в качестве объяснительного устройства. Кроме того, в статье Дубина указывается, что часто цитируемая статья Солтона 1975 года не существует, а, вероятно, представляет собой комбинацию двух других статей, ни одна из которых на самом деле не относится к VSM как к модели IR.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 76825ec35231fa6722138e432bc8737c__1712450760
URL1:https://arc.ask3.ru/arc/aa/76/7c/76825ec35231fa6722138e432bc8737c.html
Заголовок, (Title) документа по адресу, URL1:
Gerard Salton - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)