Даг Каттинг
![]() | Тон или стиль этой статьи могут не отражать энциклопедический тон , используемый в Википедии . ( февраль 2012 г. ) |
Даг Каттинг | |
---|---|
Даг Каттинг | |
Известный | Программное обеспечение с открытым исходным кодом , The Apache Software Foundation |
Награды | Премия О'Рейли за открытый исходный код |
Дуглас Рид Каттинг — разработчик программного обеспечения , сторонник и создатель с открытым исходным кодом технологии поиска он основал два технологических проекта, Lucene и Nutch . Вместе с Майком Кафареллой . Apache Software Foundation теперь управляет обоими проектами. Каттинг и Кафарелла также были сооснователями Apache Hadoop . [1]
Образование и ранняя карьера
[ редактировать ]Каттинг окончил Стэнфордский университет в 1985 году со степенью бакалавра . [2] [3]
До разработки Lucene Каттинг занимал должности в сфере поисковых технологий в Xerox PARC , где работал над алгоритмом Scatter/Gather. [4] [5] и по вычислительной стилистике . [6] Он также работал в Excite , где был одним из главных дизайнеров поисковой системы , и в Apple Inc. , где был основным автором системы текстового поиска V-Twin . [7]
Проекты с открытым исходным кодом
[ редактировать ]Lucene, поисковый индексатор , и Nutch, паук или сканер , являются двумя ключевыми компонентами общей поисковой платформы с открытым исходным кодом , которая сначала сканирует Интернет в поисках контента, а затем структурирует его в индекс с возможностью поиска. Руководство Каттингом этих двух проектов расширило концепции и возможности общих проектов программного обеспечения с открытым исходным кодом, таких как Linux и MySQL, в вертикальную область поиска. [8] В статье 2017 года Каттинг цитировал заявление: «Открытый исходный код является требованием для бизнеса». [9]
Использование парадигмы MapReduce
[ редактировать ]В декабре 2004 года исследовательский центр Google опубликовал статью об алгоритме MapReduce , который позволяет тривиально распараллеливать очень крупномасштабные вычисления на больших кластерах серверов. Каттинг и Майк Кафарелла, понимая важность этой статьи для расширения возможностей Lucene в области чрезвычайно крупных задач поиска, создали среду Hadoop с открытым исходным кодом. Эта платформа позволяет запускать приложения, основанные на парадигме MapReduce, на больших кластерах стандартного оборудования. Каттинг был сотрудником Yahoo! , где он постоянно руководил проектом Hadoop; Позже он продолжил работать в Cloudera . [10]
Фонды и награды с открытым исходным кодом
[ редактировать ]В июле 2009 года Каттинг был избран в совет директоров Apache Software Foundation , а в сентябре 2010 года избран председателем. [11]
В 2015 году Каттинг был удостоен премии O’Reilly Open Source Award . [12]
Ссылки
[ редактировать ]- ^ Каттинг, Майк Кафарелла, Бен Лорика, Дуг (31 марта 2016 г.). «Следующие 10 лет Apache Hadoop» . О'Рейли Медиа . Проверено 16 апреля 2018 г.
{{cite news}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ «Даг Каттинг — отец мира поиска и кодирования» . www.codetd.com . Проверено 18 мая 2022 г.
- ^ «Команда управления Cloudera» . Клаудера . Проверено 17 августа 2016 г.
- ^ Каттинг, Дуглас Р., Дэвид Р. Каргер, Ян О. Педерсен и Джон В. Тьюки. «Разброс/сбор: кластерный подход к просмотру больших коллекций документов». SIGIR '92 Материалы 15-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области поиска информации. (Перепечатано в ACM SIGIR Forum, том 51, № 2, стр. 148-159. ACM, 2017.)
- ^ Педерсен, Ян О., Дэвид Каргер, Дуглас Р. Каттинг и Джон В. Тьюки. «Разброс-сбор: кластерный метод и устройство для просмотра больших коллекций документов». Патент США № 5442778, выданный 15 августа 1995 г.
- ^ Карлгрен, Юсси ; Каттинг, Дуглас. «Распознавание текстовых жанров с помощью простых показателей с использованием дискриминантного анализа». . Материалы 15-й конференции по компьютерной лингвистике. Том 2. Ассоциация компьютерной лингвистики, 1994.
- ^ «Поисковая система Lucene: мощная, гибкая и бесплатная» . JavaWorld (опубликовано 15 сентября 2000 г.). 15 сентября 2000 года . Проверено 25 января 2017 г.
Каттинг является основным автором поисковой системы V-Twin (часть разработки операционной системы Apple Copland)…
- ^ «Arc.Ask3.Ru: Работает на Lucene» . Люсене . Проверено 5 сентября 2007 г.
- ^ «Даг Каттинг, «отец» Hadoop, рассказывает об эволюции технологий больших данных» . ComputerWeekly.com . Проверено 26 июня 2018 г.
- ^ Хэнди, Алекс (10 августа 2009 г.). «Создатель Hadoop переходит в Cloudera» . Время разработки программного обеспечения. Архивировано из оригинала 13 марта 2012 года . Проверено 22 марта 2011 г.
- ^ Салли (15 июля 2010 г.). «Фонд программного обеспечения Apache объявляет новых членов правления» . Блог Apache Software Foundation . Проверено 2 мая 2023 г.
- ^ «Награды O'Reilly Open Source Awards — OSCON 2015» . Ютуб . О'Рейли. Архивировано из оригинала 14 декабря 2021 г. Проверено 27 июля 2015 г.
Статьи
[ редактировать ]- Сообщение в блоге Тома Уайта о создании Дугом Каттингом Hadoop Обратите внимание, что этот пост был написан в то время, когда Hadoop все еще был неназванным дочерним продуктом Nutch . Том обновляет свой предыдущий пост, указав Hadoop имя здесь .
- Статья, написанная в соавторстве с Дугом Каттингом в ACM Queue, «Building Nutch: Поиск с открытым исходным кодом»