Jump to content

Апач-махут

Апач-махут
Разработчик(и) Фонд программного обеспечения Apache
Первоначальный выпуск 7 апреля 2009 г .; 15 лет назад ( 07.04.2009 ) [1]
Стабильная версия
14.1 / 7 октября 2020 г .; 3 года назад ( 07.10.2020 ) [2]
Репозиторий Репозиторий Махут
Написано в Ява , Скала
Операционная система Кросс-платформенный
Тип Машинное обучение
Лицензия Лицензия Апач 2.0
Веб-сайт погонщик .apache .org

Apache Mahout — это проект Apache Software Foundation по созданию бесплатных реализаций распределенных или иным образом масштабируемых алгоритмов машинного обучения , ориентированных в первую очередь на линейную алгебру . В прошлом многие реализации использовали платформу Apache Hadoop , однако сегодня она ориентирована в первую очередь на Apache Spark . [3] [4] Mahout также предоставляет библиотеки Java/Scala для распространенных математических операций (с упором на линейную алгебру и статистику) и примитивные коллекции Java. Mahout находится в стадии разработки; реализован ряд алгоритмов. [5]

Особенности [ править ]

Самсара [ править ]

Apache Mahout-Samsara относится к доменно-ориентированному языку Scala (DSL), который позволяет пользователям использовать синтаксис R-подобного типа в отличие от традиционного синтаксиса, подобного Scala. Это позволяет пользователю кратко и ясно выражать алгоритмы.

val G = B %*% B.t - C - C.t + (ksi dot ksi) * (s_q cross s_q)

Backend-агностик [ править ]

Код Apache Mahout абстрагирует язык предметной области от движка, на котором выполняется код. Хотя активная разработка ведется с использованием движка Apache Spark, пользователи могут реализовать любой движок по своему выбору: H2O и Apache Flink были реализованы в прошлом, и примеры существуют в базе кода.

Ускорители GPU/CPU [ править ]

JVM имеет общеизвестно медленные вычисления. Для повышения скорости были добавлены «родные решатели», которые перемещают внутриядерные и, как следствие, распределенные операции BLAS из JVM, выгружая их в память вне кучи или в память графического процессора для обработки с помощью нескольких процессоров и/или ядер процессора или графических процессоров, когда построен на базе библиотеки ViennaCL. [6] «Распространение Mahout Samsara на кластеры графических процессоров» . Архивировано из оригинала 3 ноября 2020 года . Проверено 29 октября 2020 г. . ViennaCL — это высокооптимизированная библиотека C++ с операциями BLAS, реализованными в OpenMP и OpenCL. Начиная с версии 14.1, сборка OpenMP считается стабильной, а сборка OpenCL все еще находится на экспериментальной стадии POC.

Рекомендатели [ править ]

Apache Mahout включает реализации чередующихся наименьших квадратов, совместного появления и коррелированного совместного появления, уникального рекомендательного алгоритма Mahout, который расширяет возможности совместного возникновения для использования в нескольких измерениях данных.

История [ править ]

Переход от Map Reduc к Apache Spark [ править ]

Хотя основные алгоритмы Mahout для кластеризации , классификации и пакетной совместной фильтрации были реализованы поверх Apache Hadoop с использованием парадигмы сопоставления/сокращения , это не ограничивало вклад в реализации на основе Hadoop. Также приветствовались вклады, работающие на одном узле или в кластере, отличном от Hadoop. Например, рекомендательный компонент Mahout для совместной фильтрации «Taste» изначально был отдельным проектом и мог работать автономно без Hadoop.

Начиная с версии 0.10.0, проект сместил акцент на создание независимой от серверной части среды программирования под кодовым названием «Самсара». [7] [8] [9] Среда состоит из алгебраического оптимизатора, независимого от серверной части, и алгебраического Scala DSL, объединяющего алгебраические операторы в памяти и распределенные алгебраические операторы. Поддерживаемые алгебраические платформы — Apache Spark , H2O и Apache Flink . [ нужна ссылка ] Поддержка алгоритмов MapReduce начала постепенно прекращаться в 2014 году. [10]

История выпусков [ править ]

История выпусков
Версия Дата выпуска Примечания
0.1 2009-04-07
0.2 2009-11-18
0.3 2010-03-17
0.4 2010-10-31
0.5 2011-05-27
0.6 2012-02-06
0.7 2012-05-16
0.8 2013-07-25
0.9 2014-02-01
0.10.0 2015-04-11 Самсара DSL
0.10.1 2015-05-31
0.10.2 2015-08-06
0.11.0 2015-08-07
0.11.1 2015-11-06
0.11.2 2016-03-11
0.12.0 2016-04-11 Добавлен движок Apache Flink.
0.12.1 2016-05-19
0.12.2 2016-06-13
0.13.0 2017-04-17
0.14.0 2019-03-07 Только исходный код (без двоичных файлов)
14.1 2020-10-07

Разработчики [ править ]

Apache Mahout разработан сообществом. Проектом управляет группа под названием «Комитет по управлению проектом» (PMC). Нынешний ЧВК - Эндрю Массельман, Эндрю Палумбо, Дрю Фаррис, Изабель Дрост-Фромм, Джейк Мэнникс, Пэт Феррел, Паритош Ранджан, Тревор Грант, Робин Анил, Себастьян Шелтер, Стево Славич. [11]

Ссылки [ править ]

  1. ^ «Apache Mahout: выпущен первый выпуск 0.1» .
  2. ^ «Apache Mahout: масштабируемое машинное обучение и интеллектуальный анализ данных» . Проверено 6 марта 2019 г.
  3. ^ «Представляем Apache Mahout» . IBM.com . 2011 . Проверено 13 сентября 2011 г.
  4. ^ «InfoQ: Apache Mahout: высокомасштабируемые алгоритмы машинного обучения» . infoq.com . 2011 . Проверено 13 сентября 2011 г.
  5. ^ «Алгоритмы — Apache Mahout — Apache Software Foundation» . cwiki.apache.org . 2011. Архивировано из оригинала 22 декабря 2013 года . Проверено 13 сентября 2011 г.
  6. ^ «ВенаCL» .
  7. ^ «Справочник по DSL встроенной линейной алгебры Махут-Самсары» . Архивировано из оригинала 2 августа 2016 года . Проверено 29 февраля 2016 г.
  8. ^ «Справочник по DSL по распределенной линейной алгебре Махут-Самсары» . Архивировано из оригинала 2 августа 2016 года . Проверено 29 февраля 2016 г.
  9. ^ «Mahout 0.10.x: первый выпуск Mahout как среды программирования» . www.weatheringthroughtechdays.com . Архивировано из оригинала 9 октября 2016 года . Проверено 29 февраля 2016 г.
  10. ^ «MAHOUT-1510 («Прощай MapReduce»)» .
  11. ^ «Информация о комитете Apache» .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 8c06fd02bfb4d364d9eae89b8c2d9c69__1693815240
URL1:https://arc.ask3.ru/arc/aa/8c/69/8c06fd02bfb4d364d9eae89b8c2d9c69.html
Заголовок, (Title) документа по адресу, URL1:
Apache Mahout - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)