ГрафЛаб
Разработчик(и) | Университет Карнеги-Меллон |
---|---|
Стабильная версия | v2.2 / 1 июля 2013 г. |
Написано в | С++ |
Операционная система | Линукс , МакОС |
Тип | машинного обучения Платформа |
Лицензия | Собственный |
Веб-сайт | иметь |
Turi — это графов высокопроизводительная среда распределенных вычислений на основе , написанная на C++ . Проект GraphLab был начат профессором Карлосом Гестрином из Университета Карнеги-Меллон в 2009 году. Это проект с открытым исходным кодом , использующий лицензию Apache . Хотя GraphLab изначально разрабатывался для задач машинного обучения , он также был разработан для других задач интеллектуального анализа данных. [1] [2]
Мотивация
[ редактировать ]По мере роста объемов собираемых данных и вычислительной мощности (многоядерных, графических процессоров, кластеров, облаков) современные наборы данных больше не помещаются в один вычислительный узел. Требуются эффективные распределенные параллельные алгоритмы для обработки крупномасштабных данных. Платформа GraphLab — это абстракция параллельного программирования, предназначенная для алгоритмов разреженных итеративных графов. GraphLab предоставляет интерфейс программирования, позволяющий развертывать алгоритмы распределенного машинного обучения. [3] Основные соображения, лежащие в основе разработки GraphLab:
- Разреженные данные с локальными зависимостями
- Итерационные алгоритмы
- Потенциально асинхронное выполнение
Наборы инструментов GraphLab
[ редактировать ]Поверх GraphLab реализовано несколько библиотек алгоритмов:
- Тематическое моделирование — содержит такие приложения, как LDA , которые можно использовать для кластеризации документов и извлечения тематических представлений. [4]
- Аналитика графов — содержит такие приложения, как рейтинг страниц и подсчет треугольников, которые можно применять к общим графикам для оценки структуры сообщества . [5]
- Кластеризация — содержит стандартные инструменты кластеризации данных, такие как Kmeans. [6]
- Совместная фильтрация — содержит набор приложений, используемых для прогнозирования интересов пользователей и факторизации больших матриц . [7]
- Графические модели — содержат инструменты для совместного прогнозирования наборов связанных случайных величин. [8]
- Компьютерное зрение — содержит набор инструментов для рассуждений об изображениях. [9]
У вас есть
[ редактировать ]Turi (ранее называвшаяся Dato, а до этого GraphLab Inc.) — это компания, основанная профессором Карлосом Гостерином из Вашингтонского университета в мае 2013 года для продолжения поддержки разработки проекта с открытым исходным кодом GraphLab. Dato Inc. привлекла $6,75 млн серии A от Madrona Venture Group и New Enterprise Associates (NEA). Они привлекли $18,5 млн серии B от Vulcan Capital и Opus Capital при участии Madrona и NEA. [10] 5 августа 2016 года Тури была приобретена Apple Inc. за 200 000 000 долларов. [11] [12]
Ссылки
[ редактировать ]- ^ Джозеф Гонсалес, Ючэн Лоу, Хайджи Гу, Дэнни Биксон, Карлос Гестрин (2012). «PowerGraph: распределенные параллельные графовые вычисления на натуральных графах». Труды по проектированию и внедрению операционных систем (OSDI).
- ^ Юченг Лоу, Джозеф Гонсалес, Аапо Кирола, Дэнни Биксон, Карлос Гестрин и Джозеф М. Хеллерштейн (2012). «Распределенная GraphLab: платформа для машинного обучения и интеллектуального анализа данных в облаке». Труды очень больших баз данных (PVLDB).
- ^ Ю. Лоу, Дж. Гонсалес, А. Кирола, Д. Биксон, К. Гестрин и Дж. Хеллерстайн. GraphLab: новая платформа для параллельного машинного обучения. На 26-й конференции по неопределенности в искусственном интеллекте (UAI), остров Каталина, США, 2010 г.
- ^ «GraphLab: распределенный графически-параллельный API: тематическое моделирование» . Архивировано из оригинала 4 июня 2013 г. Проверено 14 мая 2013 г.
- ^ «GraphLab: API распределенного параллельного графа: аналитика графов» . Архивировано из оригинала 18 февраля 2013 г. Проверено 14 мая 2013 г.
- ^ «Библиотека кластеризации GraphLab» . Архивировано из оригинала 21 декабря 2016 г. Проверено 1 декабря 2016 г.
- ^ «GraphLab: библиотека совместной фильтрации с использованием методов матричной факторизации» . Архивировано из оригинала 20 декабря 2016 г. Проверено 1 декабря 2016 г.
- ^ «GraphLab: распределенный графически-параллельный API: графические модели» . Архивировано из оригинала 12 мая 2013 г. Проверено 14 мая 2013 г.
- ^ «GraphLab: распределенный графически-параллельный API: компьютерное зрение» . Архивировано из оригинала 23 января 2013 г. Проверено 14 мая 2013 г.
- ^ Гейдж, Дебора (08 января 2015 г.). «GraphLab, теперь Dato, привлекает 18,5 миллионов долларов на приложения машинного обучения» . Блоги WSJ . Проверено 11 апреля 2018 г.
- ^ Клевер, Джули. «Apple приобретает стартап по машинному обучению и искусственному интеллекту Turi» . Проверено 6 августа 2016 г.
- ^ «Эксклюзив: Apple приобретает Turi в рамках крупного проекта по продаже машинного обучения и искусственного интеллекта в Сиэтле» . 05.08.2016 . Проверено 6 августа 2016 г.