Jump to content

Блоки данных

(Перенаправлено с Mosaic ML )

Датабрикс, Инк.
Тип компании Частный
Промышленность Компьютерное программное обеспечение
Основан 2013 год ; 11 лет назад ( 2013 )
Основатели
Штаб-квартира ,
Соединенные Штаты
Ключевые люди
  • Или Годси
  • (ГЕНЕРАЛЬНЫЙ ДИРЕКТОР)
  • Ион Стойка
  • (Исполнительный председатель)
Доход Увеличивать 1,6 миллиарда долларов (2023 г.) [1]
Количество сотрудников
в. 5500 (2023) [2]
Веб-сайт блоки данных

Databricks, Inc. — глобальная компания по обработке данных, аналитики и искусственного интеллекта, основанная создателями Apache Spark . [3]

Компания предоставляет облачную платформу, которая помогает предприятиям создавать, масштабировать и управлять данными и искусственным интеллектом, включая генеративный искусственный интеллект и другие машинного обучения . модели [4]

Компания Databricks стала пионером в создании Data Lakehouse — платформы данных и искусственного интеллекта, которая сочетает в себе возможности хранилища данных с озером данных, позволяя организациям управлять и использовать как структурированные, так и неструктурированные данные для традиционной бизнес-аналитики и рабочих нагрузок искусственного интеллекта. [5]

Databricks приобрела MosaicML за 1,4 миллиарда долларов в июне 2023 года, что стало ее крупнейшим приобретением. [6]

В ноябре 2023 года Databricks представила Databricks Data Intelligence Platform — новое предложение, которое сочетает в себе преимущества объединения Lakehouse с технологией генеративного искусственного интеллекта MosaicML, позволяющей клиентам лучше понимать и использовать свои собственные данные. [7]

Компания разрабатывает Delta Lake — проект с открытым исходным кодом, призванный повысить надежность озер данных для машинного обучения и других случаев использования в области науки о данных. [8]

Стенд Databricks

Databricks вырос из проекта AMPLab в Калифорнийском университете в Беркли, который участвовал в создании Apache Spark , среды распределенных вычислений с открытым исходным кодом, построенной на основе Scala . Компанию основали Али Годси , Энди Конвински , Арсалан Таваколи-Шираджи , Ион Стойка , Матей Захария , [9] Патрик Венделл и Рейнольд Синь .

В ноябре 2017 года компания была объявлена ​​​​собственной службой Microsoft Azure посредством интеграции Azure Databricks. [10]

В июне 2020 года Databricks приобрела Redash, инструмент с открытым исходным кодом, призванный помочь ученым и аналитикам данных визуализировать и создавать интерактивные информационные панели своих данных. [11]

В феврале 2021 года совместно с Google Cloud Databricks обеспечила интеграцию с Google Kubernetes Google BigQuery . Engine и платформой [12] Fortune назвал Databricks одним из лучших крупных «рабочих мест для миллениалов» в 2021 году. [13] На тот момент компания заявила, что ее продуктами пользуются более 5000 организаций. [14]

В августе 2021 года Databricks завершила восьмой раунд финансирования, собрав 1,6 миллиарда долларов и оценив компанию в 38 миллиардов долларов. [15]

В октябре 2021 года Databricks совершила второе приобретение немецкой компании 8080 Labs, не занимающейся кодированием . 8080 Labs создает бамбуклиб — инструмент для исследования данных, для использования которого не требуется программирование. [16]

В ответ на популярность в ChatGPT OpenAI овцы марте 2023 года компания представила языковую модель с открытым исходным кодом , названную Dolly в честь Долли , которую разработчики могли использовать для создания своих собственных чат-ботов . Их модель использует меньше параметров для получения результатов, аналогичных ChatGPT, но Databricks не выпустила официальных тестов производительности, чтобы показать, действительно ли ее бот соответствует производительности ChatGPT. [17] [18] [19]

Databricks приобрела стартап Okera, занимающийся безопасностью данных, в мае 2023 года, чтобы расширить свои возможности управления данными. [20] В следующем месяце компания приобрела стартап MosaicML с открытым исходным кодом, занимающийся генеративным искусственным интеллектом, за 1,4   миллиарда долларов. [21] [22]

В октябре 2023 года Databricks приобрела стартап по репликации данных Arcion за 100 миллионов долларов. [23]

Databricks сообщила о выручке в 1,6 миллиарда долларов за 2023 финансовый год, что более чем вдвое превышает предыдущий уровень. [24]

Финансирование

[ редактировать ]

В сентябре 2013 года Databricks объявила, что привлекла 13,9 миллиона долларов от Андреессена Горовица и заявила, что намерена предложить альтернативу системе Google MapReduce . [25] [26] Microsoft была известным инвестором Databricks в 2019 году, участвуя в серии E компании в неустановленной сумме. [27] [28] Компания привлекла финансирование в размере 1,9 миллиарда долларов, в том числе серию G в размере 1 миллиарда долларов под руководством Франклина Темплтона с оценкой после инвестирования в 28 миллиардов долларов в феврале 2021 года. Среди других инвесторов - Amazon Web Services , CapitalG (растущая инвестиционная компания под управлением Alphabet Inc. ) и Salesforce Ventures . [14]

Раунды финансирования
Ряд Дата Сумма (млн $) Ведущие инвесторы
А 2013 13.9 [25] Андреессен Горовиц
Б 2014 33 [29] Новые корпоративные партнеры
С 2016 60 [30] Новые корпоративные партнеры
Д 2017 140 [31] Андреессен Горовиц
И февраль 2019 г. 250 [32] Андреессен Горовиц
Ф Октябрь 2019 г. 400 [33] Андреессен Горовиц
Г Январь 2021 г. 1,000 [34] Франклин Темплтон Инвестментс
ЧАС август 2021 г. 1,600 [35] Морган Стэнли
я Сентябрь 2023 г. 500 [36] Capital One Ventures, NVIDIA

Продукты

[ редактировать ]

Databricks разрабатывает и продает облачную платформу данных, используя маркетинговый термин «дом озера», который представляет собой сумку, основанную на терминах « хранилище данных » и « озеро данных ». [37] Lakehouse Databricks основан на платформе Apache Spark с открытым исходным кодом , которая позволяет выполнять аналитические запросы к полуструктурированным данным без традиционной схемы базы данных . [38] В октябре 2022 года Lakehouse получила статус авторизованного FedRAMP для использования федеральным правительством США и подрядчиками. [39]

Delta Engine от Databricks был запущен в июне 2020 года как новый механизм запросов, который накладывается поверх Delta Lake для повышения производительности запросов. [40] Он совместим с Apache Spark и MLflow, которые также являются проектами с открытым исходным кодом, в создании которых участвовали сотрудники Databricks. [41]

В ноябре 2020 года Databricks представила Databricks SQL (ранее известный как SQL Analytics) для создания бизнес-аналитики и аналитических отчетов поверх озер данных. Аналитики могут запрашивать наборы данных напрямую с помощью стандартного SQL или использовать коннекторы продуктов для прямой интеграции с инструментами бизнес-аналитики, такими как Holistics , Tableau , Qlik , SigmaComputing , Looker и ThoughtSpot . [42]

Databricks предлагает платформу для других рабочих нагрузок, включая машинное обучение, хранение и обработку данных, потоковую аналитику и бизнес-аналитику. [43]

Компания также создала Delta Lake, MLflow и Koalas — проекты с открытым исходным кодом , которые охватывают инженерию данных , науку о данных и машинное обучение . [44] [45] Помимо создания платформы Databricks, компания стала соорганизатором массовых открытых онлайн-курсов по Spark. [46] и конференция для сообщества Spark под названием Data + AI Summit, [47] ранее известный как Spark Summit.

В начале 2024 года Databricks выпустила портфель новых инструментов, которые помогут клиентам настраивать, точно настраивать или создавать собственные системы искусственного интеллекта, в том числе: Mosaic AI Vector Search, который позволяет компаниям создавать модели RAG, Mosaic AI Model Serving, единый сервис для развертывание, управление, запрос и мониторинг моделей, точно настроенных или предварительно развернутых с помощью Databricks, а также Mosaic AI Pretraining, платформы, позволяющей предприятиям создавать свои собственные LLM. [48]

В марте 2024 года Databricks выпустила DBRX, модель фонда с открытым исходным кодом. Он основан на архитектуре, состоящей из нескольких экспертов, и построен на проекте с открытым исходным кодом MegaBlocks. [49]

Создание DBRX обошлось в 10 миллионов долларов. На момент запуска это был самый быстрый LLM с открытым исходным кодом, основанный на широко используемых отраслевых тестах. Он превосходил другие модели, такие как LlaMA2, в решении логических головоломок и ответах на вопросы общего характера, а также в других задачах. И хотя это модель со 136 миллиардами параметров, для генерации результатов она использует в среднем только 36 миллиардов. [50]

DBRX также служит основой для компаний, позволяющих создавать или настраивать свои собственные модели искусственного интеллекта. Компании также могут использовать собственные данные для получения более качественных результатов для конкретных случаев использования. [51]

Операции

[ редактировать ]

Штаб-квартира Databricks находится в Сан-Франциско . [52] Компания также имеет представительства в Канаде , Великобритании , Нидерландах , Сингапуре , Австралии , Германии , Франции , Японии , Китае , Южной Корее , Индии , Бразилии , Швейцарии , Коста-Рике и Сербии . [53]

  1. ^ Лин, Белль (6 марта 2024 г.). «ИИ обеспечивает рекордные продажи Databricks стоимостью в несколько миллиардов долларов. IPO может подождать…» . Уолл Стрит Джорнал . Архивировано из оригинала 6 марта 2024 года.
  2. ^ Корри, Дрибуш (29 июля 2023 г.). «Технологический директор, который пользуется своим телефоном по старинке» . Уолл Стрит Джорнал . Архивировано из оригинала 28 февраля 2024 года.
  3. ^ Саул, Дерек (14 сентября 2023 г.). «Компания Databricks с ведущими перспективами IPO получила оценку в 43 миллиарда долларов благодаря раунду финансирования в 500 миллионов долларов, включая AI Titan Nvidia» . Форбс . Проверено 26 марта 2024 г.
  4. ^ Салливан, Марк (19 марта 2024 г.). «Как Databricks помогает клиентам разрабатывать собственные модели искусственного интеллекта» . Компания Фаст . Проверено 19 марта 2024 г.
  5. ^ Кларк, Линдси (16 ноября 2023 г.). «Домик у озера Databricks становится фундаментом под новым слоем мечтаний об искусственном интеллекте» . Регистр . Проверено 16 ноября 2023 г.
  6. ^ Лунден, Ингрид (26 июня 2023 г.). «Databricks покупает MosaicML, конкурента OpenAI, за 1,3 миллиарда долларов» . Технический кризис . Проверено 26 июня 2023 г.
  7. ^ Кай, Кенрик (16 ноября 2023 г.). «Новый AI-продукт Databricks добавляет в свое программное обеспечение интерфейс, подобный ChatGPT» . Форбс . Проверено 16 ноября 2023 г.
  8. ^ «Databricks запускает Delta Lake, проект надежности озера данных с открытым исходным кодом» . ВенчурБит . 24 апреля 2019 года . Проверено 6 апреля 2021 г.
  9. ^ Захария, Мэтью. «Матей Захария» . Проверено 16 августа 2016 г.
  10. ^ «Microsoft делает Databricks собственной службой Azure» . ТехКранч . 15 ноября 2017 г. Проверено 6 апреля 2021 г.
  11. ^ «Databricks приобретает Redash, сервис визуализации для специалистов по данным» . ТехКранч . 24 июня 2020 г. Проверено 6 апреля 2021 г.
  12. ^ «Databricks переносит свой домик у озера в Google Cloud» . ТехКранч . 17 февраля 2021 г. . Проверено 18 февраля 2021 г.
  13. ^ «100 лучших больших рабочих мест для миллениалов» . Удача . 16 июня 2021 г. . Проверено 16 июля 2021 г.
  14. ^ Jump up to: а б Конрад, Алекс (2 февраля 2021 г.). «Databricks привлекла 1 миллиард долларов при оценке в 28 миллиардов долларов, при этом вся элита облака вложила в это деньги» . Форбс . Проверено 29 июля 2021 г.
  15. ^ Меллор, Крис (1 сентября 2021 г.). «Databricks привлекает озеро данных с чудовищной оценкой в ​​380 миллиардов долларов» . Блоки и файлы . Проверено 4 сентября 2021 г.
  16. ^ Эрик Розенбаум (6 октября 2021 г.). «Стартап-разработчик программного обеспечения Databricks стоимостью 38 миллиардов долларов совершает приобретение, чтобы оставить код позади» . CNBC . Проверено 20 февраля 2022 г.
  17. ^ Ху, Кристал; Неллис, Стивен (24 марта 2023 г.). «Databricks продвигает чат-бот с открытым исходным кодом как более дешевую альтернативу ChatGPT» . Рейтер . Архивировано из оригинала 25 марта 2023 года.
  18. ^ Лофтен, Ангус (24 марта 2023 г.). «Databricks запускает «Долли», еще одного конкурента ChatGPT» . Уолл Стрит Джорнал . Архивировано из оригинала 24 марта 2023 года.
  19. ^ Голдман, Шэрон (24 марта 2023 г.). «Databricks представляет Dolly, похожую на ChatGPT, клон, которым может владеть любое предприятие» . ВенчурБит . Архивировано из оригинала 11 апреля 2023 года.
  20. ^ Палаццоло, Стефани (3 мая 2023 г.). «Эксклюзив: компания Databricks, любимая компания Databricks, стоимостью 38 миллиардов долларов, приобретает стартап по безопасности Okera» . Бизнес-инсайдер . Архивировано из оригинала 3 мая 2023 года.
  21. ^ Датта, Тияши; Ху, Кристал (26 июня 2023 г.). «Databricks заключила сделку на 1,3 миллиарда долларов со стартапом в области генеративного искусственного интеллекта MosaicML» . Рейтер .
  22. ^ Совет, Стивен (26 июня 2023 г.). «Научно-техническая фирма Databricks купит двухлетний стартап за 21 миллион долларов на сотрудника» . СФГЕЙТ .
  23. ^ «После оценки в 43 миллиарда долларов Databricks приобретает стартап по репликации данных Arcion за 100 миллионов долларов» . ТехКранч . 23 октября 2023 г. . Проверено 23 октября 2023 г.
  24. ^ Вильгельм, Рон Миллер и Алекс (7 марта 2024 г.). «Databricks продолжает идти вперед с доходом в 1,6 миллиарда долларов» . ТехКранч . Проверено 8 марта 2024 г.
  25. ^ Jump up to: а б Харрис, Деррик (25 сентября 2013 г.). «Databricks привлекает 14 миллионов долларов от Андриссена Горовица и хочет принять участие в MapReduce с помощью Spark» . Архивировано из оригинала 15 января 2022 года . Проверено 28 сентября 2014 г.
  26. ^ Лорика, Бен (25 сентября 2013 г.). «Целью Databricks является создание аналитических инструментов нового поколения для больших данных» . О'Рейли Медиа . Проверено 28 сентября 2014 г.
  27. ^ «Databricks привлекла $250 млн при оценке своей аналитической платформы в $2,75 млрд» . ТехКранч . 5 февраля 2019 г. . Проверено 8 апреля 2021 г.
  28. ^ Новет, Иордания (5 февраля 2019 г.). «Раньше Microsoft пугала стартапы, но теперь она является «исключительно хорошим партнером», — говорит инвестор Кремниевой долины Бен Горовиц» . CNBC . Проверено 6 апреля 2021 г.
  29. ^ Миллер, Рон (30 июня 2014 г.). «Databricks получила 33 миллиона долларов в серии B и представила облачную платформу для обработки больших данных» . ТехКранч . Проверено 28 сентября 2014 г.
  30. ^ Шибер, Джонатан (15 декабря 2016 г.). «Databricks привлекает 60 миллионов долларов, чтобы стать следующим большим шагом вперед в области больших данных» . ТехКранч . Проверено 16 декабря 2016 г.
  31. ^ «Databricks выделила 140 миллионов долларов на ускорение аналитики и искусственного интеллекта на предприятии» . Блоки данных . 22 августа 2017 г. Проверено 16 мая 2019 г.
  32. ^ «Финансирование Databricks в размере 250 миллионов долларов США поддерживает взрывной рост и глобальный спрос на унифицированную аналитику; доводит оценку до 2,75 миллиарда долларов США» . Блоки данных . 5 февраля 2019 г. . Проверено 5 февраля 2019 г.
  33. ^ «Databricks объявляет о раунде инвестиций в 400 миллионов долларов при оценке в 6,2 миллиарда долларов, поскольку аналитическая платформа продолжает расти» . ТехКранч . 22 октября 2019 года . Проверено 24 октября 2019 г.
  34. ^ «Databricks привлекла $1 млрд при оценке в $28 млрд и достигла $425 млн ARR» . Технический кризис . февраль 2021 года . Проверено 14 февраля 2021 г.
  35. ^ «Databricks привлекла $1,6 млрд при оценке в $38 млрд, поскольку годовая доходность компании превысила $600 млн» . Технический кризис . Проверено 1 июля 2021 г.
  36. ^ Нишант, Никет; Ху, Кристал (14 сентября 2023 г.). «Databricks привлекла более $500 млн при оценке в $43 млрд» . Рейтер . Проверено 20 сентября 2023 г.
  37. ^ Майкл, Армбруст; Годси, Али; Синь, Рейнольд; Захария, Матей (январь 2021 г.). «Lakehouse: новое поколение открытых платформ, объединяющих хранилища данных и расширенную аналитику» (PDF) . Конференция по исследованию инновационных систем данных . Проверено 29 июля 2021 г.
  38. ^ «Получив массивное вливание в 1 миллиард долларов, Databricks нацелилась на IPO и стала конкурентом Snowflake» . КремниевыйУГОЛ . 1 февраля 2021 г. . Проверено 8 апреля 2021 г.
  39. ^ Симона, Стефани (17 октября 2022 г.). «Databricks достигает статуса авторизованного FedRAMP» . КММир . Информация сегодня . Проверено 20 октября 2022 г.
  40. ^ «Databricks повышает производительность Delta Lake, Nabs Redash для SQL, а именно» . Датанами . 24 июня 2020 г. Проверено 8 апреля 2021 г.
  41. ^ «Databricks запускает Delta Lake, проект надежности озера данных с открытым исходным кодом» . ВенчурБит . 24 апреля 2019 года . Проверено 8 апреля 2021 г.
  42. ^ «Databricks запускает SQL Analytics» . ТехКранч . 12 ноября 2020 г. . Проверено 8 апреля 2021 г.
  43. ^ Браст, Эндрю. «Databricks, лидер модели «озерного домика» данных, завершает раунд финансирования серии G на сумму 1 миллиард долларов» . ЗДНет . Проверено 8 апреля 2021 г.
  44. ^ «Индекс открытого исходного кода Two Sigma Ventures» . Два предприятия Сигмы . Проверено 8 апреля 2021 г.
  45. ^ «Инструменты MLOps — Рейтинг. OSS Insight» . ОСС Инсайт . Проверено 3 апреля 2024 г.
  46. ^ «Databricks проведет два масштабных онлайн-курса по Apache Spark» . Блоки данных . 2 декабря 2014 года . Проверено 16 декабря 2016 г.
  47. ^ «Саммит данных + AI» . Блоки данных . Проверено 8 апреля 2021 г.
  48. ^ «На волне искусственного интеллекта, основанного на данных: внутреннее решение единого стека Databricks» . Блоки данных . 14 марта 2024 г. . Проверено 5 апреля 2024 г.
  49. ^ «Databricks открывает исходный код своей собственной большой языковой модели DBRX» . Блоки данных . 27 марта 2024 г. Проверено 5 апреля 2024 г.
  50. ^ «Внутри создания самой мощной в мире модели искусственного интеллекта с открытым исходным кодом» . Блоки данных . 27 марта 2024 г. Проверено 5 апреля 2024 г.
  51. ^ «Новая модель искусственного интеллекта с открытым исходным кодом Databricks может предложить предприятиям более экономичную альтернативу OpenAI GPT-3.5» . Блоки данных . 27 марта 2024 г. Проверено 5 апреля 2024 г.
  52. ^ персонал, CNBC com (16 июня 2020 г.). «36. Блоки данных» . CNBC . Проверено 8 апреля 2021 г.
  53. ^ «Местоположения по всему миру» . Проверено 20 октября 2022 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e708c47ff8aae4b369c33fa565e2cc24__1715684460
URL1:https://arc.ask3.ru/arc/aa/e7/24/e708c47ff8aae4b369c33fa565e2cc24.html
Заголовок, (Title) документа по адресу, URL1:
Databricks - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)