Блоки данных
Тип компании | Частный |
---|---|
Промышленность | Компьютерное программное обеспечение |
Основан | 2013 год |
Основатели |
|
Штаб-квартира | , Соединенные Штаты |
Ключевые люди |
|
Доход | 1,6 миллиарда долларов (2023 г.) [1] |
Количество сотрудников | в. 5500 (2023) [2] |
Веб-сайт | блоки данных |
Databricks, Inc. — глобальная компания по обработке данных, аналитики и искусственного интеллекта, основанная создателями Apache Spark . [3]
Компания предоставляет облачную платформу, которая помогает предприятиям создавать, масштабировать и управлять данными и искусственным интеллектом, включая генеративный искусственный интеллект и другие машинного обучения . модели [4]
Компания Databricks стала пионером в создании Data Lakehouse — платформы данных и искусственного интеллекта, которая сочетает в себе возможности хранилища данных с озером данных, позволяя организациям управлять и использовать как структурированные, так и неструктурированные данные для традиционной бизнес-аналитики и рабочих нагрузок искусственного интеллекта. [5]
Databricks приобрела MosaicML за 1,4 миллиарда долларов в июне 2023 года, что стало ее крупнейшим приобретением. [6]
В ноябре 2023 года Databricks представила Databricks Data Intelligence Platform — новое предложение, которое сочетает в себе преимущества объединения Lakehouse с технологией генеративного искусственного интеллекта MosaicML, позволяющей клиентам лучше понимать и использовать свои собственные данные. [7]
Компания разрабатывает Delta Lake — проект с открытым исходным кодом, призванный повысить надежность озер данных для машинного обучения и других случаев использования в области науки о данных. [8]
История
[ редактировать ]Databricks вырос из проекта AMPLab в Калифорнийском университете в Беркли, который участвовал в создании Apache Spark , среды распределенных вычислений с открытым исходным кодом, построенной на основе Scala . Компанию основали Али Годси , Энди Конвински , Арсалан Таваколи-Шираджи , Ион Стойка , Матей Захария , [9] Патрик Венделл и Рейнольд Синь .
В ноябре 2017 года компания была объявлена собственной службой Microsoft Azure посредством интеграции Azure Databricks. [10]
В июне 2020 года Databricks приобрела Redash, инструмент с открытым исходным кодом, призванный помочь ученым и аналитикам данных визуализировать и создавать интерактивные информационные панели своих данных. [11]
В феврале 2021 года совместно с Google Cloud Databricks обеспечила интеграцию с Google Kubernetes Google BigQuery . Engine и платформой [12] Fortune назвал Databricks одним из лучших крупных «рабочих мест для миллениалов» в 2021 году. [13] На тот момент компания заявила, что ее продуктами пользуются более 5000 организаций. [14]
В августе 2021 года Databricks завершила восьмой раунд финансирования, собрав 1,6 миллиарда долларов и оценив компанию в 38 миллиардов долларов. [15]
В октябре 2021 года Databricks совершила второе приобретение немецкой компании 8080 Labs, не занимающейся кодированием . 8080 Labs создает бамбуклиб — инструмент для исследования данных, для использования которого не требуется программирование. [16]
В ответ на популярность в ChatGPT OpenAI овцы марте 2023 года компания представила языковую модель с открытым исходным кодом , названную Dolly в честь Долли , которую разработчики могли использовать для создания своих собственных чат-ботов . Их модель использует меньше параметров для получения результатов, аналогичных ChatGPT, но Databricks не выпустила официальных тестов производительности, чтобы показать, действительно ли ее бот соответствует производительности ChatGPT. [17] [18] [19]
Databricks приобрела стартап Okera, занимающийся безопасностью данных, в мае 2023 года, чтобы расширить свои возможности управления данными. [20] В следующем месяце компания приобрела стартап MosaicML с открытым исходным кодом, занимающийся генеративным искусственным интеллектом, за 1,4 миллиарда долларов. [21] [22]
В октябре 2023 года Databricks приобрела стартап по репликации данных Arcion за 100 миллионов долларов. [23]
Databricks сообщила о выручке в 1,6 миллиарда долларов за 2023 финансовый год, что более чем вдвое превышает предыдущий уровень. [24]
Финансирование
[ редактировать ]В сентябре 2013 года Databricks объявила, что привлекла 13,9 миллиона долларов от Андреессена Горовица и заявила, что намерена предложить альтернативу системе Google MapReduce . [25] [26] Microsoft была известным инвестором Databricks в 2019 году, участвуя в серии E компании в неустановленной сумме. [27] [28] Компания привлекла финансирование в размере 1,9 миллиарда долларов, в том числе серию G в размере 1 миллиарда долларов под руководством Франклина Темплтона с оценкой после инвестирования в 28 миллиардов долларов в феврале 2021 года. Среди других инвесторов - Amazon Web Services , CapitalG (растущая инвестиционная компания под управлением Alphabet Inc. ) и Salesforce Ventures . [14]
Ряд | Дата | Сумма (млн $) | Ведущие инвесторы |
---|---|---|---|
А | 2013 | 13.9 [25] | Андреессен Горовиц |
Б | 2014 | 33 [29] | Новые корпоративные партнеры |
С | 2016 | 60 [30] | Новые корпоративные партнеры |
Д | 2017 | 140 [31] | Андреессен Горовиц |
И | февраль 2019 г. | 250 [32] | Андреессен Горовиц |
Ф | Октябрь 2019 г. | 400 [33] | Андреессен Горовиц |
Г | Январь 2021 г. | 1,000 [34] | Франклин Темплтон Инвестментс |
ЧАС | август 2021 г. | 1,600 [35] | Морган Стэнли |
я | Сентябрь 2023 г. | 500 [36] | Capital One Ventures, NVIDIA |
Продукты
[ редактировать ]Databricks разрабатывает и продает облачную платформу данных, используя маркетинговый термин «дом озера», который представляет собой сумку, основанную на терминах « хранилище данных » и « озеро данных ». [37] Lakehouse Databricks основан на платформе Apache Spark с открытым исходным кодом , которая позволяет выполнять аналитические запросы к полуструктурированным данным без традиционной схемы базы данных . [38] В октябре 2022 года Lakehouse получила статус авторизованного FedRAMP для использования федеральным правительством США и подрядчиками. [39]
Delta Engine от Databricks был запущен в июне 2020 года как новый механизм запросов, который накладывается поверх Delta Lake для повышения производительности запросов. [40] Он совместим с Apache Spark и MLflow, которые также являются проектами с открытым исходным кодом, в создании которых участвовали сотрудники Databricks. [41]
В ноябре 2020 года Databricks представила Databricks SQL (ранее известный как SQL Analytics) для создания бизнес-аналитики и аналитических отчетов поверх озер данных. Аналитики могут запрашивать наборы данных напрямую с помощью стандартного SQL или использовать коннекторы продуктов для прямой интеграции с инструментами бизнес-аналитики, такими как Holistics , Tableau , Qlik , SigmaComputing , Looker и ThoughtSpot . [42]
Databricks предлагает платформу для других рабочих нагрузок, включая машинное обучение, хранение и обработку данных, потоковую аналитику и бизнес-аналитику. [43]
Компания также создала Delta Lake, MLflow и Koalas — проекты с открытым исходным кодом , которые охватывают инженерию данных , науку о данных и машинное обучение . [44] [45] Помимо создания платформы Databricks, компания стала соорганизатором массовых открытых онлайн-курсов по Spark. [46] и конференция для сообщества Spark под названием Data + AI Summit, [47] ранее известный как Spark Summit.
В начале 2024 года Databricks выпустила портфель новых инструментов, которые помогут клиентам настраивать, точно настраивать или создавать собственные системы искусственного интеллекта, в том числе: Mosaic AI Vector Search, который позволяет компаниям создавать модели RAG, Mosaic AI Model Serving, единый сервис для развертывание, управление, запрос и мониторинг моделей, точно настроенных или предварительно развернутых с помощью Databricks, а также Mosaic AI Pretraining, платформы, позволяющей предприятиям создавать свои собственные LLM. [48]
В марте 2024 года Databricks выпустила DBRX, модель фонда с открытым исходным кодом. Он основан на архитектуре, состоящей из нескольких экспертов, и построен на проекте с открытым исходным кодом MegaBlocks. [49]
Создание DBRX обошлось в 10 миллионов долларов. На момент запуска это был самый быстрый LLM с открытым исходным кодом, основанный на широко используемых отраслевых тестах. Он превосходил другие модели, такие как LlaMA2, в решении логических головоломок и ответах на вопросы общего характера, а также в других задачах. И хотя это модель со 136 миллиардами параметров, для генерации результатов она использует в среднем только 36 миллиардов. [50]
DBRX также служит основой для компаний, позволяющих создавать или настраивать свои собственные модели искусственного интеллекта. Компании также могут использовать собственные данные для получения более качественных результатов для конкретных случаев использования. [51]
Операции
[ редактировать ]Штаб-квартира Databricks находится в Сан-Франциско . [52] Компания также имеет представительства в Канаде , Великобритании , Нидерландах , Сингапуре , Австралии , Германии , Франции , Японии , Китае , Южной Корее , Индии , Бразилии , Швейцарии , Коста-Рике и Сербии . [53]
Ссылки
[ редактировать ]- ^ Лин, Белль (6 марта 2024 г.). «ИИ обеспечивает рекордные продажи Databricks стоимостью в несколько миллиардов долларов. IPO может подождать…» . Уолл Стрит Джорнал . Архивировано из оригинала 6 марта 2024 года.
- ^ Корри, Дрибуш (29 июля 2023 г.). «Технологический директор, который пользуется своим телефоном по старинке» . Уолл Стрит Джорнал . Архивировано из оригинала 28 февраля 2024 года.
- ^ Саул, Дерек (14 сентября 2023 г.). «Компания Databricks с ведущими перспективами IPO получила оценку в 43 миллиарда долларов благодаря раунду финансирования в 500 миллионов долларов, включая AI Titan Nvidia» . Форбс . Проверено 26 марта 2024 г.
- ^ Салливан, Марк (19 марта 2024 г.). «Как Databricks помогает клиентам разрабатывать собственные модели искусственного интеллекта» . Компания Фаст . Проверено 19 марта 2024 г.
- ^ Кларк, Линдси (16 ноября 2023 г.). «Домик у озера Databricks становится фундаментом под новым слоем мечтаний об искусственном интеллекте» . Регистр . Проверено 16 ноября 2023 г.
- ^ Лунден, Ингрид (26 июня 2023 г.). «Databricks покупает MosaicML, конкурента OpenAI, за 1,3 миллиарда долларов» . Технический кризис . Проверено 26 июня 2023 г.
- ^ Кай, Кенрик (16 ноября 2023 г.). «Новый AI-продукт Databricks добавляет в свое программное обеспечение интерфейс, подобный ChatGPT» . Форбс . Проверено 16 ноября 2023 г.
- ^ «Databricks запускает Delta Lake, проект надежности озера данных с открытым исходным кодом» . ВенчурБит . 24 апреля 2019 года . Проверено 6 апреля 2021 г.
- ^ Захария, Мэтью. «Матей Захария» . Проверено 16 августа 2016 г.
- ^ «Microsoft делает Databricks собственной службой Azure» . ТехКранч . 15 ноября 2017 г. Проверено 6 апреля 2021 г.
- ^ «Databricks приобретает Redash, сервис визуализации для специалистов по данным» . ТехКранч . 24 июня 2020 г. Проверено 6 апреля 2021 г.
- ^ «Databricks переносит свой домик у озера в Google Cloud» . ТехКранч . 17 февраля 2021 г. . Проверено 18 февраля 2021 г.
- ^ «100 лучших больших рабочих мест для миллениалов» . Удача . 16 июня 2021 г. . Проверено 16 июля 2021 г.
- ^ Jump up to: а б Конрад, Алекс (2 февраля 2021 г.). «Databricks привлекла 1 миллиард долларов при оценке в 28 миллиардов долларов, при этом вся элита облака вложила в это деньги» . Форбс . Проверено 29 июля 2021 г.
- ^ Меллор, Крис (1 сентября 2021 г.). «Databricks привлекает озеро данных с чудовищной оценкой в 380 миллиардов долларов» . Блоки и файлы . Проверено 4 сентября 2021 г.
- ^ Эрик Розенбаум (6 октября 2021 г.). «Стартап-разработчик программного обеспечения Databricks стоимостью 38 миллиардов долларов совершает приобретение, чтобы оставить код позади» . CNBC . Проверено 20 февраля 2022 г.
- ^ Ху, Кристал; Неллис, Стивен (24 марта 2023 г.). «Databricks продвигает чат-бот с открытым исходным кодом как более дешевую альтернативу ChatGPT» . Рейтер . Архивировано из оригинала 25 марта 2023 года.
- ^ Лофтен, Ангус (24 марта 2023 г.). «Databricks запускает «Долли», еще одного конкурента ChatGPT» . Уолл Стрит Джорнал . Архивировано из оригинала 24 марта 2023 года.
- ^ Голдман, Шэрон (24 марта 2023 г.). «Databricks представляет Dolly, похожую на ChatGPT, клон, которым может владеть любое предприятие» . ВенчурБит . Архивировано из оригинала 11 апреля 2023 года.
- ^ Палаццоло, Стефани (3 мая 2023 г.). «Эксклюзив: компания Databricks, любимая компания Databricks, стоимостью 38 миллиардов долларов, приобретает стартап по безопасности Okera» . Бизнес-инсайдер . Архивировано из оригинала 3 мая 2023 года.
- ^ Датта, Тияши; Ху, Кристал (26 июня 2023 г.). «Databricks заключила сделку на 1,3 миллиарда долларов со стартапом в области генеративного искусственного интеллекта MosaicML» . Рейтер .
- ^ Совет, Стивен (26 июня 2023 г.). «Научно-техническая фирма Databricks купит двухлетний стартап за 21 миллион долларов на сотрудника» . СФГЕЙТ .
- ^ «После оценки в 43 миллиарда долларов Databricks приобретает стартап по репликации данных Arcion за 100 миллионов долларов» . ТехКранч . 23 октября 2023 г. . Проверено 23 октября 2023 г.
- ^ Вильгельм, Рон Миллер и Алекс (7 марта 2024 г.). «Databricks продолжает идти вперед с доходом в 1,6 миллиарда долларов» . ТехКранч . Проверено 8 марта 2024 г.
- ^ Jump up to: а б Харрис, Деррик (25 сентября 2013 г.). «Databricks привлекает 14 миллионов долларов от Андриссена Горовица и хочет принять участие в MapReduce с помощью Spark» . Архивировано из оригинала 15 января 2022 года . Проверено 28 сентября 2014 г.
- ^ Лорика, Бен (25 сентября 2013 г.). «Целью Databricks является создание аналитических инструментов нового поколения для больших данных» . О'Рейли Медиа . Проверено 28 сентября 2014 г.
- ^ «Databricks привлекла $250 млн при оценке своей аналитической платформы в $2,75 млрд» . ТехКранч . 5 февраля 2019 г. . Проверено 8 апреля 2021 г.
- ^ Новет, Иордания (5 февраля 2019 г.). «Раньше Microsoft пугала стартапы, но теперь она является «исключительно хорошим партнером», — говорит инвестор Кремниевой долины Бен Горовиц» . CNBC . Проверено 6 апреля 2021 г.
- ^ Миллер, Рон (30 июня 2014 г.). «Databricks получила 33 миллиона долларов в серии B и представила облачную платформу для обработки больших данных» . ТехКранч . Проверено 28 сентября 2014 г.
- ^ Шибер, Джонатан (15 декабря 2016 г.). «Databricks привлекает 60 миллионов долларов, чтобы стать следующим большим шагом вперед в области больших данных» . ТехКранч . Проверено 16 декабря 2016 г.
- ^ «Databricks выделила 140 миллионов долларов на ускорение аналитики и искусственного интеллекта на предприятии» . Блоки данных . 22 августа 2017 г. Проверено 16 мая 2019 г.
- ^ «Финансирование Databricks в размере 250 миллионов долларов США поддерживает взрывной рост и глобальный спрос на унифицированную аналитику; доводит оценку до 2,75 миллиарда долларов США» . Блоки данных . 5 февраля 2019 г. . Проверено 5 февраля 2019 г.
- ^ «Databricks объявляет о раунде инвестиций в 400 миллионов долларов при оценке в 6,2 миллиарда долларов, поскольку аналитическая платформа продолжает расти» . ТехКранч . 22 октября 2019 года . Проверено 24 октября 2019 г.
- ^ «Databricks привлекла $1 млрд при оценке в $28 млрд и достигла $425 млн ARR» . Технический кризис . февраль 2021 года . Проверено 14 февраля 2021 г.
- ^ «Databricks привлекла $1,6 млрд при оценке в $38 млрд, поскольку годовая доходность компании превысила $600 млн» . Технический кризис . Проверено 1 июля 2021 г.
- ^ Нишант, Никет; Ху, Кристал (14 сентября 2023 г.). «Databricks привлекла более $500 млн при оценке в $43 млрд» . Рейтер . Проверено 20 сентября 2023 г.
- ^ Майкл, Армбруст; Годси, Али; Синь, Рейнольд; Захария, Матей (январь 2021 г.). «Lakehouse: новое поколение открытых платформ, объединяющих хранилища данных и расширенную аналитику» (PDF) . Конференция по исследованию инновационных систем данных . Проверено 29 июля 2021 г.
- ^ «Получив массивное вливание в 1 миллиард долларов, Databricks нацелилась на IPO и стала конкурентом Snowflake» . КремниевыйУГОЛ . 1 февраля 2021 г. . Проверено 8 апреля 2021 г.
- ^ Симона, Стефани (17 октября 2022 г.). «Databricks достигает статуса авторизованного FedRAMP» . КММир . Информация сегодня . Проверено 20 октября 2022 г.
- ^ «Databricks повышает производительность Delta Lake, Nabs Redash для SQL, а именно» . Датанами . 24 июня 2020 г. Проверено 8 апреля 2021 г.
- ^ «Databricks запускает Delta Lake, проект надежности озера данных с открытым исходным кодом» . ВенчурБит . 24 апреля 2019 года . Проверено 8 апреля 2021 г.
- ^ «Databricks запускает SQL Analytics» . ТехКранч . 12 ноября 2020 г. . Проверено 8 апреля 2021 г.
- ^ Браст, Эндрю. «Databricks, лидер модели «озерного домика» данных, завершает раунд финансирования серии G на сумму 1 миллиард долларов» . ЗДНет . Проверено 8 апреля 2021 г.
- ^ «Индекс открытого исходного кода Two Sigma Ventures» . Два предприятия Сигмы . Проверено 8 апреля 2021 г.
- ^ «Инструменты MLOps — Рейтинг. OSS Insight» . ОСС Инсайт . Проверено 3 апреля 2024 г.
- ^ «Databricks проведет два масштабных онлайн-курса по Apache Spark» . Блоки данных . 2 декабря 2014 года . Проверено 16 декабря 2016 г.
- ^ «Саммит данных + AI» . Блоки данных . Проверено 8 апреля 2021 г.
- ^ «На волне искусственного интеллекта, основанного на данных: внутреннее решение единого стека Databricks» . Блоки данных . 14 марта 2024 г. . Проверено 5 апреля 2024 г.
- ^ «Databricks открывает исходный код своей собственной большой языковой модели DBRX» . Блоки данных . 27 марта 2024 г. Проверено 5 апреля 2024 г.
- ^ «Внутри создания самой мощной в мире модели искусственного интеллекта с открытым исходным кодом» . Блоки данных . 27 марта 2024 г. Проверено 5 апреля 2024 г.
- ^ «Новая модель искусственного интеллекта с открытым исходным кодом Databricks может предложить предприятиям более экономичную альтернативу OpenAI GPT-3.5» . Блоки данных . 27 марта 2024 г. Проверено 5 апреля 2024 г.
- ^ персонал, CNBC com (16 июня 2020 г.). «36. Блоки данных» . CNBC . Проверено 8 апреля 2021 г.
- ^ «Местоположения по всему миру» . Проверено 20 октября 2022 г.
- Компании, занимающиеся большими данными
- Компании, базирующиеся в Сан-Франциско
- Компании, занимающиеся бесплатным программным обеспечением
- Частные компании, базирующиеся в Калифорнии
- Компании-разработчики программного обеспечения, расположенные в районе залива Сан-Франциско.
- Компании-разработчики программного обеспечения, основанные в 2013 году.
- Компании-разработчики программного обеспечения США