Зеленая слива
![]() | |
Тип компании | Продукт Broadcom |
---|---|
Промышленность | больших данных Технологии |
Штаб-квартира | Пало-Альто , Калифорния |
Продукты | системы управления базами данных Программное обеспечение |
Разработчик(и) | Бродком |
---|---|
Стабильная версия | 7.0.0 / 28 сентября 2023 г |
Операционная система | Линукс |
Тип | Система управления базой данных |
Веб-сайт | зеленая слива |
Greenplum — это технология больших данных , основанная на архитектуре MPP и технологии баз данных с открытым исходным кодом Postgres . Технология была создана одноименной компанией со штаб-квартирой в Сан-Матео , штат Калифорния, примерно в 2005 году. Greenplum была приобретена корпорацией EMC в июле 2010 года. [1]
Начиная с 2012 года ее программное обеспечение для системы управления базами данных стало известно как Pivotal Greenplum Database, продаваемое через Pivotal Software . Pivotal открыла исходный код основного движка и продолжила его разработку сообществом открытого исходного кода базы данных Greenplum и Pivotal.
Начиная с 2020 года Pivotal была приобретена VMware , и VMware продолжала спонсировать сообщество открытого исходного кода Greenplum Database, а также коммерциализировать технологию под торговой маркой VMware Tanzu Greenplum . В ноябре 2023 года VMware была приобретена Broadcom. [2]
В мае 2024 года компания Tanzu от Broadcom приняла решение закрыть исходный код проекта базы данных Greenplum. Все будущие выпуски базы данных Greenplum будут иметь закрытый исходный код и будут выпущены как часть VMware Tanzu Data Suite.
Компания
[ редактировать ]Компания Greenplum была основана в сентябре 2003 года Скоттом Ярой и Люком Лонерганом. Это было слияние двух более мелких компаний: Metapa (основана в августе 2000 года недалеко от Лос-Анджелеса ) [3] и Дидера в Фэрфаксе, Вирджиния . [4]
Среди инвесторов были SoundView Ventures, Hudson Ventures и Royal Wulff Ventures. в общей сложности долларов США . 20 миллионов При слиянии было объявлено о финансировании [5] Компания Greenplum, базирующаяся в Сан-Матео, Калифорния , в апреле 2005 года выпустила свое программное обеспечение для системы управления базами данных на базе PostgreSQL, назвав его Bizgres. [6] Раунды венчурного капитала в размере около 15 миллионов долларов США каждый были инвестированы в марте 2006 и феврале 2007 года. [7]
В июле 2006 года было объявлено о партнерстве с Sun Microsystems . [8] Sun, которая также приобрела MySQL AB , в январе 2009 года приняла участие в раунде инвестиций на сумму 27 миллионов долларов США , возглавляемом Meritech Capital Partners . [7] В проект Bizgres входило еще несколько участников, и он поддерживался примерно до 2008 года, когда продукт также назывался просто «Greenplum». [9] [10] Sun Fire X4500 представляла собой эталонную архитектуру и использовалась большинством клиентов до тех пор, пока примерно в то время не был осуществлен переход на Linux . Greenplum была приобретена корпорацией EMC в июле 2010 года, став основой подразделения EMC по программному обеспечению для больших данных . [1] Хотя EMC не раскрыла стоимость, она оценивалась в 300 миллионов долларов США . [11] [12] На момент приобретения продуктами Greenplum были база данных Greenplum, Chorus (инструмент управления) и Data Science Labs. У Greenplum были клиенты на вертикальных рынках, включая eBay . [13] Он стал частью Pivotal Software в 2012 году. [14]
Вариант использования Apache Hadoop для хранения данных в файловой системе Hadoop под названием Hawq был анонсирован в 2013 году. [15] [16] GreenplumDB и Hawq В 2015 году были анонсированы проекты программного обеспечения с открытым исходным кодом . [17]
Технология
[ редактировать ]Продукт базы данных Greenplum от Pivotal использует массово-параллельной методы обработки (MPP). Каждый компьютерный кластер состоит из главного узла, резервного главного узла и узлов сегмента. [18] Все данные находятся на узлах сегментов, а информация каталога хранится на главных узлах. Узлы сегментов запускают один или несколько сегментов, которые представляют собой модифицированные экземпляры базы данных PostgreSQL и которым присваивается идентификатор контента. Для каждой таблицы данные распределяются между узлами сегментов на основе ключей столбцов распределения, указанных пользователем на языке определения данных . Для каждого идентификатора содержимого сегмента существует как основной сегмент, так и зеркальный сегмент, которые не работают на одном физическом хосте. Когда запрос поступает на главный узел, он анализируется, планируется и отправляется всем сегментам для выполнения плана запроса и либо возврата запрошенных данных, либо вставки результата запроса в таблицу базы данных. Язык структурированных запросов версии SQL:2003 используется для представления запросов в систему. Семантика транзакций соответствует ограничениям, известным как ACID . [19]
Среди конкурентов — другие системы управления базами данных MPP, предоставляемые крупными поставщиками, такими как Teradata , Amazon Redshift , Microsoft Azure , Alibaba AnalyticDB и, в прошлом, IBM Netezza . [18] [20] Дополнительную конкуренцию составляют другие более мелкие конкуренты, столбцово-ориентированные базы данных , такие как HP Vertica , Exasol , а также поставщики хранилищ данных с архитектурой, отличной от MPP, такие как Oracle Exadata , IBM Db2 и SAP HANA .
Гринплум Версия 7
[ редактировать ]В сентябре 2023 года была выпущена версия 7 базы данных Greenplum. [21] Версия 7 основана на PostgreSQL версии 12.12.
Зеленая слива Версия 6
[ редактировать ]В сентябре 2019 года была выпущена версия 6 базы данных Greenplum. Версия 6 основана на PostgreSQL версии 9.4 и отличается огромными улучшениями в [22] Производительность OLTP. Greenplum 6 был рассмотрен в средствах массовой информации несколькими источниками и отмечен за его совместимость с открытым исходным кодом Postgres. [23] и за производительность OLTP [24]
Гринплум Версия 5
[ редактировать ]В сентябре 2017 года была выпущена версия 5 базы данных Greenplum. Версия 5 включает в себя первую итерацию стратегии проекта Greenplum по объединению более поздних версий PostgreSQL обратно в Greenplum и основана на PostgreSQL версии 8.3 по сравнению с предыдущей версией 8.2. [25] Версия 5 также представляет общедоступную версию оптимизатора GPORCA. [26] для оптимизации затрат SQL, предназначенной для больших данных.
Ссылки
[ редактировать ]- ^ Jump up to: а б «EMC приобретает Greenplum» . Пресс-релиз . Корпорация ЕМС. 6 июля 2010 г. Проверено 15 марта 2017 г.
- ^ «Производитель микросхем Broadcom завершает сделку по покупке VMware на сумму 69 миллиардов долларов» . 23 ноября 2023 г. Проверено 5 июня 2024 г.
- ^ «Форма D: Уведомление о продаже ценных бумаг» (PDF) . SEC США. 30 июля 2003 года . Проверено 15 марта 2017 г.
- ^ Морин О'Гара (26 сентября 2003 г.). «Метапа покупает Дидеру» . Бизнес-новости Linux . Проверено 15 марта 2017 г.
- ^ «Metapa приобретает Didera и закрывает дополнительное финансирование; пионеры отрасли в области высокопроизводительных вычислений объединяются для создания революционного решения по кластеризации баз данных Linux для поддержки принятия решений» . Пресс-релиз . 23 сентября 2003 г.
- ^ «Запуск проекта Бизгрес» . Веб-сайт разработчика PostgreSQL . 17 апреля 2005 года . Проверено 15 марта 2017 г.
- ^ Jump up to: а б Дункан Райли (21 января 2008 г.). «Greenplum берет 27 миллионов долларов на серию C» . Технический кризис . Проверено 15 марта 2017 г.
- ^ Колин Уайт; Ричард Хакатхорн (26 июня 2007 г.). «Солнце/Зеленая слива» . Лучшие практики бизнес-аналитики . Проверено 15 марта 2017 г.
- ^ «История» . Старый веб-сайт Bizgres.org . Архивировано из оригинала 22 декабря 2008 года . Проверено 15 марта 2017 г.
- ^ «Greenplum обновляет базу данных с открытым исходным кодом» . Информационная неделя . 22 февраля 2008 года . Проверено 15 марта 2017 г.
- ^ Ом Малик (6 июля 2010 г.). «Большие данные = большие деньги: EMC покупает Greenplum» . ГигаОм . Архивировано из оригинала 20 октября 2016 года . Проверено 15 марта 2017 г.
- ^ Александр Хейслип (7 июля 2010 г.). «Microsoft, Sun и SAP стали неожиданными победителями распродажи Greenplum» . Форбс . Проверено 15 марта 2017 г.
- ^ «два огромных хранилища данных eBay» . Блог DBMS2 . Монаш Исследования. 30 апреля 2009 года . Проверено 15 марта 2017 г.
- ^ Тимоти Прикетт Морган (20 марта 2012 г.). «EMC хочет быть Linux для больших данных: открывает инструмент Chorus, объединяет разработчиков гибких программ Pivotal Labs» . Регистр . Проверено 15 марта 2017 г.
- ^ «Когда мне следует использовать базу данных Greenplum вместо HAWQ?» . Веб-сайт Pivotal Guru . 31 января 2014 года . Проверено 15 марта 2017 г.
- ^ Тимоти Прикетт Морган (25 февраля 2013 г.). «EMC превращает слона Hadoop в базу данных SQL Hawq» . Регистр . Проверено 15 марта 2017 г.
- ^ Кейд Мец (17 февраля 2015 г.). «Pivotal удваивает использование открытого исходного кода в знак изменения мира программного обеспечения» . Проводной . Проверено 15 марта 2017 г.
- ^ Jump up to: а б Тимоти Прикетт Морган (6 апреля 2011 г.). «EMC становится пышнее и ярче с устройствами Greenplum: возьмите это, Teradata, Exadata, Netezza» . Регистр . Проверено 18 марта 2017 г.
- ^ Сунила Голлапуди (2013). Начало работы с Greenplum для анализа больших данных . Пакт Паблишинг. ISBN 978-1-78217-705-0 .
- ^ «Сравнение свойств системы Amazon Redshift, Greenplum, базы данных SQL Microsoft Azure и Teradata Aster» . DB-движки . Проверено 18 марта 2017 г.
- ^ «Примечания к выпуску VMware Greenplum 7.x» . 2 октября 2023 г.
- ^ «Бенчмарки Greenplum 6 OLTP» . 15 мая 2019 г.
- ^ «База данных Greenplum компании Pivotal вот-вот наконец будет согласована с проектом с открытым исходным кодом. Что это будет означать для платформы?» . ЗДНет .
- ^ «Существенная модернизация хранилища данных MPP с открытым исходным кодом предлагает высокий уровень параллелизма, встроенную аналитику и возможности обработки данных» . 7 ноября 2019 г.
- ^ «Pivotal Greenplum жив и здоров» . ЗДНет . Проверено 14 сентября 2017 г.
- ^ «Orca: модульная архитектура оптимизатора запросов для больших данных» (PDF) . ЗДНет . Проверено 14 апреля 2016 г.