Апач HBase
Оригинальный автор(ы) | Powerset |
---|---|
Разработчик(и) | Фонд программного обеспечения Apache |
Первоначальный выпуск | 28 марта 2008 г |
Стабильная версия | |
Предварительный выпуск | 3.0.0-альфа-3 / 27 июня 2022 г [1] |
Репозиторий | Репозиторий GitHub , Репозиторий Gitbox |
Написано в | Ява |
Операционная система | Кросс-платформенный |
Тип | Распределенная база данных |
Лицензия | Лицензия Апач 2.0 |
Веб-сайт | hbase |
HBase — это с открытым исходным кодом нереляционная распределенная база данных , созданная по образцу Google Bigtable и написанная на Java . Он разработан в рамках Apache Software Foundation компании проекта Apache Hadoop и работает поверх HDFS (распределенная файловая система Hadoop) или Alluxio , предоставляя возможности Hadoop, подобные Bigtable. То есть он обеспечивает отказоустойчивый способ хранения больших объемов разреженных данных (небольшие объемы информации, попадающие в большую коллекцию пустых или неважных данных, например, поиск 50 крупнейших элементов в группе из 2 миллиардов записей или поиск ненулевые элементы составляют менее 0,1% огромной коллекции).
HBase поддерживает сжатие, работу в памяти и фильтры Блума для каждого столбца, как описано в оригинальной статье Bigtable. [2] Таблицы в HBase могут служить входными и выходными данными для заданий MapReduce , выполняемых в Hadoop, и к ним можно получить доступ через API Java, а также через API REST , Avro или Thrift шлюза . HBase — это хранилище с широкими столбцами , получившее широкое распространение благодаря своему родству с Hadoop и HDFS. HBase работает поверх HDFS и хорошо подходит для быстрых операций чтения и записи больших наборов данных с высокой пропускной способностью и низкой задержкой ввода-вывода.
HBase не является прямой заменой классической SQL базы данных , однако проект Apache Phoenix предоставляет уровень SQL для HBase, а также драйвер JDBC , который можно интегрировать с различными приложениями для анализа и бизнес-аналитики . Проект Apache Trafodion предоставляет механизм запросов SQL с драйверами ODBC и JDBC и распределенную защиту транзакций ACID для нескольких операторов, таблиц и строк, которые используют HBase в качестве механизма хранения.
HBase теперь обслуживает несколько веб-сайтов, управляемых данными. [3] но MyRocks платформа обмена сообщениями Facebook перешла с HBase на в 2018 году. [4] [5] В отличие от реляционных и традиционных баз данных, HBase не поддерживает сценарии SQL; вместо этого эквивалент написан на Java, используя сходство с приложением MapReduce.
Говоря языком теоремы CAP Эрика Брюэра , HBase представляет собой систему типа CP.
История
[ редактировать ]Apache HBase возник как проект компании Powerset из-за необходимости обрабатывать огромные объемы данных для целей поиска на естественном языке . С 2010 года это проект Apache верхнего уровня.
Facebook решил внедрить свою новую платформу обмена сообщениями с использованием HBase в ноябре 2010 года, но отказался от HBase в 2018 году. [4]
Серия 2.4.x — это текущая стабильная линейка выпусков, она заменяет более ранние линейки выпусков.
Варианты использования и производственное развертывание
[ редактировать ]Предприятия, использующие HBase
[ редактировать ]Ниже приводится список известных предприятий, которые использовали или используют HBase:
- 23andMe
- Adobe
- Airbnb использует HBase как часть своей платформы вычислений потоков в реальном времени AirStream. [6]
- Группа Алибаба
- Amadeus IT Group , в качестве основного долговременного хранилища БД.
- Bloomberg для хранения данных временных рядов
- Facebook использовал HBase для своей платформы обмена сообщениями в период с 2010 по 2018 год.
- Flipkart использует HBase для своего поискового индекса [7] и мнения пользователей. [8]
- Шквал
- HubSpot
- Imgur использует HBase для работы своей системы уведомлений [9] [10]
- Какао [11]
- Нетфликс [12]
- Пинтерест [13]
- Ускоренные кредиты
- Ракетное топливо
- Salesforce.com [14]
- Сирс
- Sophos для некоторых своих серверных систем.
- Spotify использует HBase в качестве основы для Hadoop и задач машинного обучения. [15]
- Твиттер
- Tuenti использует HBase в качестве своей платформы обмена сообщениями. [16] [17]
- Сяоми
- Yahoo!
См. также
[ редактировать ]- NoSQL
- Широкий столбчатый магазин
- Большой стол
- Апач Кассандра
- Oracle NOSQL
- Гипертаблица
- Накопление Apache
- МонгоБД
- Проект Волдеморт
- Пульсация
- Совок
- Эластичный поиск
- Апач Феникс
Ссылки
[ редактировать ]- ^ Jump up to: а б с «Apache HBase – Загрузки Apache HBase» . Проверено 27 сентября 2022 г.
- ^ Чанг и др. (2006). Bigtable: распределенная система хранения структурированных данных
- ^ «Apache HBase – на базе Apache HBase» . hbase.apache.org . Проверено 8 апреля 2018 г.
- ^ Jump up to: а б «Миграция хранилища Messenger для оптимизации производительности» . www.facebook.com . 26 июня 2018 года . Проверено 5 июля 2018 г.
- ^ Facebook: Почему наши средства связи «следующего поколения» отказались от MySQL. Дата обращения: 17 декабря 2010 г.
- ^ HBaseCon (2 августа 2016 г.). «Apache HBase на Airbnb» . SlideShare.net . Проверено 8 апреля 2018 г.
- ^ «Индексирование поиска в режиме, близком к реальному времени» . 4 января 2018 г.
- ^ «Всегда ли локальность данных в Hadoop не предусмотрена?» . 10 марта 2018 г.
- ^ «Почему Imgur отказался от MySQL в пользу HBase — база данных DZone» . dzone.com . Проверено 8 апреля 2018 г.
- ^ «Технический вторник: Уведомления Imgur: от MySQL до HBase — блог Imgur» . blog.imgur.com . Проверено 8 апреля 2018 г.
- ^ Доён Юн. «S2Graph: крупномасштабная база данных графов с HBase» .
- ^ Пак Чолсу и Ашвин Шанкар. «Netflix: интеграция Spark в петабайтном масштабе» .
- ^ Инженерное дело, Pinterest (30 марта 2018 г.). «Повышение эффективности резервного копирования HBase в Pinterest» . Середина . Проверено 14 апреля 2020 г.
{{cite web}}
:|first=
имеет общее имя ( справка ) - ^ «Hbase на Salesforce.com» .
- ^ Джош Баер. «Как Apache управляет музыкальными рекомендациями Spotify» .
- ^ «Групповой чат Tuenti: просто, но сложно» . Архивировано из оригинала 24 ноября 2012 года . Проверено 29 сентября 2015 г.
- ^ «Туэнти Асинхронизм» . Гитхаб . 6 ноября 2013 г.
Библиография
[ редактировать ]- Димидук, Ник; Хурана, Амандип (28 ноября 2012 г.). HBase в действии (1-е изд.). Публикации Мэннинга . п. 350. ИСБН 978-1617290527 .
- Джордж, Ларс (20 сентября 2011 г.). HBase: Полное руководство (1-е изд.). О'Рейли Медиа . п. 556. ИСБН 978-1449396107 .
- Цзян, Ифэн (16 августа 2012 г.). Поваренная книга администратора HBase (1-е изд.). Пакт Паблишинг . п. 332. ИСБН 978-1849517140 .