Инструмент построения данных
![]() | |
Разработчик(и) | dbt-Labs |
---|---|
Первоначальный выпуск | 3 декабря 2021 г |
Стабильная версия | 1.8.4
/ 18 июля 2024 г [ 1 ] |
Репозиторий | |
Написано в | Питон |
Операционная система | Microsoft Windows , MacOS , Linux |
Доступно в | Питон |
Тип | Аналитика данных, управление данными |
Лицензия | Лицензия Апач 2.0 |
Веб-сайт | документы |
инструмент построения данных ( dbt ) — это инструмент командной строки с открытым исходным кодом , который помогает аналитикам и инженерам преобразовывать данные в своих хранилищах . более эффективно [ 2 ]
История
[ редактировать ]Это началось в RJMetrics в 2016 году как решение по добавлению базовых возможностей трансформации в Stitch (приобретено Talend в 2018 году). [ 3 ] Самые ранние версии dbt позволяли аналитикам участвовать в процессе преобразования данных, следуя лучшим практикам разработки программного обеспечения. [ 4 ]
С самого начала dbt имел открытый исходный код. [ 5 ] В 2018 году команда dbt Labs (тогда называвшаяся Fishtown Analytics) выпустила коммерческий продукт на базе dbt Core. [ 6 ]
Финансирование
[ редактировать ]В апреле 2020 года dbt Labs анонсировала серию A под руководством Андриссена Горовица . [ 7 ] В ноябре dbt Labs объявила о своей серии B, возглавляемой Андриссеном Горовицем и Sequoia . [ 8 ] А в июне 2021 года dbt Labs подняла серию C под руководством Altimeter , Sequoia и Andreessen Horowitz. [ 9 ] В феврале 2022 года компания привлекла 222 миллиона долларов для своей серии D при оценке в 4,2 миллиарда долларов. [ 10 ]
Обзор
[ редактировать ]dbt позволяет инженерам-аналитикам преобразовывать данные в своих хранилищах путем написания операторов выбора и превращать эти операторы выбора в таблицы и представления. dbt выполняет преобразование (T) в процессах извлечения, загрузки, преобразования (ELT) — он не извлекает и не загружает данные, но предназначен для эффективного преобразования данных, уже находящихся внутри хранилища. Целью dbt является предоставление аналитикам возможности работать как инженеры-программисты, в соответствии с точкой зрения dbt. [ 11 ]
dbt использует файлы YAML для объявления свойств. seed
— это тип справочной таблицы, используемой в dbt для статических или редко изменяемых данных, таких как, например, коды стран или таблицы поиска ), которые основаны на CSV и обычно хранятся в папке с исходными данными .
Ссылки
[ редактировать ]- ^ «Выпуск dbt-core v1.8.4 · dbt-labs/dbt-core» . Гитхаб . Проверено 1 августа 2024 г.
- ^ Атвал, Харвиндер (9 декабря 2019 г.). Практические операции с данными: реализация гибкой обработки данных в больших масштабах . Апресс. п. 223. ИСБН 978-1-4842-5104-1 .
- ^ «Стич присоединяется к Talend» . Данные о стежке. 07.11.2018. Архивировано из оригинала 07.11.2021 . Проверено 7 ноября 2021 г.
- ^ «Прощай, RJMetrics, здравствуй, Fishtown Analytics» . Блог dbt. 01.08.2016. Архивировано из оригинала 07.11.2021 . Проверено 7 ноября 2021 г.
- ^ Кай, Кенрик. «Dbt Labs ведет переговоры о привлечении инвестиций при оценке в 6 миллиардов долларов спустя шесть месяцев после того, как стала единорогом» . Форбс . Проверено 1 апреля 2023 г.
- ^ «Примечания к выпуску Sinter, август 2018 г.: построитель запросов на включение, детальные разрешения GitHub и многое другое» . 2018-07-31. Архивировано из оригинала 07.11.2021 . Проверено 7 ноября 2021 г.
- ^ «Fishtown Analytics привлекла $12,9 млн в рамках серии А для своего аналитического инженерного инструмента с открытым исходным кодом» . TechCrunch. 22 апреля 2020 г. Архивировано из оригинала 07.11.2021 . Проверено 7 ноября 2021 г.
- ^ «Fishtown Analytics привлекла $29,5 млн в серии B для своей платформы обработки данных» . TechCrunch. 2020-11-11. Архивировано из оригинала 07.11.2021 . Проверено 7 ноября 2021 г.
- ^ «От сообщества, от сообщества, для сообщества» . Блог dbt. 2021-06-30. Архивировано из оригинала 07.11.2021 . Проверено 7 ноября 2021 г.
- ^ Кай, Кенрик (24 февраля 2022 г.). «VENTURE CAPITAL Dbt Labs привлекла 4,2 миллиарда долларов, что на 2 миллиарда долларов меньше, чем первоначально планировалось» . Форбс . Форбс. Архивировано из оригинала 11 мая 2022 года . Проверено 11 мая 2022 г.
Стартап по анализу данных из Филадельфии сообщил в четверг, что он остановился на оценке в 4,2 миллиарда долларов в рамках раунда финансирования серии D на 222 миллиона долларов.
- ^ «точка зрения ДБТ» . Архивировано из оригинала 07.11.2021 . Проверено 7 ноября 2021 г.