Апач Самза
![]() | |
Оригинальный автор(ы) | |
---|---|
Разработчик(и) | Фонд программного обеспечения Apache |
Стабильная версия | 1.8.0 / 17 января 2023 г [1] |
Репозиторий | Репозиторий Самзы |
Написано в | Скала , Ява |
Операционная система | Кросс-платформенный |
Тип | Распределенная потоковая обработка |
Лицензия | Лицензия Апач 2.0 |
Веб-сайт | самза |
Apache Samza — это асинхронная вычислительная среда с открытым исходным кодом , работающая почти в реальном времени, для потоковой обработки, разработанная Apache Software Foundation на Scala и Java . Он был разработан совместно с Apache Kafka . Оба изначально были разработаны LinkedIn . [2]
Обзор
[ редактировать ]Samza позволяет пользователям создавать приложения с отслеживанием состояния , которые обрабатывают данные в режиме реального времени из нескольких источников, включая Apache Kafka.
Samza обеспечивает отказоустойчивость, изоляцию и обработку с сохранением состояния. В отличие от пакетных систем, таких как Apache Hadoop или Apache Spark , он обеспечивает непрерывные вычисления и вывод, что позволяет выполнять операции за доли секунды. [3] время ответа.
В области потоковой обработки в реальном времени работает множество игроков, и Samza является одним из зрелых продуктов. [4] [5] [6] Он был добавлен в Apache в 2013 году. [7] [ мертвая ссылка ]
Samza используется несколькими компаниями. [8] Самая большая установка — в LinkedIn.
См. также
[ редактировать ]- Апачский луч
- Druid (хранилище данных с открытым исходным кодом)
- Список проектов Apache Software Foundation
- Шторм (обработчик событий)
Ссылки
[ редактировать ]- ^ «Анонсируем выпуск Apache Samza 1.8.0» . Проверено 28 марта 2024 г.
- ^ «Как LinkedIn использует Apache Samza» . ИнфоQ . Проверено 28 сентября 2016 г.
- ^ «Samza: масштабируемая потоковая обработка с отслеживанием состояния в LinkedIn» (PDF) .
- ^ «Spark Streaming против Flink против Storm против Kafka Streams против Samza: выберите свою платформу обработки потоков» . www.linkedin.com . Проверено 23 июля 2019 г.
- ^ «Сравнение движков потоковой обработки Apache Spark, Storm, Flink и Samza — Часть 1» . Скотт Логик . Проверено 23 июля 2019 г.
- ^ «Hadoop, Storm, Samza, Spark и Flink: сравнение инфраструктур больших данных» . Цифровой Океан . Проверено 23 июля 2019 г.
- ^ «Апач Самза» . блоги.apache.org . Проверено 23 июля 2019 г.
- ^ «Самза — При поддержке» . Samza.apache.org . Проверено 23 июля 2019 г.
Внешние ссылки
[ редактировать ]- Программное обеспечение LinkedIn
- Проекты Apache Software Foundation
- Бесплатное программное обеспечение, написанное на Java (языке программирования).
- Бесплатное программное обеспечение, написанное на Scala.
- Программное обеспечение, использующее лицензию Apache
- Распределенная потоковая обработка
- Распределенная вычислительная архитектура
- Параллельные вычисления