SQLstream
Первоначальный выпуск | 2009 |
---|---|
Тип | Программное обеспечение |
Веб-сайт | www |
SQLstream — это распределенная платформа обработки потоков Java, соответствующая стандартам SQL. SQLstream, Inc. базируется в Сан-Франциско , Калифорния , и была запущена в 2009 году Дамианом Блэком, Эданом Кабачником и Джулианом Хайдом, автором Mondrian Relational OLAP Server Engine с открытым исходным кодом .
Лидерская позиция
[ редактировать ]AWS лицензию на подмножество SQLstream Blaze, своего флагманского пакета продуктов, В 2016 году SQLstream объявила, что передала Amazon для своего сервиса Kinesis Analytics, который обеспечивает потоковую передачу аналитических данных и преобразований в реальном времени для клиентов Amazon в потоки данных Kinesis. В том же году Forrester уже опубликовал отчет Wave о потоковой аналитике, поместив SQLstream в круг лидеров (их альтернативу магическому квадранту Gartner). в мире В том же году SQLstream также объявила, что Kontron, второй по величине поставщик встраиваемых систем , стандартизировал SQLstream Blaze для сбора, анализа данных IoT , действий в реальном времени и создания информационных панелей и встроен в IoT Gateways Kontron. SQLstream четвертый год подряд входит в список DBTA 100 (журнал «Тенденции баз данных и приложения»), который представляет собой список 100 компаний, которые имеют наибольшее значение в области данных. В том же году они объявили о выпуске Rubicon, публичной компании и лидера в области рекламы в реальном времени, которая будет предоставлять информацию в реальном времени об огромных объемах данных, сокращая задержку с трех часов с помощью Hadoop до почти реального времени и сокращая количество серверов, необходимых для проведения такой аналитики, со 180 до 12 серверов.
Технология
[ редактировать ]Быстрый рост объема доступных услуг, данных устройств и датчиков привел к появлению новых сегментов рынка, работающих в режиме реального времени, которые дополняют традиционные области мониторинга, бизнес-аналитики и хранения данных . [1] Интернет вещей обещает подключить к Интернету сотни миллиардов подключенных устройств, которые будут передавать потоковые данные, которые необходимо обрабатывать совокупно в режиме реального времени, чтобы обеспечить работу интеллектуальных сервисов, которые смогут реагировать и реагировать на окружающую среду через эти датчики. Системы анализа хранимых данных, в которых хранилище данных постоянно обновляется новыми поступающими данными и повторно просматривается по сохраненным данным для выполнения анализа данных, не масштабируются до очень больших объемов данных, передаваемых в Интернете вещей. Они не предназначены для выдачи запросов или анализа каждой из миллионов записей в секунду. Именно здесь на помощь приходят такие технологии, как SQLstream, которые обрабатывают данные постепенно и непрерывно, без предварительного сохранения данных. Такой подход называется потоковой обработкой. Вся эта информация была опубликована в публичных пресс-релизах.
SQLstream предоставляет платформу реляционной потоковой обработки под названием SQLstream Blaze для анализа больших объемов данных служб, датчиков, машин и файлов журналов в режиме реального времени. Он выполняет сбор, агрегацию, интеграцию, обогащение и анализ потоковых данных в реальном времени. Потоки данных анализируются с использованием стандартного языка SQL с использованием функционально богатой оконной функции SQL стандарта ANSI для анализа и агрегирования потоковых данных в реальном времени в фиксированных или скользящих временных окнах, которые могут быть дополнительно разделены с помощью определяемых пользователем ключей. В отличие от традиционного SQL-запроса РСУБД , который возвращает результат и завершается, потоковые SQL-запросы не завершаются, генерируя результаты непрерывно, как только становятся доступными новые данные. Шаблоны и события исключений в потоках данных обнаруживаются, анализируются и сообщаются «на лету» по мере поступления данных, то есть до их сохранения. Подобно базе данных или хранилищу данных, SQLstream позволяет создавать несколько представлений данных, чтобы каждый из разных приложений и пользователей мог получить собственное настраиваемое представление потоковых данных. Секционирование позволяет поэтапно вычислять множество различных аналитических данных с помощью одного оператора или окна SQL, эффективно обрабатывая потенциально миллионы потоков с помощью одного оператора. Например, разделение по идентификатору клиента будет поддерживать отдельные вычисления для каждого отдельного клиента. Это чрезвычайно лаконично, но также обеспечивает эффективное параллельное выполнение. SQLstream Blaze также позволяет вносить изменения в запросы и представления без остановки и перекомпиляции существующих приложений. Это очень важно для многих Интернета вещей и других интеллектуальных сервисов, которые должны работать круглосуточно и без выходных в режиме реального времени, где изменения в приложениях должны вноситься без необходимости отключать сервис или перестраивать приложение. Являясь частью SQLstream Blaze, StreamLab использует эту возможность, чтобы направлять пользователей, желающих исследовать потоки данных и понимать их структуру, пока данные все еще передаются, путем создания новых SQL-запросов на лету на основе указаний пользователя и анализа полученных значений данных. по правилам. Таким образом, он обеспечивает эффективную платформу для проведения оперативной аналитики в реальном времени, которую вы можете рассматривать как бизнес-аналитику в реальном времени поверх потоковой передачи оперативных данных. SQLstream использует технологию потоков данных для выполнения множества запросов к высокоскоростным большим объемам больших данных с помощью механизма SQL с массовым параллелизмом, соответствующего стандартам, где запросы выполняются одновременно и поэтапно. В отличие от баз данных, SQL в SQLstream становится языком для выполнения непрерывной параллельной обработки, в отличие от языка поиска данных, который обычно встречается в реляционных базах данных. SQLstream может выполнять свои запросы в оптимизированном режиме. C++ Многопоточный механизм потоков данных , работающий без блокировок . Это позволяет людям легко создавать приложения параллельной обработки без блокировок , которые в противном случае требуют специальных навыков, часто сложны в работе и часто подвержены ошибкам.
Приложения SQLstream Blaze включают управление данными служб и датчиков (Интернет вещей) в реальном времени, интеграцию данных в реальном времени, потоковую аналитику файлов журналов. и хранилище данных в реальном времени. [2] [3] SQLstream Blaze обеспечивает эффективный способ обработки больших объемов данных в режиме реального времени, позволяя широкому спектру интеллектуальных сервисов реагировать в режиме реального времени на потоковые данные даже при больших объемах данных.
Продукты
[ редактировать ]SQLstream выпустила свой первый продукт на рынок в январе 2008 года. Ее программное обеспечение для обработки потоков называется SQLstream Blaze и включает в себя s-Server, s-Studio, s-Dashboard, s-Visualizer и StreamLab. Он также имеет шаблоны приложений потоковой передачи, которые пользователи могут редактировать и расширять, и они известны как StreamApps. SQLstream имеет приложение Smart Cities StreamApp, приложение Telecom StreamApp и приложение StreamApp для служб экстренной помощи. На сайте также предлагаются профессиональные услуги по стратегии, сертификации и обучению.
См. также
[ редактировать ]- Оперативная разведка
- Извлечение, преобразование и загрузка (ETL)
- Беспроводная сенсорная сеть
- Интеллектуальные транспортные системы
- Бизнес-аналитика в режиме реального времени
Примечания
[ редактировать ]- ^ Слишком много, чудовищное количество данных The Economist
- ^ Отчет о SQLstream Рик ван дер Ланс, BeyeNetwork
- ^ Интервью с SQLstream Dashboard Insight.