Поток данных
В коммуникации, ориентированной на соединение , поток данных — это передача последовательности сигналов в цифровом кодировании для передачи информации . [1] Обычно передаваемые символы группируются в серию пакетов . [2]
Потоковая передача данных стала повсеместной. Все, что передается через Интернет , передается в виде потока данных. Использование мобильного телефона для разговора передает звук в виде потока данных.
Формальное определение
[ редактировать ]Формально поток данных — это любая упорядоченная пара. где:
- представляет последовательность кортежей собой и
- представляет собой последовательность положительных интервалов реального времени .
Содержание
[ редактировать ]Поток данных содержит разные наборы данных, которые зависят от выбранного формата данных.
- Атрибуты – каждый атрибут [3] потока данных представляет собой определенный тип данных, например идентификатор сегмента/точки данных, временную метку, геоданные.
- Атрибут Timestamp помогает определить, когда произошло событие.
- Идентификатор субъекта — это закодированный алгоритмом идентификатор, извлеченный из файла cookie .
- Необработанные данные включают информацию непосредственно от поставщика данных без обработки ни алгоритмом, ни человеком.
- Обработанные данные — это данные, которые были подготовлены [4] (каким-то образом измененным, проверенным или очищенным), чтобы использовать его для будущих действий.
Использование
[ редактировать ]Существуют различные области использования потоков данных:
- Обнаружение и оценка мошенничества — необработанные данные используются в качестве исходных данных для алгоритма борьбы с мошенничеством ( методы анализа данных для обнаружения мошенничества ). Например, временные метки, появление файлов cookie или анализ точек данных используются в системе оценки для обнаружения мошенничества или для проверки того, что получатель сообщения не является ботом (так называемый нечеловеческий трафик). [5] ).
- Искусственный интеллект – необработанные данные обрабатываются как набор поездов и набор тестов при искусственного интеллекта и машинного обучения . построении алгоритмов
- Необработанные данные используются для профилирования и персонализации для настройки профилей пользователей. [6] и разделите их для сегментации, например, по полу или местоположению (на основе точки данных ).
- Бизнес-аналитика – необработанные данные являются источником информации для систем BI, используемым для обогащения профилей пользователей подробной информацией о них, например, маршрутом покупки или геоданными. Эта информация используется для бизнес-анализа и прогнозных исследований.
- Таргетинг – данные, обработанные специалистами по данным, улучшают онлайн-кампании и используются для охвата целевой аудитории. [7]
- Расширение CRM – необработанные данные интегрируются с системой управления взаимоотношениями с клиентами . Интеграция CRM позволяет заполнить пробелы в профилях пользователей демографическими данными, интересами или покупательскими намерениями.
Интеграция
[ редактировать ]Основные интеграции с потоками данных:
- Потоки данных интегрируются с такими системами, как платформа данных клиентов (CDP), платформа управления взаимоотношениями с клиентами (CRM) или платформа управления данными (DMP), чтобы обогатить профили пользователей внешними данными. Расширить знания о существующих пользователях можно за счет использования внешних источников. [8]
- Потоки данных используются для обогащения систем бизнес-аналитики, повышения точности анализа и точности выводов.
- В случае интеграции системы управления контентом (CMS) Data Stream используется для идентификации пользователей и персонализации их посещения, даже если это первое. Благодаря анализу данных фактическое содержание веб-сайта адаптируется к пользователю.
- Потоки данных интегрированы с платформой спроса (DSP) в экосистеме программной рекламы. Стороны (например, рекламодатели) могут обмениваться идентификаторами пользователей и объединять с ними существующие профили.
- Потоки данных используются для выбора соответствующих сегментов пользователей (например, людей, интересующихся автомобильной промышленностью) и их использования в онлайн-кампании. Сегменты обогащаются дополнительными характеристиками пользователя из потока данных, а затем отправляются в DSP.
Источники данных видны
[ редактировать ]В потоке данных видно, какое устройство использовалось пользователем — это видно на пользовательском агенте :
- мобильный — когда пользователь использует мобильный браузер для просмотра, он имеет узкое разрешение экрана и версию мобильного приложения соответственно;
- рабочий стол — когда пользователь использует настольный браузер или версию приложения.
Следующая информация передается из используемого устройства:
- Фактический URL-адрес посещенного веб-сайта, на котором произошло событие.
- Пользовательский агент
- Геолокация
- Интернет-протокол (IP)
Форматы
[ редактировать ]Точка данных — это тег, который собирает информацию об определенном действии, выполняемом пользователем на веб-сайте. Точки данных существуют двух типов, значения которых используются для создания соответствующих аудиторий. Это:
- «событие» с информацией о возникновении конкретного события (например, щелчок по ссылке или показ рекламы)
- «атрибут» с числовыми или буквенно-цифровыми значениями.
Сегмент — это логический оператор, построенный на определенных точках данных с использованием операторов И, ИЛИ или НЕ. [9]
Гибридные данные — необработанные данные в форматах данных Point и Segment. [10]
URL-адреса – это набор информации о конкретном URL-адресе , который был посещен.
GDPR
[ редактировать ]Информация, собираемая с веб-сайтов, основана на поведении пользователей. Поставщики данных предоставляют как личную, так и неличную информацию. В потоке данных доступны два типа пользовательских данных:
- Информация, позволяющая установить личность (PII) – информация, позволяющая однозначно или в сочетании с данными методов идентификации идентифицировать человека. Примерами PII являются: страховой идентификатор, адрес электронной почты, номер телефона, IP-адрес , геолокация, биометрические данные . [11]
- Информация, не позволяющая установить личность (non-PII), — это информация, которую нельзя использовать для идентификации человека или отслеживания его местоположения. Файл cookie или идентификатор устройства являются примером отсутствия личных данных.
См. также
[ редактировать ]
Ссылки
[ редактировать ]- ^ федерального стандарта 1037C « Поток данных » . Архивировано из оригинала 13 апреля 2007 года . Проверено 4 апреля 2007 г.
- ^ «Поток данных» . techopedia.com . Архивировано из оригинала 24 апреля 2019 года . Проверено 24 апреля 2019 г.
- ^ «Атрибут» . businessdictionary.com . Архивировано из оригинала 24 апреля 2019 года . Проверено 24 апреля 2019 г.
- ^ «Что представляет собой обработка данных?» . ec.europa.eu . Архивировано из оригинала 24 апреля 2019 года . Проверено 24 апреля 2019 г.
- ^ «Торговля, не связанная с людьми [NHT]» . theonlineadvertisingguide.com . 7 июня 2017. Архивировано из оригинала 13 августа 2017 года . Проверено 24 апреля 2019 г.
- ^ «ПОВЕДЕНЧЕСКОЕ ПРОФИЛИРОВАНИЕ И ПЕРСОНАЛИЗАЦИЯ: ОПЫТ КЛИЕНТА НА ПЕРВОМ МЕСТЕ» . selligent.com . Архивировано из оригинала 24 апреля 2019 года . Проверено 24 апреля 2019 г.
- ^ «Что такое таргетинг – смысл» . selligent.com . Архивировано из оригинала 24 апреля 2019 года . Проверено 24 апреля 2019 г.
- ^ «Что такое поток данных и как его использовать» . На Audience.com . Архивировано из оригинала 24 апреля 2019 года . Проверено 24 апреля 2019 г.
- ^ «6 типов сегментации пользователей и их значение для вашего продукта» . uxdesign.cc . 12 июня 2018 г.
- ^ «Что такое гибридное управление данными» . IBM.com . 2 января 2018 года. Архивировано из оригинала 24 апреля 2019 года . Проверено 24 апреля 2019 г.
- ^ «Что такое информация, позволяющая установить личность (PII)? Как защитить ее в соответствии с GDPR» . csoonline.com . Архивировано из оригинала 24 апреля 2019 года . Проверено 24 апреля 2019 г.