Революция социальных данных
Революция социальных данных — это сдвиг в моделях человеческого общения в сторону увеличения обмена личной информацией и связанных с этим последствий, ставший возможным благодаря развитию социальных сетей в начале 2000-х годов. Это явление привело к накоплению беспрецедентных объемов общедоступных данных . [1]
Этот большой и часто обновляемый источник данных был описан как новый тип научного инструмента для социальных наук. [2] Несколько независимых исследователей использовали социальные данные для «краткосрочного прогнозирования» и прогнозирования таких тенденций, как безработица, вспышки гриппа, [3] настроение целого населения, [4] расходы на поездки и политические мнения таким образом, который будет быстрее, точнее и дешевле, чем стандартные правительственные отчеты или опросы Gallup . [2]
Социальные данные — это данные, которые создают люди и которыми они сознательно и добровольно делятся. Ранее затраты и накладные расходы делали эту полупубличную форму общения невозможной, но достижения в области технологий социальных сетей в 2004–2010 годах сделали возможными более широкие концепции обмена информацией. [5] Типы данных, которыми делятся пользователи, включают геолокацию , медицинские данные, [6] предпочтения в сфере знакомств, открытые мысли, интересные новостные статьи и т. д.
Революция социальных данных позволяет не только создавать новые бизнес-модели, подобные тем, что представлены на Amazon.com, но также открывает большие возможности для улучшения процесса принятия решений в области государственной политики и международного развития . [7]
Анализ больших объемов социальных данных приводит к области вычислительной социальной науки . Классические примеры включают изучение медиаконтента. [8] или контент социальных сетей. [3] [4] [9]
социальных Эволюция данных
Каждое действие в Интернете оставляет после себя следы данных ( цифровой след ), которые можно использовать, чтобы узнать больше о пользователе. [10] Поскольку использование Интернета становится все более распространенным, обработка данных в мире быстро прогрессирует: в настоящее время в год создается около 16 зеттабайт данных, а к 2025 году ожидается 163 зеттабайта данных. [11] Это привело к тому, что данные стали критически важным товаром. [10] Это объединяет всех участников общества: государственные учреждения, частные фирмы, а также отдельных лиц, каждый из которых по-своему полагается на данные.
Правительства веками собирали данные , чтобы обеспечить продолжение институциональных систем, ограничивая риск невозврата кредитов, собирая налоги на основе дохода и обеспечивая необходимую инфраструктуру с учетом демографического распределения своих граждан. [12] Вначале эти данные представляли собой письменную информацию для ведения учета и контроля, включая систему переписи населения. [12]
Этот аналоговый процесс был очень трудоемким и дорогостоящим, оставляя мало места для интерпретации более крупных наборов данных. [12] Между тем, корпоративные технологические разработки перенесли эти офлайн-данные в эпоху цифровых технологий, сделав возможным их визуализацию и анализ. [12] [10] В общественной сфере соединение методологий опросов и опросов с вычислениями в базе данных привело к возможности собирать и хранить большие наборы данных о людях. [10]
Web 2.0 и сетей сайты социальных
За последние несколько десятилетий Интернет перешел от использования в основном как источника информации о мире к использованию в основном для общения, создания пользовательского контента, обмена данными и создания сообщества . [13] Это то, что многие считают развитием « Web 2.0 ». Сайты социальных сетей, такие как Facebook и YouTube, являются основой развития Web 2.0 и перехода к обмену социальными данными. [13]
Ранними примерами веб-сайтов социальных данных являются Craigslist и списки желаний Amazon.com . Оба позволяют пользователям передавать информацию всем, кто ее ищет. Они различаются своим подходом к идентичности . Craigslist использует возможности анонимности, а Amazon.com использует возможности постоянной идентификации, основанной на истории сотрудничества клиента с фирмой. Рынок труда даже формируется под влиянием информации, которую люди делятся о себе на таких сайтах, как LinkedIn и Facebook. [14]
Примерами более сложных сайтов социальных данных являются Twitter и Facebook. В Twitter отправить сообщение или твит так же просто, как отправить текстовое сообщение SMS. Twitter создал этот C2W, клиент для всего мира: любой твит, который отправляет пользователь, потенциально может быть прочитан всем миром. Facebook фокусируется на взаимодействии между друзьями, C2C на традиционном языке. Он предоставляет множество способов сбора данных от своих пользователей: « отметить » друга на фотографии, «прокомментировать» то, что он опубликовал, или просто «поставить лайк». Эти данные являются основой для сложных моделей взаимоотношений между пользователями. Их можно использовать для существенного повышения релевантности того, что показывается пользователю, и в рекламных целях. [15]
К 2009 году популярность социальных сетей выросла в четыре раза по сравнению с 2005 годом. [16] По состоянию на 2013 год Twitter насчитывает более 250 миллионов пользователей, которые публикуют почти 500 миллионов твитов в день, а Facebook насчитывает более одного миллиарда пользователей по всему миру. [17]
-сектор и Бизнес данные социальные
Компании часто используют данные, которые передаются через сайты социальных сетей и другие формы обмена данными, рекламодателей и т. д. [18] Сайты социальных сетей, например, могут продавать пользовательские данные рекламодателям и другим организациям, которые затем могут влиять на решения потребителей. [13] интеллектуальный анализ данных . Для сбора этой информации также используется [18]
Хотя веб-сайты и другие приложения были истоками сбора данных, с развитием технологий многие устройства, используемые в повседневной жизни, имеют возможность собирать данные о людях и, следовательно, увеличивают объем доступных личных данных (например, смартфоны). , технические часы, музыкальные устройства и т. д.). [19] [20]
людей Этот рост цифровой идентичности – информации, доступной через эти электронные источники – используется компаниями и организациями для улучшения продуктов и услуг и снижения затрат путем ориентации на то, чего хотят/ожидают потребители. [20] Собираемые данные могут включать в себя опыт покупок, предпочтения в социальных сетях, демографическую информацию и многое другое. [18]
Использование этих данных может позволить лучше персонализировать продукты и стало ожидаемым и жизненно важным аспектом использования и производства продуктов. [19] Доступные данные о потребителях можно использовать для определения моделей поведения потребителей. [21] Например, информация о местоположении используется для оценки того, когда и где потребители будут ориентироваться на рекламу и рекламные акции в зависимости от того, в какие магазины они идут. [21] Интернет-магазины также получили представление о том, как лучше персонализировать процесс онлайн-покупок с помощью данных, собранных во время онлайн-транзакций. [22]
Предприятия могут даже использовать данные о потребителях, чтобы определить, влияет ли различное расположение продуктов на полках на решения потребителей о покупке, а также оценить потенциальный потенциал перекрестного маркетинга на основе товаров, которые часто покупаются вместе. [23]
Социальная коммерция [ править ]
Хотя предприятия и рекламодатели часто используют имеющиеся данные о потребителях, потребители также используют информацию других пользователей для принятия решений о покупке. Сайты социальной коммерции — это места, где потребители делятся опытом, мнениями и мнениями о продуктах/услугах, а также другой информацией. [24] Известным примером такого сайта является Pinterest , у которого более 100 миллионов пользователей. [24] Эти сайты и другие онлайн-источники информации о продуктах/брендах влияют на решения потребителей о покупке. [25] По оценкам, около 67% онлайн-покупателей используют эту информацию при принятии решения о покупке. [24] Эти сайты создают среду, которая пользуется доверием потребителей, поскольку информация поступает от других потребителей. [24]
социальных использование данных Другое
Учитывая огромное количество доступных данных о людях, потенциальные возможности использования этой информации растут.
Сектор здравоохранения имеет множество потенциальных применений для этих данных. Информация, собранная из социальных сетей и других источников обмена социальными данными, может использоваться для прогнозирования гриппа, вспышек заболеваний, реагирования на чрезвычайные ситуации и многого другого. [26] Используя Twitter и геотеги , медицинские исследователи могут оценить состояние здоровья конкретного района и использовать эту информацию для улучшения охвата населения и предоставления услуг. [26] Компания Medtronic разработала цифровой глюкометр, который позволяет медицинским работникам и пациентам узнавать о низком уровне глюкозы. [19]
Социальные данные также можно использовать для оценки реакции на кризисы. [27] После урагана «Сэнди » исследователи использовали Twitter, чтобы оценить эмоции и проблемы, с которыми столкнулись пострадавшие. [27] Эта информация потенциально может быть использована для лучшей подготовки и реагирования на будущие кризисы.
Эти данные могут быть использованы для помощи в городском планировании. Город Бостон использовал информацию о пассажирах от Uber для улучшения планирования перевозок и содержания дорог. [19]
социальная Вычислительная наука
Использование социальных данных в исследовательских целях привело к развитию вычислительной социальной науки. Вычислительная социальная наука сочетает в себе социальные науки, информатику и сетевую науку. [28] Это направление появилось в 2009 году. [29] До появления социальных данных и технологических достижений, которые их поддерживали, исследователи были ограничены узким взглядом на информацию, основанную на отдельных людях, поскольку их основная форма исследования основывалась на интервью. [29] Благодаря огромному количеству социальных данных, доступных сегодня, исследователи теперь могут анализировать более широкую группу и получать более широкое представление об информации. Они могут использовать социальные сети, данные мобильных телефонов и проводить онлайн-эксперименты, которые позволяют им собирать больше информации, чем раньше. [29]
Проблемы конфиденциальности [ править ]
Учитывая количество данных о людях, доступных из многих источников, конфиденциальность стала серьезной проблемой. Нарушения безопасности клиентской и другой социальной информации, такие как компрометация Home Depot. данных кредитных карт более 56 миллионов клиентов [19] повлияли на проблему конфиденциальности социальных данных. То, как компании используют собранную личную информацию и возможные неправомерные случаи ее использования, вызывает беспокойство у большинства потребителей. [19] [20] Несмотря на это, многие люди не знают, как сайты социальных сетей и другие источники используют и продают их данные. [30] В исследовании 2014 года только 25% онлайн-пользователей знали, что к их местоположению можно получить доступ, и только 14% знали, что к их истории веб-серфинга можно получить доступ и поделиться ею. [19]
Несмотря на то, что забота о конфиденциальности является решающим фактором в обмене людьми личной информацией в Интернете и в общей активности в Интернете, [22] большинство людей готовы поделиться этой информацией, если выгоды от этого перевешивают потенциальные затраты на конфиденциальность и безопасность. [18] [20] Потребители наслаждаются персонализацией продуктов и услуг, которая становится возможной благодаря этому сбору информации, и, несмотря на опасения, продолжают их использовать. [19]
развитие Международное
«С макроэкономической точки зрения ожидается, что принятие решений на основе больших данных окажет такое же положительное влияние на эффективность и производительность, как ИКТ в последнее десятилетие».
- Гильберт 2013 г.
В своем исследовании революции данных в международном развитии профессор социальных наук Калифорнийского университета в Дэвисе Мартин Хилберт утверждал, что естественным следующим шагом после развития информационных обществ , подпитываемых ИКТ , начиная с конца 1990-х годов, станут общества знаний, основанные на анализе больших данных . Принятие решений на основе анализа больших данных повысило эффективность и производительность труда в развитых странах. Гилберт исследует проблемы и потенциал информационной революции в «неуправляемом мире международного развития». [7]
Типы данных [ править ]
Хилберт выделил четыре типа данных, доступных в больших количествах к 2013 году: слова, местоположения, природа и поведение. [7]
Слова [ править ]
Индивидуальное взаимодействие с Интернетом, такое как слова в комментариях, публикации в социальных сетях и объемы поисковых запросов Google, предоставляют все более обширный источник больших данных. Обычно статистические данные собираются посредством переписи населения или вероятностного обследования, например, Ежегодного социального и экономического приложения (ASEC), Текущего обследования населения (CPS), Американского общественного опроса (ACS), Национального опроса о состоянии здоровья (NHIS) в Соединенных Штатах. или административные записи, такие как заработная плата, безработица, подоходные налоги на социальное обеспечение, данные сканера и данные кредитных карт, а также другие записи коммерческих транзакций. [31]
«Google проанализировал группы поисковых запросов по регионам США, чтобы предсказать вспышки гриппа быстрее, чем это было возможно, используя записи о госпитализациях».
- Шоу, 2014 г. «Почему «большие данные» имеют большое значение»
Профессор Университета Уэзерхед Гэри Кинг описал, что революция заключается не только в количестве доступных данных, но и в способности делать что-то с этими данными на благо общества. [32]
Местоположение [ править ]
глобальной системы позиционирования Мобильные планшеты, телефоны с поддержкой (GPS), чипы радиочастотной идентификации (RFID) (часть технологий автоматической идентификации и сбора данных (AIDC)), телематика , игры на основе определения местоположения и т. д. предоставляют данные об абсолютном местоположении и относительное движение.
Природа [ править ]
Гильберт относит данные о естественных процессах к разделу «Природа», который включает датчики, предоставляющие данные о влажности воздуха и температуре. [7]
Поведение [ править ]
Данные могут быть получены на основе поведения пользователей в многопользовательских онлайн-играх . [7] такие как League of Legends , World of Warcraft , Minecraft , Call of Duty и Dota 2 . Натан Игл , ученый-компьютерщик из Института Санта-Фе в Нью-Мексико, начал использовать мобильные телефоны в начале 2000-х годов для сбора точных и крупномасштабных данных о реальных социальных взаимодействиях. [33] [34] [35] Проект был назван одной из «10 технологий, которые, скорее всего, изменят наш образ жизни» по версии журнала MIT Technology Review . [36]
См. также [ править ]
- Большие данные
- Цифровая революция
- Открытые данные
- Механизм рекомендаций
- Система репутации
- Социальный бот
- Социальный капитал
- Социальные облачные вычисления
- Анализ социальных данных
- Социальный граф
- Социальное профилирование
- Социальные технологии
Ссылки [ править ]
- ^ Вейгенд, Андреас. «Революция социальных данных» . Гарвардское деловое обозрение . Проверено 15 июля 2009 г.
- ↑ Перейти обратно: Перейти обратно: а б Хаббард, Дуглас (2011). Pulse: новая наука об использовании интернет-шумов для отслеживания угроз и возможностей . Джон Уайли и сыновья.
- ↑ Перейти обратно: Перейти обратно: а б Василиос Лампос; Нелло Кристианини (2012). «Прогнозирование событий текущей погоды из социальной сети с помощью статистического обучения». Транзакции ACM в интеллектуальных системах и технологиях . 3 (4): 1–22. дои : 10.1145/2337542.2337557 . S2CID 8297993 . 72.
- ↑ Перейти обратно: Перейти обратно: а б Томас Лансдалл-Благосостояние; Василиос Лампос; Нелло Кристианини (август 2012 г.). «Сейчас прогнозируем настроение нации». Журнал «Значимость» . Том. 9, нет. 4. С. 26–28. дои : 10.1111/j.1740-9713.2012.00588.x .
- ^ Свати Дхаршана Найду (декабрь 2009 г.). «Революция социальных данных» . Плакатный . Проверено 8 июля 2010 г.
- ^ Дайсон, Эстер (23 марта 2010 г.). «Здоровье, а не здравоохранение!» . Хаффингтон Пост . Проверено 8 июня 2010 г.
- ↑ Перейти обратно: Перейти обратно: а б с д и Гильберт, Мартин (2013). «Большие данные для развития: от информации к обществу знаний». Научная статья SSRN (2205145). Рочестер, штат Нью-Йорк: Сеть исследований в области социальных наук . ССНН 2205145 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Обнаружение макропаттернов в глобальном медиаконтенте.
- ^ Настроение в Твиттере: влияние рецессии на общественное настроение в Великобритании.
- ↑ Перейти обратно: Перейти обратно: а б с д Уэст, Сара Майерс (2017). «Капитализм данных: новое определение логики наблюдения и конфиденциальности». Бизнес и общество : 1–22.
- ^ Кейв, Эндрю (13 апреля 2017 г.). «Что мы будем делать, когда объем мировых данных достигнет 163 зеттабайт в 2025 году?» . Форбс . Проверено 30 мая 2018 г.
- ↑ Перейти обратно: Перейти обратно: а б с д Майер-Шенбергер, Виктор; Кукиер, Кеннет (2013). Большие данные: революция, которая изменит то, как мы живем, работаем и думаем . Лондон, Великобритания: Джон Мюррей (издатели).
- ↑ Перейти обратно: Перейти обратно: а б с Фукс, Кристиан. 2011. «Web 2.0, предложение и наблюдение». Наблюдение и общество 8 (3): 288-309.
- ^ Рид Хоффман (26 июня 2009 г.). «Будущее рабочих мест и революция социальных данных» . Techaffair.com . Проверено 2 июля 2010 г.
- ^ Дайсон, Эстер (11 февраля 2008 г.). «Грядущая рекламная революция» . Уолл Стрит Джорнал . Проверено 10 апреля 2010 г.
- ^ Донде, Дипа С., Чопаде, Неха и Ранджит, П.В. 2012. «Социальные сети: новая эра 21 века». Журнал SIES Journal of Management 8 (1): 66-73.
- ^ Осатуйи, Бабаджиде. 2013. «Обмен информацией в социальных сетях». Компьютеры в поведении человека 29 (6): 2622-2631.
- ↑ Перейти обратно: Перейти обратно: а б с д Джай, Тун-Мин и Кинг, Нэнси Дж. 2016. «Конфиденциальность или вознаграждение: повышают ли программы лояльности готовность потребителей делиться личной информацией со сторонними рекламодателями и брокерами данных?» Журнал розничной торговли и потребительских услуг 28: 296-303.
- ↑ Перейти обратно: Перейти обратно: а б с д и ж г час Мори, Тимоти, Форбат, Теодор и Шуп, Эллисон. 2015. «Данные клиентов: проектирование для прозрачности и доверия». Гарвардский бизнес-обзор 93 (5): 96-105.
- ↑ Перейти обратно: Перейти обратно: а б с д Ребер, Бьорн; Резе, Олаф; Норрек, Роберт; Томсен, Бенджамин (2015). «Личные данные: как контекст влияет на обмен данными потребителей с организациями из различных секторов». Электронные рынки . 25 (2): 95. дои : 10.1007/s12525-015-0183-0 . S2CID 28025341 .
- ↑ Перейти обратно: Перейти обратно: а б Смит, Наташа. 2015. «Датафикация маркетинга». Новости ДМ: 16+. Получено с http://go.galegroup.com/.
- ↑ Перейти обратно: Перейти обратно: а б Ли, Сынсин; Ли, Ёнхи; Ли, Присоединение; Пак, Чонгун (2015). «Персонализированные электронные услуги: забота о конфиденциальности потребителей и обмен информацией». Социальное поведение и личность . 43 (5): 729. дои : 10.2224/сбп.2015.43.5.729 .
- ^ Цай, Цзе-Юань; Хуан, Шэн-Сян (2014). «Подход к интеллектуальному анализу данных для оптимизации распределения полочного пространства с учетом покупательского поведения и поведения покупателей». Международный журнал производственных исследований . 53 (3): 850. doi : 10.1080/00207543.2014.937011 . S2CID 110688389 .
- ↑ Перейти обратно: Перейти обратно: а б с д Лю, Либо, Ченг, Кристи МК и Ли, Мэтью КО, 2016. «Эмпирическое исследование поведения при обмене информацией на сайтах социальной коммерции». Международный журнал управления информацией 36 (5): 686-699.
- ^ Чен, Цзе, Дэн, Лефа, Ю, Ин и Ю, Ксир. 2016. «Влияние онлайн-источников информации на покупательские намерения между потребителями с высокой и низкой восприимчивостью к информационному влиянию». Журнал бизнес-исследований 69 (2): 467-475.
- ↑ Перейти обратно: Перейти обратно: а б Нгуен, Дюк Т. и Юнг, Джай Э. 2016. «Обнаружение событий в реальном времени для онлайн-поведенческого анализа больших социальных данных». Компьютерные системы будущего поколения 66: 137-145.
- ↑ Перейти обратно: Перейти обратно: а б Спенс, Патрик Р., Лаклан, Кеннет А. и Рейнир, Адам М. 2016. «Социальные сети и кризисные исследования: сбор данных и направления». Компьютеры в поведении человека 54: 667-672.
- ^ Чанг, Р.М., Кауфман, Р.Дж., и Квон, Ю. 2014. Понимание сдвига парадигмы в сторону вычислительной социальной науки в присутствии больших данных. Решение, 63 , 67-80.
- ↑ Перейти обратно: Перейти обратно: а б с Манн, А. 2016. Основная концепция: вычислительная социальная наука. ПНАС, 113 (3). 468-470. дои: 10.1073/pnas.1524881113
- ^ Лилли, Стивен, Фрэнсис С. Гродзински и Андра Гамбус. 2012. «Выявление коммерциализированного и послушного пользователя Facebook». Журнал информации, коммуникации и этики в обществе 10 (2): 82-92
- ^ «Методология исследования» (PDF) , StatsCan , 19 декабря 2014 г. , получено 19 декабря 2013 г.
- ^ Шоу, Джонатан (март 2014 г.), «Почему «большие данные» имеют большое значение: информатика обещает изменить мир» , журнал Harvard Magazine , получено 23 декабря 2016 г.
- ^ Новости природы, апрель 2009 г.
- ^ Загрузки Reality Mining
- ^ Технический документ по майнингу реальности
- ^ Гарвардская биография Орла