Jump to content

Социальная наука о данных

Социальная наука о данных — это междисциплинарная область, которая решает проблемы социальных наук путем применения или разработки вычислительных и цифровых методов . Как следует из названия, Social Data Science находится в основном в сфере социальных наук , но опирается на технические достижения в таких областях, как наука о данных , сетевая наука и информатика . Данные в области социальных данных всегда касаются людей и происходят из социальных явлений, и это могут быть структурированные данные (например, опросы ) или неструктурированные данные (например, цифровые следы ). Целью науки о социальных данных является получение новых знаний о социальных сетях , человеческом поведении , культурных идеях и политических идеологиях . Специалист по социальным данным сочетает знания предметной области и специализированные теории социальных наук с навыками программирования , статистики и другого анализа данных .

В науке о социальных данных используется широкий спектр количественных методов — как устоявшиеся методы в социальных науках , так и новые методы, разработанные в информатике и междисциплинарных областях науки о данных, таких как обработка естественного языка (НЛП) и сетевые науки . Социальная наука о данных тесно связана с вычислительной социальной наукой , но иногда включает в себя качественные данные и смешанные цифровые методы. [1] [2] [3] [4]

Общие методы науки о социальных данных включают:

Количественные методы :

Качественные методы :

Смешанные цифровые методы :

Одним из столпов науки о социальных данных является сочетание качественных и количественных данных для анализа социальных явлений и разработки теорий, обоснованных с помощью вычислений. [18] [19] Например, используя смешанные методы [20] оцифровывать качественные данные и анализировать их с помощью вычислительных методов или путем качественного анализа и интерпретации количественных данных. [21]

Специалисты по социальным данным используют как оцифрованные данные, так и [22] (например, старые книги, которые были оцифрованы) и изначально цифровые данные (например, сообщения в социальных сетях). [23] Поскольку такие данные часто принимают форму найденных данных, которые изначально были созданы для других целей (коммерческих, управленческих и т. д.), чем исследования, сбор данных, очистка и другие формы предварительной обработки и интеллектуального анализа данных занимают существенную часть работы специалиста по социальным данным. .

Источники данных SDS включают:

Отношения с другими областями

[ редактировать ]

Социальные науки

[ редактировать ]

Наука о социальных данных является частью социальных наук наряду с устоявшимися дисциплинами ( антропология , экономика , политология , психология и социология ) и новыми междисциплинарными областями, такими как поведенческая наука , криминология , международные отношения и когнитивная наука . Таким образом, его основной единицей исследования являются социальные отношения, человеческое поведение и культурные идеи, которые он исследует, используя количественные и / или качественные данные и методы для разработки, проверки и улучшения фундаментальных теорий, касающихся природы человеческого существования. SDS также отличается от традиционной социальной науки по двум причинам.

  1. Во-первых, его основным объектом являются оцифрованные явления и данные в самом широком смысле этого слова, начиная от оцифрованных текстовых корпусов и заканчивая следами, собираемыми цифровыми платформами и датчиками. [24] [25]
  2. Во-вторых, наука о социальных данных не просто применяет существующие количественные и качественные методы социальных наук , а стремится развивать и разрушать их посредством импорта и интеграции современных методов науки о данных. [26]

Наука о данных

[ редактировать ]

Социальная наука о данных — это форма науки о данных , в которой применяются передовые вычислительные методы и статистика для получения информации и понимания данных. [27] [28] Исследователи социальных данных часто используют методы, разработанные учеными-данными , такие как интеллектуальный анализ данных и машинное обучение , которое включает, помимо прочего, извлечение и обработку информации из источников больших данных . В отличие от более широкой области науки о данных, которая включает в себя любое применение и исследование, включающее комбинацию вычислительных и статистических методов, наука о социальных данных в основном касается научного изучения цифровых социальных данных и / или цифровых следов человеческого поведения.

Вычислительная социальная наука

[ редактировать ]

Как и вычислительная социология , наука о социальных данных использует методы науки о данных для решения проблем социальных наук. Это включает в себя повторное присвоение и усовершенствование методов, разработанных учеными, работающими с данными, чтобы лучше соответствовать вопросам и данным социальных наук, а также их специализированным знаниям и теориям. [29] [30] В отличие от вычислительной социальной науки, наука о социальных данных также включает критические исследования того, как цифровые платформы и вычислительные процессы влияют на общество в целом, а также того, как вычислительные и невычислительные подходы интегрируются и сочетаются.

Цифровые методы

[ редактировать ]

В то время как большинство исследователей социальных данных тесно связаны с вычислительными социальными науками или являются их частью, некоторые ученые, ориентированные на качественные социальные данные, находятся под влиянием областей цифровых гуманитарных наук и цифровых методов. [31] [32] которые возникли в результате исследований науки и технологий (STS). Как и в случае с цифровыми методами, цель состоит в том, чтобы перепрофилировать «методы среды» для изучения общества, опосредованного цифровыми технологиями, и участвовать в постоянных дискуссиях о предвзятости в науке и обществе, приводя в диалог вычислительную социальную науку и цифровые методы. SDS также связана с цифровой социологией. [33] и цифровая антропология , но в большей степени стремится дополнить качественные данные и цифровые методы современными методами науки о данных.

История поля

[ редактировать ]

Зарождение термина «наука о социальных данных» совпало с появлением ряда исследовательских центров и образовательных программ. [34] [35] [36] В 2016 году в Копенгагенском университете был открыт Копенгагенский центр социальных данных (SODAS) — первое академическое учреждение, использующее название SDS. План междисциплинарного центра, работающего на стыке социальных и вычислительных наук, был основан на Копенгагенском исследовании сетей. [37] [38] [39] [40] с 2011-2016 годов исследователями Датского технического университета (DTU) и Копенгагенского университета . и Оксфордский университет Копенгагенский университет были одними из первых исследовательских учреждений, предложивших программы получения степени в области SDS. В 2018 году Оксфордский университет открыл годичную программу магистратуры в области социальных данных. [41] за которым последовала двухлетняя магистерская программа в Копенгагенском университете в 2020 году. [42] [43] С тех пор все большее число университетов начало предлагать последипломные программы или специализации в области социальных данных.

Наука о социальных данных возникла после увеличения доступности оцифрованных социальных данных, иногда называемых большими данными , и возможности применять вычислительные методы к этим данным с низкими затратами, что открыло новые возможности для решения вопросов о социальных явлениях и человеческом поведении. . Хотя происхождение социальных данных можно проследить до 1890-х годов (когда в ходе переписи населения США было обработано около 15 миллионов индивидуальных записей в форме перфокарт ), бум социальных данных в XXI веке является прямым следствием растущей доступности социальных данных. потребительские данные, возникшие в результате появления электронной коммерции [44] Последующие волны доступности неструктурированных социальных данных включают систему обзора Amazon.com и Википедию, а в последнее время и социальные сети , которые сыграли ключевую роль в появлении экономики цифрового внимания и больших технологий .

Критика и дебаты

[ редактировать ]

Ученые, работающие с данными, сыграли жизненно важную роль в революции данных, как на первоначальном этапе технического оптимизма, когда большие данные и Интернет рассматривались как решение многих социальных и научных проблем, так и в качестве участников. [45] [46] [47] в результате технологического скандала, который последовал за этим, среди прочего, из -за скандала с данными Facebook и Cambridge Analytica . Исследователи и исследовательские проекты в области социальных данных оказали особое влияние на дебаты и критику вокруг:

Влияние и примеры

[ редактировать ]

Исследования в области социальных данных обычно публикуются в междисциплинарных журналах, в том числе в ведущих журналах общего профиля Science , Nature и PNAS , а также в известных специализированных журналах, таких как:

Кроме того, исследования в области социальных данных публикуются в ведущих отраслевых журналах по социальным наукам, включая American Sociological Review , Psychoological Science , American Economic Review , Current Anthropology .

Образовательные и исследовательские учреждения

[ редактировать ]

Существует множество конкретных определений науки о социальных данных, но несколько учреждений по всему миру в настоящее время предлагают научные и исследовательские программы под рубрикой «Наука о социальных данных».

Образование

[ редактировать ]

Исследовать

[ редактировать ]

Профессии и отрасль

[ редактировать ]

Специалисты по социальным данным пользуются большим спросом в обществе. [73] специально для работодателей, ценящих междисциплинарные навыки, и их можно найти в качестве:

  • 1. Исследователи отрасли: Типичные рабочие места: правительства, компании и корпорации, независимые исследовательские институты, фонды, НПО. Типичные названия: исследователь, менеджер данных, управляющий данными, специалист по данным, инженер данных, консультант, менеджер, директор, партнер, политики, аналитик данных, разработчик программного обеспечения, BI, UX, UI.Исследователь.
  • 2. Научные исследователи: к.т.н. Студенты, исследователи, постдоки, профессора
  • 3. Предприниматели: начните свой собственный бизнес, используя методы науки о социальных данных для решения реальных социальных проблем. Типичные должности: технический директор, генеральный директор, главный специалист по данным.

Подотрасли

[ редактировать ]

Наука о социальных данных по-прежнему является новой областью с развивающимися направлениями. В общих чертах эту область можно разделить на ряд подполей, основанных на методах:

Подполя на основе метода

[ редактировать ]
  • Сетевая наука: сетевой анализ часто используется для визуализации или изучения сетевой динамики в исследованиях социальных данных. Сюда входят, например, социальные сети.
  • Смешанные цифровые методы: при компьютерном качественном анализе исследователь часто использует вычислительные методы, такие как методы обработки естественного языка или тематическое моделирование, для изучения корпуса текста, например парламентских речей или данных Твиттера.
  • Машинное обучение для причинно-следственных выводов. Социальные науки часто интересуются поиском причинно-следственных связей между переменными. Это представляет особый интерес для науки о социальных данных, где различные области исследований пытаются найти соответствующие политические ответы на современные социальные проблемы. Часто, опираясь на исследования Джуди Перлса, метод ациклических графов и причинно-следственная модель Неймана-Рубина позволяют определить, существует ли причинно-следственная связь между двумя (или более) переменными. Кроме того, большой интерес представляет включение машинного обучения в причинно-следственную связь.
  • Обработка естественного языка. Прикладная обработка естественного языка — это адаптация и перепрофилирование методов обработки естественного языка и применение этих методов к вопросам социального поведения.
  • Алгоритмическая предвзятость и справедливость. Учитывая, что алгоритмы играют еще большую роль в повседневной жизни людей, изучение справедливости в этом контексте разросло как область. Особенно независимо от того, оказывают ли эти алгоритмы негативное или положительное влияние на мини-группы.
  • Поляризация и дезинформация. Многие ученые используют огромные объемы детальных данных, генерируемых социальными сетями и политическими агентами, для изучения социального заражения, распространения дезинформации и дезинформации. В этих исследованиях часто используются текстовые сообщения или взаимодействие в социальных сетях, чтобы изучить, как политики и/или общественность ведут себя и взаимодействуют на цифровой и физической арене.
  • Наука о климатических социальных данных: пересечение науки о климате и цифровых (поведенческих) данных. Это включает в себя климатическую активность в социальных сетях и использование цифровых данных для изучения того, как повышение температуры влияет на людей и общества (CITE: Rising Climate Erode Human Sleep Global).
  1. ^ Лазер, Д. и др. (2009). Вычислительная социальная наука. Наука, 323(5915), 721-723.
  2. ^ Чоффи-Ревилла, К. (2014). Введение в вычислительную социальную науку. Спрингер Лондон. https://doi.org/10.1007/978-1-4471-5661-1 .
  3. ^ Имаи, К. (2018). Количественная социальная наука: введение. Издательство Принстонского университета
  4. ^ Велтри, Джорджия (2019). Цифровые социальные исследования. Политическая пресса.
  5. ^ Гриммер Дж., Робертс М.Э. и Стюарт Б.М. (2022). Текст как данные: новая основа машинного обучения и социальных наук. Издательство Принстонского университета.
  6. ^ Нипперт-Энг, К. (2015). Внимательно наблюдая: Руководство по этнографическим наблюдениям. Издательство Оксфордского университета.
  7. ^ Вентурини, Т. и Мунк, АК (2022). Картирование противоречий: практическое руководство. Кембридж: Политическая пресса
  8. ^ Форд, Х. (2014). Большие данные и маленькие: сотрудничество этнографов и специалистов по данным. Большие данные и общество 1(2)
  9. ^ Блок А. и Педерсен М.А. (2014). Дополнительная социальная наука? Качественно-количественные эксперименты в мире больших данных. Большие данные и общество 1 (2): 1–6.
  10. ^ Мунк А.К. (2019) Четыре стиля качественно-количественного анализа: понимание нового скандинавского кулинарного движения в сети. Обзор Nordicom 40 (1): 159–176
  11. ^ Моутс, Д. и Борра, Э. (2018) Качественно-количественные методы за пределами сетей: изучение распространения информации в Твиттере с помощью секвенсора модуляции. Большие данные и общество 5(1).
  12. ^ Исфельдт А.С., Энгаард Т.Р., Блок А., Педерсен М.А. (2022) Грон Генстарт: качественно-количественная микроистория политической идеи в реальном времени. Большие данные и общество 9 (1)
  13. ^ Болье, А. (2017) Векторы для полевых исследований: вычислительное мышление и новые способы этнографии. В: Хьорт Л., Хорст Х., Галлоуэй А. и др. (ред.) The Routledge Companion to Digital Ethnography. Лондон: Рутледж, стр. 55–65.
  14. ^ Мунк, АК, Винтерейк, БР (2022). Компьютерная этнография: пример методологических последствий COVID-19. В: Бруун, М.Х. и др. Справочник Пэлгрейва по антропологии технологий. Пэлгрейв Макмиллан, Сингапур
  15. ^ Пафф, С. (2021). Антропология по науке о данных. Анналы антропологической практики 46 (1): 7–18.
  16. ^ Мунк, А.К., Олесен, А.Г., и Джакоми, М. (2022). Толстая машина: антропологический ИИ между объяснением и экспликацией. Большие данные и общество, 9 (1).
  17. ^ Педерсен, Массачусетс, ред. (2023). Машинная антропология. Специальный выпуск Big Data & Society, 10(1).
  18. ^ Карлсен, Х.Б. и Ралунд, С. (2022). Возвращение к вычислительной обоснованной теории. Большие данные и общество 9 (1).
  19. ^ Нельсон, ЛК (2020). Вычислительная теория: методологическая основа. Социологические методы и исследования, 49 (1), 3–42. https://doi.org/10.1177/0049124117729703
  20. ^ Марио Луис Смолл. Как провести исследование смешанными методами: последние тенденции в быстро растущей литературе. Ежегодный обзор социологии 2011 37:1, 57-86
  21. ^ Форд, Х. (2014) Большие и маленькие данные: сотрудничество между этнографами и учеными, работающими с данными. Большие данные и общество 1(2): 205395171454433.
  22. ^ Гриммер, Дж., и Стюарт, Б.М. (2013). Текст как данные: перспективы и подводные камни автоматических методов контент-анализа политических текстов. Политический анализ, 21(3), 267-297.
  23. ^ Крамер, А.Д., Гиллори, Дж.Э., и Хэнкок, Дж.Т. (2014). Экспериментальные доказательства масштабного эмоционального заражения через социальные сети. Труды Национальной академии наук Соединенных Штатов Америки, 111 (24), 8788.
  24. ^ Салганик, MJ (2019). Шаг за шагом: Социальные исследования в эпоху цифровых технологий. Издательство Принстонского университета.
  25. ^ Велтри, Джорджия (2019). Цифровые социальные исследования. Политическая пресса.
  26. ^ Чоффи-Ревилла, К. (2010). Вычислительная социальная наука. Междисциплинарные обзоры Wiley: вычислительная статистика, 2 (3), 259–271. https://doi.org/10.1002/wics.95
  27. ^ Кинг, Г. (2011). Обеспечение богатого данными будущего социальных наук. Наука, 331(6018), 719-721.
  28. ^ Джайлз, Дж. (2012). Вычислительная социальная наука: создание связей. Природа, 488(7412), 448-450.
  29. ^ Лазер, Д. и др. (2009). Вычислительная социальная наука. Наука, 323(5915), 721-723.
  30. ^ Чоффи-Ревилла, К. (2014). Введение в вычислительную социальную науку. Спрингер Лондон. https://дой . орг/10.1007/978-1-4471-5661-1.
  31. ^ Руперт, Э., Лоу, Дж., Сэвидж, М. (2013) Повторная сборка методов социальных наук: проблема цифровых устройств. Теория, культура и общество 30 (4): 22–46.
  32. ^ Роджерс, Р. (2019) Использование цифровых методов. Северный Тайнсайд: SAGE.
  33. ^ Маррес, Н. (2017). Цифровая социология: переосмысление социальных исследований. Джон Уайли и сыновья.
  34. ^ «Центр социальных данных (SoDa)» .
  35. ^ http://socialdatalab.net/
  36. ^ https://sodas.ku.dk .
  37. ^ Блок А. и Педерсен М.А. 2014. Дополнительные социальные науки? Качественно-количественные эксперименты в мире больших данных. Большие данные и общество 1 (2): 1–6.
  38. ^ Стопчински А, Секара В, Сапезински П, Каттон А, Мэдсен ММ, Ларсен Дж. Э. и др. (2014) Измерение крупномасштабных социальных сетей с высоким разрешением. ПЛОС ОДИН 9(4)
  39. ^ Секара В., Стопчински А., Леманн С. (2016) Фундаментальные структуры динамических социальных сетей. Труды Национальной академии наук 113 (36): 9977–9982.
  40. ^ Сапезинский П., Стопчинский А., Лассен Д.Д. и др. Данные о взаимодействии из Копенгагенского сетевого исследования. Научные данные 6, 315 (2019).
  41. ^ «OII | Оксфордский интернет-институт запускает магистерские и докторские программы в области науки о социальных данных: заявки принимаются с сентября 2017 года» .
  42. ^ https://nyheder.ku.dk/alle_nyheder/2018/12/kandidat-i-social-datavidenskab/
  43. ^ https://studies.ku.dk/masters/social-data-science/
  44. ^ Вейгенд, Андреас (20 мая 2009 г.). «Революция социальных данных» . Гарвардское деловое обозрение .
  45. ^ https://www.humanetech.com
  46. ^ https://www.penguinrandomhouse.com/books/598206/zucked-by-roger-mcnamee/
  47. ^ О'Нил, К. 2016. Оружие математического разрушения: как большие данные увеличивают неравенство и угрожают демократии. Коронные книги
  48. ^ Туфекчи, З. (2014). Большие вопросы для социальных сетей. Большие данные: репрезентативность, валидность и другие методологические ошибки. ICWSM'14: Материалы 8-й Международной конференции по блогам и социальным сетям.
  49. ^ Аккисти А., Брандимарт Л. и Левенштейн Г. (2015). Конфиденциальность в поведении человека в век информации. Наука, 347, 509-514.
  50. ^ https://studies.ku.dk/masters/social-data-science/
  51. ^ «Магистр наук в области социальных данных | Оксфордский университет» .
  52. ^ «Магистр социальных и экономических наук о данных | Магистр | Исследования | Кафедра политических и административных наук» .
  53. ^ «Программы бакалавриата | HKU – Педагогический факультет» .
  54. ^ «Прикладная наука о социальных данных (P.Grad.Dip) — Курсы | Тринити-колледж Дублин» .
  55. ^ «MSC Прикладная наука о социальных данных» .
  56. ^ hhttps://courses.ceu.edu/programs/ms/master-science-social-data-science-two-year
  57. ^ «MSC Social Data Science - Степень в области социальных данных | Университет Эссекса» .
  58. ^ «Техноантропология – Магистр» .
  59. ^ «MSC Social Data Science — Подробности программы» .
  60. ^ «Бакалавр наук в области социальных данных» . 27 марта 2024 г.
  61. ^ «Прикладная наука о социальных данных (P.Grad.Dip) — Курсы | Тринити-колледж Дублин» .
  62. ^ «Магистр наук о человеческих и социальных данных: Университет Сассекса» .
  63. ^ https://sodas.ku.dk
  64. ^ «Центр социальных данных | Университет Хельсинки» .
  65. ^ http://socialdatalab.net
  66. ^ https://www.monash.edu/business/research/our-research/soda-labs
  67. ^ «Мангеймский центр науки о данных» .
  68. ^ https://dsc.uva.nl/hubs/sobe-dsc/sobe-dsc.html?cb
  69. ^ https://www.turing.ac.uk/research/interest-groups/social-data-science
  70. ^ https://socialdatascience.umd.edu
  71. ^ https://csda.aut.ac.nz
  72. ^ «Вычисления СШ – МАШИНА» .
  73. ^ Джексон, 2023. Неакадемическая карьера для ученых-социологов. Практическое руководство по максимизации ваших навыков и возможностей.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 2a16bddd396513a57de65372665f9893__1720803360
URL1:https://arc.ask3.ru/arc/aa/2a/93/2a16bddd396513a57de65372665f9893.html
Заголовок, (Title) документа по адресу, URL1:
Social data science - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)