Социальная наука о данных
Социальная наука о данных — это междисциплинарная область, которая решает проблемы социальных наук путем применения или разработки вычислительных и цифровых методов . Как следует из названия, Social Data Science находится в основном в сфере социальных наук , но опирается на технические достижения в таких областях, как наука о данных , сетевая наука и информатика . Данные в области социальных данных всегда касаются людей и происходят из социальных явлений, и это могут быть структурированные данные (например, опросы ) или неструктурированные данные (например, цифровые следы ). Целью науки о социальных данных является получение новых знаний о социальных сетях , человеческом поведении , культурных идеях и политических идеологиях . Специалист по социальным данным сочетает знания предметной области и специализированные теории социальных наук с навыками программирования , статистики и другого анализа данных .
Методы
[ редактировать ]В науке о социальных данных используется широкий спектр количественных методов — как устоявшиеся методы в социальных науках , так и новые методы, разработанные в информатике и междисциплинарных областях науки о данных, таких как обработка естественного языка (НЛП) и сетевые науки . Социальная наука о данных тесно связана с вычислительной социальной наукой , но иногда включает в себя качественные данные и смешанные цифровые методы. [1] [2] [3] [4]
Общие методы науки о социальных данных включают:
Количественные методы :
- Машинное обучение
- Глубокое обучение
- Анализ социальных сетей
- Рандомизированные контролируемые исследования
- Обработка естественного языка (НЛП), особенно с использованием текста как данных . [5]
- опросы
Качественные методы :
Смешанные цифровые методы :
- Картирование противоречий [7]
- Пространственный анализ
- Качественно-количественные методы [8] [9] [10] [11] [12]
- Компьютерная этнография [13] [14] [15] [16] [17]
Одним из столпов науки о социальных данных является сочетание качественных и количественных данных для анализа социальных явлений и разработки теорий, обоснованных с помощью вычислений. [18] [19] Например, используя смешанные методы [20] оцифровывать качественные данные и анализировать их с помощью вычислительных методов или путем качественного анализа и интерпретации количественных данных. [21]
Данные
[ редактировать ]Специалисты по социальным данным используют как оцифрованные данные, так и [22] (например, старые книги, которые были оцифрованы) и изначально цифровые данные (например, сообщения в социальных сетях). [23] Поскольку такие данные часто принимают форму найденных данных, которые изначально были созданы для других целей (коммерческих, управленческих и т. д.), чем исследования, сбор данных, очистка и другие формы предварительной обработки и интеллектуального анализа данных занимают существенную часть работы специалиста по социальным данным. .
Источники данных SDS включают:
- Текстовые данные
- Данные датчика
- Регистрационные данные
- Данные опроса
- Данные о географическом местоположении
- Данные наблюдений
Отношения с другими областями
[ редактировать ]Социальные науки
[ редактировать ]Наука о социальных данных является частью социальных наук наряду с устоявшимися дисциплинами ( антропология , экономика , политология , психология и социология ) и новыми междисциплинарными областями, такими как поведенческая наука , криминология , международные отношения и когнитивная наука . Таким образом, его основной единицей исследования являются социальные отношения, человеческое поведение и культурные идеи, которые он исследует, используя количественные и / или качественные данные и методы для разработки, проверки и улучшения фундаментальных теорий, касающихся природы человеческого существования. SDS также отличается от традиционной социальной науки по двум причинам.
- Во-первых, его основным объектом являются оцифрованные явления и данные в самом широком смысле этого слова, начиная от оцифрованных текстовых корпусов и заканчивая следами, собираемыми цифровыми платформами и датчиками. [24] [25]
- Во-вторых, наука о социальных данных не просто применяет существующие количественные и качественные методы социальных наук , а стремится развивать и разрушать их посредством импорта и интеграции современных методов науки о данных. [26]
Наука о данных
[ редактировать ]Социальная наука о данных — это форма науки о данных , в которой применяются передовые вычислительные методы и статистика для получения информации и понимания данных. [27] [28] Исследователи социальных данных часто используют методы, разработанные учеными-данными , такие как интеллектуальный анализ данных и машинное обучение , которое включает, помимо прочего, извлечение и обработку информации из источников больших данных . В отличие от более широкой области науки о данных, которая включает в себя любое применение и исследование, включающее комбинацию вычислительных и статистических методов, наука о социальных данных в основном касается научного изучения цифровых социальных данных и / или цифровых следов человеческого поведения.
Вычислительная социальная наука
[ редактировать ]Как и вычислительная социология , наука о социальных данных использует методы науки о данных для решения проблем социальных наук. Это включает в себя повторное присвоение и усовершенствование методов, разработанных учеными, работающими с данными, чтобы лучше соответствовать вопросам и данным социальных наук, а также их специализированным знаниям и теориям. [29] [30] В отличие от вычислительной социальной науки, наука о социальных данных также включает критические исследования того, как цифровые платформы и вычислительные процессы влияют на общество в целом, а также того, как вычислительные и невычислительные подходы интегрируются и сочетаются.
Цифровые методы
[ редактировать ]В то время как большинство исследователей социальных данных тесно связаны с вычислительными социальными науками или являются их частью, некоторые ученые, ориентированные на качественные социальные данные, находятся под влиянием областей цифровых гуманитарных наук и цифровых методов. [31] [32] которые возникли в результате исследований науки и технологий (STS). Как и в случае с цифровыми методами, цель состоит в том, чтобы перепрофилировать «методы среды» для изучения общества, опосредованного цифровыми технологиями, и участвовать в постоянных дискуссиях о предвзятости в науке и обществе, приводя в диалог вычислительную социальную науку и цифровые методы. SDS также связана с цифровой социологией. [33] и цифровая антропология , но в большей степени стремится дополнить качественные данные и цифровые методы современными методами науки о данных.
История поля
[ редактировать ]Зарождение термина «наука о социальных данных» совпало с появлением ряда исследовательских центров и образовательных программ. [34] [35] [36] В 2016 году в Копенгагенском университете был открыт Копенгагенский центр социальных данных (SODAS) — первое академическое учреждение, использующее название SDS. План междисциплинарного центра, работающего на стыке социальных и вычислительных наук, был основан на Копенгагенском исследовании сетей. [37] [38] [39] [40] с 2011-2016 годов исследователями Датского технического университета (DTU) и Копенгагенского университета . и Оксфордский университет Копенгагенский университет были одними из первых исследовательских учреждений, предложивших программы получения степени в области SDS. В 2018 году Оксфордский университет открыл годичную программу магистратуры в области социальных данных. [41] за которым последовала двухлетняя магистерская программа в Копенгагенском университете в 2020 году. [42] [43] С тех пор все большее число университетов начало предлагать последипломные программы или специализации в области социальных данных.
Наука о социальных данных возникла после увеличения доступности оцифрованных социальных данных, иногда называемых большими данными , и возможности применять вычислительные методы к этим данным с низкими затратами, что открыло новые возможности для решения вопросов о социальных явлениях и человеческом поведении. . Хотя происхождение социальных данных можно проследить до 1890-х годов (когда в ходе переписи населения США было обработано около 15 миллионов индивидуальных записей в форме перфокарт ), бум социальных данных в XXI веке является прямым следствием растущей доступности социальных данных. потребительские данные, возникшие в результате появления электронной коммерции [44] Последующие волны доступности неструктурированных социальных данных включают систему обзора Amazon.com и Википедию, а в последнее время и социальные сети , которые сыграли ключевую роль в появлении экономики цифрового внимания и больших технологий .
Критика и дебаты
[ редактировать ]Ученые, работающие с данными, сыграли жизненно важную роль в революции данных, как на первоначальном этапе технического оптимизма, когда большие данные и Интернет рассматривались как решение многих социальных и научных проблем, так и в качестве участников. [45] [46] [47] в результате технологического скандала, который последовал за этим, среди прочего, из -за скандала с данными Facebook и Cambridge Analytica . Исследователи и исследовательские проекты в области социальных данных оказали особое влияние на дебаты и критику вокруг:
- Надзорный капитализм
- Цифровая дезинформация
- Алгоритмическое смещение
- Кризис репликации и достоверности социальных наук [48]
- Этика и конфиденциальность [49]
- Управление данными
Влияние и примеры
[ редактировать ]Исследования в области социальных данных обычно публикуются в междисциплинарных журналах, в том числе в ведущих журналах общего профиля Science , Nature и PNAS , а также в известных специализированных журналах, таких как:
- Природа Человеческое поведение
- Природа Вычислительная наука
- Журнал вычислительной социальной науки
- Большие данные и общество
- Достижения науки
- Природные коммуникации
- Научные отчеты
- ПЛОС ОДИН
Кроме того, исследования в области социальных данных публикуются в ведущих отраслевых журналах по социальным наукам, включая American Sociological Review , Psychoological Science , American Economic Review , Current Anthropology .
Образовательные и исследовательские учреждения
[ редактировать ]Существует множество конкретных определений науки о социальных данных, но несколько учреждений по всему миру в настоящее время предлагают научные и исследовательские программы под рубрикой «Наука о социальных данных».
Образование
[ редактировать ]- Магистр наук в области социальных данных [50] - Университет Копенгагена
- Магистр социальных данных [51] - Оксфордский университет
- Магистр социальных и экономических наук о данных (SEDS) [52] - Университет Констанца
- Бакалавр в области социальных данных [53] - Университет Гонконга
- Доктор наук в области социальных данных [54] - Университет Дублина
- Магистр прикладных социальных наук о данных [55] - Лондонская школа экономики
- Магистр наук в области социальных данных [56] - Центрально-Европейский университет
- Магистр социальных данных [57] - Университет Эссекса
- Магистр техноантропологии [58] - Университет Ольборга
- Магистр социальных данных [59] - Университетский колледж Дублина
- Бакалавр в области социальных данных [60] - Университет Виттен/Хердеке
- Количественный анализ и социальные данные (QASS) [61] - КУ Левен
- Магистр наук о человеческих и социальных данных [62] - Университет Сассекса
Исследовать
[ редактировать ]- Копенгагенский центр социальных данных (SODAS) [63] - Университет Копенгагена
- Центр социальных данных [64] - Университет Хельсинки
- Лаборатория социальных данных [65] - Кардиффский университет
- Лаборатории СоДа [66] - Университет Монаша
- Мангеймский центр науки о данных [67] - Университет Мангейма
- Центр социальных и поведенческих данных (SoBe DSC) [68] - Университет Амстердама
- Социальные данные [69] - Институт Алана Тьюринга
- Центр социальных данных [70] - Университет Мэриленда
- Центр анализа социальных данных [71] - Оклендский технологический университет
- МАШИНА [72] – Ольборгский университет
Профессии и отрасль
[ редактировать ]Специалисты по социальным данным пользуются большим спросом в обществе. [73] специально для работодателей, ценящих междисциплинарные навыки, и их можно найти в качестве:
- 1. Исследователи отрасли: Типичные рабочие места: правительства, компании и корпорации, независимые исследовательские институты, фонды, НПО. Типичные названия: исследователь, менеджер данных, управляющий данными, специалист по данным, инженер данных, консультант, менеджер, директор, партнер, политики, аналитик данных, разработчик программного обеспечения, BI, UX, UI.Исследователь.
- 2. Научные исследователи: к.т.н. Студенты, исследователи, постдоки, профессора
- 3. Предприниматели: начните свой собственный бизнес, используя методы науки о социальных данных для решения реальных социальных проблем. Типичные должности: технический директор, генеральный директор, главный специалист по данным.
Подотрасли
[ редактировать ]Наука о социальных данных по-прежнему является новой областью с развивающимися направлениями. В общих чертах эту область можно разделить на ряд подполей, основанных на методах:
Подполя на основе метода
[ редактировать ]- Сетевая наука: сетевой анализ часто используется для визуализации или изучения сетевой динамики в исследованиях социальных данных. Сюда входят, например, социальные сети.
- Смешанные цифровые методы: при компьютерном качественном анализе исследователь часто использует вычислительные методы, такие как методы обработки естественного языка или тематическое моделирование, для изучения корпуса текста, например парламентских речей или данных Твиттера.
- Машинное обучение для причинно-следственных выводов. Социальные науки часто интересуются поиском причинно-следственных связей между переменными. Это представляет особый интерес для науки о социальных данных, где различные области исследований пытаются найти соответствующие политические ответы на современные социальные проблемы. Часто, опираясь на исследования Джуди Перлса, метод ациклических графов и причинно-следственная модель Неймана-Рубина позволяют определить, существует ли причинно-следственная связь между двумя (или более) переменными. Кроме того, большой интерес представляет включение машинного обучения в причинно-следственную связь.
- Обработка естественного языка. Прикладная обработка естественного языка — это адаптация и перепрофилирование методов обработки естественного языка и применение этих методов к вопросам социального поведения.
Темы
[ редактировать ]- Алгоритмическая предвзятость и справедливость. Учитывая, что алгоритмы играют еще большую роль в повседневной жизни людей, изучение справедливости в этом контексте разросло как область. Особенно независимо от того, оказывают ли эти алгоритмы негативное или положительное влияние на мини-группы.
- Поляризация и дезинформация. Многие ученые используют огромные объемы детальных данных, генерируемых социальными сетями и политическими агентами, для изучения социального заражения, распространения дезинформации и дезинформации. В этих исследованиях часто используются текстовые сообщения или взаимодействие в социальных сетях, чтобы изучить, как политики и/или общественность ведут себя и взаимодействуют на цифровой и физической арене.
- Наука о климатических социальных данных: пересечение науки о климате и цифровых (поведенческих) данных. Это включает в себя климатическую активность в социальных сетях и использование цифровых данных для изучения того, как повышение температуры влияет на людей и общества (CITE: Rising Climate Erode Human Sleep Global).
Ссылки
[ редактировать ]- ^ Лазер, Д. и др. (2009). Вычислительная социальная наука. Наука, 323(5915), 721-723.
- ^ Чоффи-Ревилла, К. (2014). Введение в вычислительную социальную науку. Спрингер Лондон. https://doi.org/10.1007/978-1-4471-5661-1 .
- ^ Имаи, К. (2018). Количественная социальная наука: введение. Издательство Принстонского университета
- ^ Велтри, Джорджия (2019). Цифровые социальные исследования. Политическая пресса.
- ^ Гриммер Дж., Робертс М.Э. и Стюарт Б.М. (2022). Текст как данные: новая основа машинного обучения и социальных наук. Издательство Принстонского университета.
- ^ Нипперт-Энг, К. (2015). Внимательно наблюдая: Руководство по этнографическим наблюдениям. Издательство Оксфордского университета.
- ^ Вентурини, Т. и Мунк, АК (2022). Картирование противоречий: практическое руководство. Кембридж: Политическая пресса
- ^ Форд, Х. (2014). Большие данные и маленькие: сотрудничество этнографов и специалистов по данным. Большие данные и общество 1(2)
- ^ Блок А. и Педерсен М.А. (2014). Дополнительная социальная наука? Качественно-количественные эксперименты в мире больших данных. Большие данные и общество 1 (2): 1–6.
- ^ Мунк А.К. (2019) Четыре стиля качественно-количественного анализа: понимание нового скандинавского кулинарного движения в сети. Обзор Nordicom 40 (1): 159–176
- ^ Моутс, Д. и Борра, Э. (2018) Качественно-количественные методы за пределами сетей: изучение распространения информации в Твиттере с помощью секвенсора модуляции. Большие данные и общество 5(1).
- ^ Исфельдт А.С., Энгаард Т.Р., Блок А., Педерсен М.А. (2022) Грон Генстарт: качественно-количественная микроистория политической идеи в реальном времени. Большие данные и общество 9 (1)
- ^ Болье, А. (2017) Векторы для полевых исследований: вычислительное мышление и новые способы этнографии. В: Хьорт Л., Хорст Х., Галлоуэй А. и др. (ред.) The Routledge Companion to Digital Ethnography. Лондон: Рутледж, стр. 55–65.
- ^ Мунк, АК, Винтерейк, БР (2022). Компьютерная этнография: пример методологических последствий COVID-19. В: Бруун, М.Х. и др. Справочник Пэлгрейва по антропологии технологий. Пэлгрейв Макмиллан, Сингапур
- ^ Пафф, С. (2021). Антропология по науке о данных. Анналы антропологической практики 46 (1): 7–18.
- ^ Мунк, А.К., Олесен, А.Г., и Джакоми, М. (2022). Толстая машина: антропологический ИИ между объяснением и экспликацией. Большие данные и общество, 9 (1).
- ^ Педерсен, Массачусетс, ред. (2023). Машинная антропология. Специальный выпуск Big Data & Society, 10(1).
- ^ Карлсен, Х.Б. и Ралунд, С. (2022). Возвращение к вычислительной обоснованной теории. Большие данные и общество 9 (1).
- ^ Нельсон, ЛК (2020). Вычислительная теория: методологическая основа. Социологические методы и исследования, 49 (1), 3–42. https://doi.org/10.1177/0049124117729703
- ^ Марио Луис Смолл. Как провести исследование смешанными методами: последние тенденции в быстро растущей литературе. Ежегодный обзор социологии 2011 37:1, 57-86
- ^ Форд, Х. (2014) Большие и маленькие данные: сотрудничество между этнографами и учеными, работающими с данными. Большие данные и общество 1(2): 205395171454433.
- ^ Гриммер, Дж., и Стюарт, Б.М. (2013). Текст как данные: перспективы и подводные камни автоматических методов контент-анализа политических текстов. Политический анализ, 21(3), 267-297.
- ^ Крамер, А.Д., Гиллори, Дж.Э., и Хэнкок, Дж.Т. (2014). Экспериментальные доказательства масштабного эмоционального заражения через социальные сети. Труды Национальной академии наук Соединенных Штатов Америки, 111 (24), 8788.
- ^ Салганик, MJ (2019). Шаг за шагом: Социальные исследования в эпоху цифровых технологий. Издательство Принстонского университета.
- ^ Велтри, Джорджия (2019). Цифровые социальные исследования. Политическая пресса.
- ^ Чоффи-Ревилла, К. (2010). Вычислительная социальная наука. Междисциплинарные обзоры Wiley: вычислительная статистика, 2 (3), 259–271. https://doi.org/10.1002/wics.95
- ^ Кинг, Г. (2011). Обеспечение богатого данными будущего социальных наук. Наука, 331(6018), 719-721.
- ^ Джайлз, Дж. (2012). Вычислительная социальная наука: создание связей. Природа, 488(7412), 448-450.
- ^ Лазер, Д. и др. (2009). Вычислительная социальная наука. Наука, 323(5915), 721-723.
- ^ Чоффи-Ревилла, К. (2014). Введение в вычислительную социальную науку. Спрингер Лондон. https://дой . орг/10.1007/978-1-4471-5661-1.
- ^ Руперт, Э., Лоу, Дж., Сэвидж, М. (2013) Повторная сборка методов социальных наук: проблема цифровых устройств. Теория, культура и общество 30 (4): 22–46.
- ^ Роджерс, Р. (2019) Использование цифровых методов. Северный Тайнсайд: SAGE.
- ^ Маррес, Н. (2017). Цифровая социология: переосмысление социальных исследований. Джон Уайли и сыновья.
- ^ «Центр социальных данных (SoDa)» .
- ^ http://socialdatalab.net/
- ^ https://sodas.ku.dk .
- ^ Блок А. и Педерсен М.А. 2014. Дополнительные социальные науки? Качественно-количественные эксперименты в мире больших данных. Большие данные и общество 1 (2): 1–6.
- ^ Стопчински А, Секара В, Сапезински П, Каттон А, Мэдсен ММ, Ларсен Дж. Э. и др. (2014) Измерение крупномасштабных социальных сетей с высоким разрешением. ПЛОС ОДИН 9(4)
- ^ Секара В., Стопчински А., Леманн С. (2016) Фундаментальные структуры динамических социальных сетей. Труды Национальной академии наук 113 (36): 9977–9982.
- ^ Сапезинский П., Стопчинский А., Лассен Д.Д. и др. Данные о взаимодействии из Копенгагенского сетевого исследования. Научные данные 6, 315 (2019).
- ^ «OII | Оксфордский интернет-институт запускает магистерские и докторские программы в области науки о социальных данных: заявки принимаются с сентября 2017 года» .
- ^ https://nyheder.ku.dk/alle_nyheder/2018/12/kandidat-i-social-datavidenskab/
- ^ https://studies.ku.dk/masters/social-data-science/
- ^ Вейгенд, Андреас (20 мая 2009 г.). «Революция социальных данных» . Гарвардское деловое обозрение .
- ^ https://www.humanetech.com
- ^ https://www.penguinrandomhouse.com/books/598206/zucked-by-roger-mcnamee/
- ^ О'Нил, К. 2016. Оружие математического разрушения: как большие данные увеличивают неравенство и угрожают демократии. Коронные книги
- ^ Туфекчи, З. (2014). Большие вопросы для социальных сетей. Большие данные: репрезентативность, валидность и другие методологические ошибки. ICWSM'14: Материалы 8-й Международной конференции по блогам и социальным сетям.
- ^ Аккисти А., Брандимарт Л. и Левенштейн Г. (2015). Конфиденциальность в поведении человека в век информации. Наука, 347, 509-514.
- ^ https://studies.ku.dk/masters/social-data-science/
- ^ «Магистр наук в области социальных данных | Оксфордский университет» .
- ^ «Магистр социальных и экономических наук о данных | Магистр | Исследования | Кафедра политических и административных наук» .
- ^ «Программы бакалавриата | HKU – Педагогический факультет» .
- ^ «Прикладная наука о социальных данных (P.Grad.Dip) — Курсы | Тринити-колледж Дублин» .
- ^ «MSC Прикладная наука о социальных данных» .
- ^ hhttps://courses.ceu.edu/programs/ms/master-science-social-data-science-two-year
- ^ «MSC Social Data Science - Степень в области социальных данных | Университет Эссекса» .
- ^ «Техноантропология – Магистр» .
- ^ «MSC Social Data Science — Подробности программы» .
- ^ «Бакалавр наук в области социальных данных» . 27 марта 2024 г.
- ^ «Прикладная наука о социальных данных (P.Grad.Dip) — Курсы | Тринити-колледж Дублин» .
- ^ «Магистр наук о человеческих и социальных данных: Университет Сассекса» .
- ^ https://sodas.ku.dk
- ^ «Центр социальных данных | Университет Хельсинки» .
- ^ http://socialdatalab.net
- ^ https://www.monash.edu/business/research/our-research/soda-labs
- ^ «Мангеймский центр науки о данных» .
- ^ https://dsc.uva.nl/hubs/sobe-dsc/sobe-dsc.html?cb
- ^ https://www.turing.ac.uk/research/interest-groups/social-data-science
- ^ https://socialdatascience.umd.edu
- ^ https://csda.aut.ac.nz
- ^ «Вычисления СШ – МАШИНА» .
- ^ Джексон, 2023. Неакадемическая карьера для ученых-социологов. Практическое руководство по максимизации ваших навыков и возможностей.
Для этой статьи необходимы дополнительные или более конкретные категории . ( июнь 2024 г. ) |