Сбор данных
В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Сбор данных или сбор данных — это процесс сбора и измерения информации о целевых переменных в установленной системе, который затем позволяет ответить на соответствующие вопросы и оценить результаты. данных Сбор является исследовательским компонентом во всех областях обучения, включая физические и социальные науки , гуманитарные науки , [2] и бизнес . Хотя методы различаются в зависимости от дисциплины, акцент на обеспечении точного и честного сбора данных остается прежним. Целью сбора всех данных является сбор доказательств, которые позволят провести анализ данных и сформулировать достоверные ответы на поставленные вопросы.
Независимо от области или предпочтений в определении данных ( количественных или качественных ), точный сбор данных необходим для поддержания целостности исследования. Выбор подходящих инструментов сбора данных (существующих, модифицированных или вновь разработанных) и четкие инструкции по их правильному использованию снижают вероятность ошибок .
Методология [ править ]
В этой статье отсутствует информация об эксперименте, отборе проб, измерении и предварительной обработке. ( июль 2023 г. ) |
данных Сбор и проверка состоят из четырех этапов, когда речь идет о проведении переписи населения , и семи этапов, когда речь идет о выборке . [3]
Формальный процесс сбора данных необходим, поскольку он гарантирует, что собранные данные являются точными и точными. Таким образом, последующие решения, основанные на аргументах, воплощенных в выводах, принимаются с использованием достоверных данных. [4] Этот процесс обеспечивает как основу для измерения, так и, в некоторых случаях, указание на то, что следует улучшить.
Инструменты [ править ]
Система сбора данных [ править ]
Платформа управления данными [ править ]
Платформы управления данными (DMP) — это централизованные системы хранения и анализа данных, используемые в основном в маркетинге . DMP существуют для сбора и преобразования больших объемов данных о спросе и предложении в различимую информацию. Маркетологи могут захотеть получать и использовать данные первой, второй и третьей стороны. DMP позволяют это сделать, поскольку они представляют собой совокупную систему DSP (платформы спроса) и SSP (платформы предложения). DMP являются неотъемлемой частью оптимизации будущих рекламных кампаний.
Проблемы с целостностью данных [ править ]
Основной причиной поддержания целостности данных является поддержка наблюдения за ошибками в процессе сбора данных. Эти ошибки могут быть допущены намеренно (преднамеренная фальсификация ) или непреднамеренно ( случайные или систематические ошибки ). [5]
Существует два подхода, которые могут защитить целостность данных и обеспечить научную достоверность результатов исследования: [6]
- Гарантия качества – все действия, выполняемые до сбора данных
- Контроль качества – все действия, выполняемые во время и после сбора данных
Обеспечение качества (QA) [ править ]
Целью QA является профилактика, которая в первую очередь является экономически эффективной деятельностью по защите целостности сбора данных. Стандартизация протокола с подробным описанием процедур сбора данных имеет решающее значение для профилактики. Риск неспособности выявить проблемы и ошибки в процессе исследования часто вызван плохо написанными руководствами. Перечислено несколько примеров таких неисправностей:
- Неопределенность сроков, методов и идентификации ответственного лица
- Частичный список предметов, которые необходимо собрать
- Расплывчатое описание инструментов сбора данных вместо строгих пошаговых инструкций по проведению тестов.
- Неспособность распознать точное содержание и стратегии обучения и переподготовки сотрудников, ответственных за сбор данных.
- Непонятные инструкции по использованию, настройке и калибровке оборудования для сбора данных.
- Нет заранее определенного механизма документирования изменений в процедурах, происходящих в ходе расследования.
Проблемы с конфиденциальностью пользователей [ править ]
Существуют серьезные опасения по поводу целостности индивидуальных пользовательских данных, собранных с помощью облачных вычислений , поскольку эти данные передаются между странами, в которых действуют разные стандарты защиты индивидуальных пользовательских данных. [7] Обработка информации продвинулась до уровня, когда пользовательские данные теперь можно использовать для прогнозирования того, что говорит человек, еще до того, как он заговорит. [8]
Контроль качества (КК) [ править ]
Поскольку действия по контролю качества происходят во время или после сбора данных, все детали могут быть тщательно задокументированы. Существует необходимость в четко определенной структуре связи в качестве предварительного условия для создания систем мониторинга. Неопределенность в отношении потока информации не рекомендуется, поскольку плохо организованная структура связи приводит к неэффективному мониторингу, а также может ограничить возможности обнаружения ошибок. Контроль качества также отвечает за определение действий, необходимых для исправления ошибочных методов сбора данных, а также за минимизацию таких случаев в будущем. Команда . с большей вероятностью не осознает необходимости выполнения этих действий, если ее процедуры написаны расплывчато и не основаны на обратной связи или обучении
Проблемы сбора данных, требующие оперативных действий:
- Систематические ошибки
- Нарушение протокола
- Мошенничество или научные нарушения
- Ошибки в отдельных элементах данных
- Проблемы с производительностью отдельных сотрудников или сайта
- Эффект тени
См. также [ править ]
- Контролируемый эксперимент
- Сбор данных
- Курирование данных
- Управление данными
- Наблюдательное исследование
- Выборка (статистика)
- Архивирование научных данных
- Статистическое обследование
- Сбор данных опроса
- Качественный метод
- Количественный метод
- Количественные методы в криминологии
- Интеллектуальный анализ данных
Ссылки [ править ]
- ^ Лескроэль, Алабама; Баллард, Г.; Гремийе, Д.; Отье, М.; Эйнли, генеральный директор (2014). Декамп, Себастьян (ред.). «Изменение климата в Антарктике: экстремальные явления нарушают пластическую фенотипическую реакцию у пингвинов Адели» . ПЛОС ОДИН . 9 (1): e85291. Бибкод : 2014PLoSO...985291L . дои : 10.1371/journal.pone.0085291 . ПМК 3906005 . ПМИД 24489657 .
- ^ Выонг, Куан-Хоанг; Ла, Вьет-Фыонг; Выонг, Ту-Транг; Хо, Мань-Тоан; Нгуен, Гонконг Т.; Нгуен, Вьет Ха; Фам, Хиеп-Хунг; Хо, Мань-Тунг (25 сентября 2018 г.). «Открытая база данных производительности социальных и гуманитарных наук Вьетнама для публичного использования» . Научные данные . 5 : 180188. Бибкод : 2018NatSD...580188V . дои : 10.1038/sdata.2018.188 . ПМК 6154282 . ПМИД 30251992 .
- ^ Зиафати Бафарасат, А. (2021) Сбор и проверка данных: простое руководство для исследователей. Продвигать. Препринт.. https://doi.org/10.31124/advance.13637864.v1
- ^ Сбор и анализ данных доктора Роджера Сапсфорда, Виктора Джаппа. ISBN 0-7619-5046-X
- ^ Университет Северного Иллинойса (2005 г.). «Сбор данных» . Ответственное поведение в управлении данными . Проверено 8 июня 2019 г.
- ^ Мост, Марлен М.; Крэддик, Ширли; Кроуфорд, Стейси; Редикан, Сьюзен; Роудс, Донна; Рукенброд, Фрэн; Лоус, Риса (октябрь 2003 г.). «Процессы обеспечения качества диеты в исследовании диеты, контролируемой DASH-натрием». Журнал Американской диетической ассоциации . 103 (10): 1339–1346. дои : 10.1016/s0002-8223(03)01080-0 . ПМИД 14520254 .
- ^ Ван, Фэй Фанфэй (10 января 2014 г.). Закон об электронных коммерческих сделках: современные проблемы в ЕС, США и Китае . Рутледж. п. 154. ИСБН 978-1-134-11522-8 .
- ^ «Реальную опасность представляют данные, а не конфиденциальность» . Новости Эн-Би-Си . 4 февраля 2019 г.
Внешние ссылки [ править ]
- Все о сборе данных – TechTarget.com