Обработка данных
Обработка данных — это сбор и обработка цифровых данных для получения значимой информации. [1] Обработка данных — это форма обработки информации , которая представляет собой модификацию (обработку) информации любым способом, обнаруживаемым наблюдателем. [примечание 1]
Функции
[ редактировать ]Обработка данных может включать в себя различные процессы, в том числе:
- Валидация – обеспечение правильности и актуальности предоставленных данных.
- Сортировка – «расстановка предметов в некоторой последовательности и/или в разных наборах».
- Суммирование (статистическое) или (автоматическое) – сведение детализированных данных к основным моментам.
- Агрегация – объединение нескольких фрагментов данных.
- Анализ – «сбор, организация , анализ, интерпретация и представление данных».
- Отчетность – список подробных или сводных данных или расчетной информации.
- Классификация – разделение данных на различные категории.
История
[ редактировать ]иллюстрирует История Бюро переписи населения США эволюцию обработки данных от ручных процедур к электронным.
Ручная обработка данных
[ редактировать ]Хотя широкое распространение термина «обработка данных» датируется лишь 1950-ми годами, [2] Функции обработки данных выполнялись вручную на протяжении тысячелетий. Например, бухгалтерский учет включает в себя такие функции, как проводка транзакций и создание отчетов, таких как баланс и отчет о движении денежных средств . Полностью ручные методы были дополнены применением механических или электронных калькуляторов . Человека, работа которого заключалась в выполнении вычислений вручную или с помощью калькулятора, называли « компьютером ».
График переписи населения США 1890 года был первым, в котором данные собирались по отдельным лицам, а не по домохозяйствам . На ряд вопросов можно ответить, поставив галочку в соответствующем поле формы. С 1850 по 1880 год Бюро переписи населения использовало «систему подсчета, которая из-за увеличения количества требуемых комбинаций классификаций становилась все более сложной. обработайте графики 5 или 6 раз, чтобы получить столько же независимых результатов». [3] «На публикацию результатов переписи 1880 года потребовалось более 7 лет» [4] с использованием ручных методов обработки.
Автоматическая обработка данных
[ редактировать ]Термин «автоматическая обработка данных» применялся к операциям, выполняемым с помощью оборудования для записи единиц , например, оборудования Германом Холлеритом к использованию перфокарточного для переписи населения США 1890 года . «Используя оборудование Холлерита для перфокарт, Управление переписи населения смогло завершить табулирование большей части данных переписи 1890 года за 2–3 года по сравнению с 7–8 годами для переписи 1880 года. По оценкам, использование системы Холлерита сэкономило на обработке около 5 миллионов долларов. затраты" [4] в долларах 1890 года, хотя вопросов было вдвое больше, чем в 1880 году.
Компьютеризированная обработка данных
[ редактировать ]Компьютеризированная обработка данных, или электронная обработка данных, представляет собой более позднюю разработку, в которой вместо нескольких независимых единиц оборудования используется компьютер. Бюро переписи населения впервые ограниченно использовало электронные компьютеры во время переписи населения США 1950 года , используя UNIVAC I. систему [3] поставлен в 1952 году.
Другие разработки
[ редактировать ]Термин «обработка данных» в основном был отнесен к более общему термину «информационные технологии» (ИТ). [5] Старый термин «обработка данных» наводит на мысль о старых технологиях. Например, в 1996 году Ассоциация управления обработкой данных (DPMA) сменила название на Ассоциацию специалистов в области информационных технологий . Тем не менее, эти термины являются примерно синонимами.
Приложения
[ редактировать ]Коммерческая обработка данных
[ редактировать ]Коммерческая обработка данных предполагает большой объем входных данных, относительно небольшое количество вычислительных операций и большой объем выходных данных. Например, страховой компании необходимо вести учет десятков или сотен тысяч полисов, распечатывать и отправлять счета по почте, а также получать и отправлять платежи.
Анализ данных
[ редактировать ]В науке и технике термины «обработка данных» и «информационные системы» считаются слишком широкими, а термин « обработка данных» обычно используется для начального этапа, за которым следует анализ данных на втором этапе общей обработки данных.
Для анализа данных используются специализированные алгоритмы и статистические расчеты, которые реже встречаются в типичной общей бизнес-среде. Для анализа данных пакеты программного обеспечения, такие как SPSS или SAS , или их бесплатные аналоги, такие как DAP , gretl или PSPP часто используются . Эти инструменты обычно полезны для обработки различных огромных наборов данных, поскольку они способны выполнять огромный объем статистического анализа. [6]
Системы
[ редактировать ]Система обработки данных — это комбинация машин , людей и процессов, которая для набора входных данных производит определенный набор выходных данных . Входные и выходные данные интерпретируются как данные , факты , информация и т. д. в зависимости от отношения интерпретатора к системе.
Термин, обычно используемый как синоним системы обработки данных или хранения (кодов), представляет собой информационную систему . [7] Что касается, в частности, электронной обработки данных , то соответствующее понятие называется системой электронной обработки данных .
Примеры
[ редактировать ]Простой пример
[ редактировать ]Очень простым примером системы обработки данных является процесс ведения контрольного реестра. Транзакции — чеки и депозиты — записываются по мере их возникновения, а транзакции суммируются для определения текущего баланса. Ежемесячно данные, записанные в реестре, сверяются с, надеюсь, идентичным списком транзакций, обрабатываемых банком.
Более сложная система учета могла бы дополнительно идентифицировать транзакции — например, вклады по источнику или чеки по типу, например, благотворительные пожертвования. Эта информация может быть использована для получения такой информации, как общая сумма всех взносов за год.
В этом примере важно то, что это система , в которой все транзакции записываются последовательно, и каждый раз используется один и тот же метод банковской выверки.
Реальный пример
[ редактировать ]Это блок-схема системы обработки данных, сочетающая ручную и компьютеризированную обработку для обработки дебиторской задолженности , выставления счетов и главной книги.
См. также
[ редактировать ]- Большие данные
- Вычисление
- Информатика
- Программное обеспечение для принятия решений
- Информационный век
- Информационные и коммуникационные технологии
- Информационные технологии
- Научные вычисления
Примечания
[ редактировать ]- ^ Обработка данных отличается от обработки текста , которая представляет собой манипулирование конкретно текстом, а не данными в целом. «обработка данных» . Вебопедия . Сентябрь 1996 года . Проверено 24 июня 2013 г.
Внешние ссылки
[ редактировать ]Ссылки
[ редактировать ]- ^ Френч, Карл (1996). Обработка данных и информационные технологии (10-е изд.) . Томсон. п. 2. ISBN 1844801004 .
- ^ Программа просмотра Google Ngram . Проверено 26 июня 2013 г.
- ^ Jump up to: а б Трусделл, Леон Э. (1965). Разработка перфокарточного табулирования в Бюро переписи населения, 1890 год . Министерство торговли США.
- ^ Jump up to: а б Бёме, Фредерик; Вятт, Дж. Пол; Карри, Джеймс П. (1991). 100 лет обработки данных: век перфокарт . Бюро переписи населения США.
- ^ Программа просмотра Google Ngram . Проверено 28 апреля 2018 г.
- ^ В. Джаладжакши; А н, Майна (01 июня 2022 г.). «Важность статистики для науки о данных» . Труды по глобальным переходам . Международная конференция по интеллектуальному инженерному подходу (ICIEA-2022). 3 (1): 326–331. дои : 10.1016/j.gltp.2022.03.019 . ISSN 2666-285X .
- ^ Энтони Ралстон; и др., ред. (2000). Энциклопедия информатики, 4-е изд . Издательская группа «Природа». п. 865.
Дальнейшее чтение
[ редактировать ]- Бурк, Линда Б.; Кларк, Вирджиния А. (1992) Обработка данных: пример опроса . (Количественные приложения в социальных науках, № 07-085). Публикации SAGE . ISBN 0-8039-4741-0
- Леви, Джозеф (1967) Обработка данных на перфокартах . Книжная компания МакГроу-Хилл .