Обработка данных
Обработка данных - это сбор и манипулирование цифровыми данными для получения значимой информации. [ 1 ] Обработка данных - это форма обработки информации , которая представляет собой модификацию (обработка) информации любым способом, обнаруживаемым наблюдателем. [ Примечание 1 ]
Функции
[ редактировать ]Обработка данных может включать различные процессы, в том числе:
- Валидация - обеспечение того, чтобы предоставляемые данные были правильными и актуальными.
- Сортировка - «Аранжировка элементов в некоторой последовательности и/или в разных наборах».
- Суммизация (статистическая) или (автоматическая) - сокращение подробных данных в его основных точках.
- Агрегация - объединение нескольких частей данных.
- Анализ - «Сбор, организация , анализ, интерпретация и представление данных».
- Отчетность - перечислите подробные или сводные данные или вычисленную информацию.
- Классификация - разделение данных на различные категории.
История
[ редактировать ]иллюстрирует История Бюро переписей Соединенных Штатов эволюцию обработки данных из ручного с помощью электронных процедур.
Ручная обработка данных
[ редактировать ]Хотя широко распространенное использование термина обработки данных датируется только из 1950 -х годов, [ 2 ] Функции обработки данных выполнялись вручную в течение тысячелетий. Например, бухгалтерский учет включает в себя такие функции, как публикация транзакций и создание отчетов, таких как баланс и отчет о денежном потоке . Полностью ручные методы были дополнены применением механических или электронных калькуляторов . Человек, чья задача состояла в том, чтобы выполнить расчеты вручную или с использованием калькулятора, назывался « компьютером ».
График переписи переписи Соединенных Штатов 1890 года был первым, кто собирал данные отдельным, а не домохозяйством . На несколько вопросов можно ответить, сделав проверку в соответствующем поле в форме. С 1850 по 1880 год в Бюро переписей использовалась «система подсчета, которая, по причине растущего числа комбинаций требуемых классификаций Обработайте графики 5 или 6 раз, для столько же независимых подсчетов ». [ 3 ] «Потребовалось более 7 лет, чтобы опубликовать результаты переписи 1880 года» [ 4 ] Использование методов ручной обработки.
Автоматическая обработка данных
[ редактировать ]Термин автоматическая обработка данных была применена к операциям, выполняемым с помощью единичного регистрационного оборудования , такого как Herman Hollerith применение оборудования для перфорированных карт для переписи США 1890 года . «Используя оборудование Hollerith Punchcard, офис переписи смогла завершить табулирование большинства данных переписи 1890 года за 2-3 года по сравнению с 7-8 лет для переписи 1880 года. По оценкам, использование системы Hollerith сохранила около 5 миллионов долларов США при обработке. расходы " [ 4 ] В 1890 году, хотя было вдвое больше вопросов, чем в 1880 году.
Компьютеризированная обработка данных
[ редактировать ]Компьютеризированная обработка данных, или электронная обработка данных представляет собой более позднюю разработку с использованием компьютера вместо нескольких независимых элементов оборудования. Бюро переписей впервые ограничено использованием электронных компьютеров для переписи США 1950 года , используя систему Univac I , [ 3 ] доставлено в 1952 году.
Другие события
[ редактировать ]Термин «обработка данных» в основном была включена более общими информационными технологиями (ИТ). [ 5 ] Более старый термин «обработка данных» наводит на мысль о более старых технологиях. Например, в 1996 году Ассоциация управления обработкой данных (DPMA) изменила свое название на Ассоциацию специалистов по информационным технологиям . Тем не менее, термины являются приблизительно синонимичными.
Приложения
[ редактировать ]Коммерческая обработка данных
[ редактировать ]Коммерческая обработка данных включает в себя большой объем входных данных, относительно мало вычислительных операций и большой объем вывода. Например, страховая компания должна вести записи по десяткам или сотням тысяч полисов, печатных и почтовых счетов, а также получать и публиковать платежи.
Анализ данных
[ редактировать ]В науке и технике термины обработки данных и информационные системы считаются слишком широкими, и термин обработка данных обычно используется для начального этапа, за которым следует анализ данных во втором этапе общей обработки данных.
Анализ данных использует специализированные алгоритмы и статистические расчеты, которые реже наблюдаются в типичной общей бизнес -среде. Для анализа данных программные наборы, такие как SPSS или SAS , или их бесплатные аналоги, такие как DAP , GRETL или PSPP часто используются . Эти инструменты обычно полезны для обработки различных огромных наборов данных, поскольку они способны обрабатывать огромное количество статистического анализа. [ 6 ]
Система
[ редактировать ]Система обработки данных - это комбинация машин , людей и процессов, которые для набора входов создают определенный набор выходов . Входные данные и выходы интерпретируются как данные , факты , информация и т. Д. В зависимости от отношения интерпретатора к системе.
Термин, обычно используемый синонимом системы обработки данных или хранения (кодов), является информационной системой . [ 7 ] Что касается электронного обработки данных , соответствующая концепция называется электронной системой обработки данных .
Примеры
[ редактировать ]Простой пример
[ редактировать ]Очень простой пример системы обработки данных - это процесс поддержания регистра проверки. Транзакции - чеки и месторождения - записываются по мере их возникновения, и транзакции суммированы для определения текущего баланса. Ежемесячно данные, записанные в реестре, согласованы с надежным идентичным списком транзакций, обработанных банком.
Более сложная система ведения записей может дополнительно определить транзакции - например, вклады по источнику или проверкам по типу, такие как благотворительные взносы. Эта информация может быть использована для получения информации, такой как общая сумма всех вкладов за год.
Важным в этом примере является то, что это система , в которой все транзакции регистрируются последовательно, и каждый раз используется один и тот же метод сверки банка.
Пример реального мира
[ редактировать ]Это блок -схема системы обработки данных, объединяющая ручную и компьютеризированную обработку для обработки дебиторской задолженности , выставления счетов и главной книги.
Смотрите также
[ редактировать ]- Большие данные
- Вычисление
- Информатика
- Программное обеспечение для принятия решений
- Информационный возраст
- Информационная и коммуникационная технология
- Информационные технологии
- Научные вычисления
Примечания
[ редактировать ]- ^ Обработка данных отличается от обработки текста , которая представляет собой манипулирование текстом, а не данных в целом. «Обработка данных» . Ветопедия . Сентябрь 1996 . Получено 24 июня 2013 года .
Внешние ссылки
[ редактировать ]
Ссылки
[ редактировать ]- ^ Френч, Карл (1996). Обработка данных и информационные технологии (10 -е изд.) . Томсон. п. 2. ISBN 1844801004 .
- ^ Google N Gram Viewer . Получено 26 июня 2013 года .
- ^ Jump up to: а беременный Truesdell, Leon E. (1965). Разработка табличной карты в Бюро переписи, 1890 . Министерство торговли США.
- ^ Jump up to: а беременный Бом, Фредерик; Уайетт, Дж. Пол; Карри, Джеймс П. (1991). 100 лет обработки данных: Punchcard Century . Соединенные Штаты Бюро переписи.
- ^ Google N Gram Viewer . Получено 28 апреля 2018 года .
- ^ V, jalajakshi; A N, Myna (2022-06-01). «Важность статистики для науки о данных» . Глобальные переходы . Международная конференция по подходу к интеллектуальной инженерии (ICIEA-2012). 3 (1): 326–331. doi : 10.1016/j.gltp.2022.03.019 . ISSN 2666-285X .
- ^ Энтони Ральстон; и др., ред. (2000). Энциклопедия компьютерных наук 4 -е изд . Nature Publishing Group. п. 865.
Дальнейшее чтение
[ редактировать ]- Бурк, Линда Б.; Кларк, Вирджиния А. (1992) Данные обработки: пример опроса . (Количественные приложения в социальных науках, № 07-085). SAGE Publications . ISBN 0-8039-4741-0
- Леви, Джозеф (1967) . Обработка данных перфорированной карты . McGraw-Hill Book Company .