Качество данных
Качество данных относится к состоянию качественных или количественных фрагментов информации. Существует множество определений качества данных, но данные обычно считаются высококачественными, если они «пригодны для [своего] предполагаемого использования в операциях , принятии решений и планировании ». [1] [2] [3] Более того, данные считаются высококачественными, если они правильно представляют конструкцию реального мира, к которой они относятся. Кроме того, помимо этих определений, по мере увеличения количества источников данных становится важным вопрос внутренней согласованности данных , независимо от их пригодности для использования для какой-либо конкретной внешней цели. Мнения людей о качестве данных часто могут расходиться, даже если обсуждается один и тот же набор данных, используемый для одной и той же цели. В этом случае управление данными используется для формирования согласованных определений и стандартов качества данных. В таких случаях может потребоваться очистка данных , включая стандартизацию , для обеспечения качества данных. [4]
Определения
[ редактировать ]Определить качество данных сложно из-за множества контекстов, в которых используются данные, а также из-за различий в точках зрения конечных пользователей, производителей и хранителей данных. [5]
С точки зрения потребителя качество данных – это: [5]
- «данные, пригодные для использования потребителями данных»
- данные, «соответствующие или превосходящие ожидания потребителей»
- данные, которые «удовлетворяют требованиям предполагаемого использования»
С точки зрения бизнеса качество данных – это:
- данные, которые «пригодны для использования» в своих предполагаемых эксплуатационных целях, для принятия решений и других целях» или которые демонстрируют «соответствие установленным стандартам, так что достигается пригодность для использования» [6]
- данные, которые «пригодны для предполагаемого использования в операциях, принятии решений и планировании» [7]
- «способность данных удовлетворять заявленным бизнес-, системным и техническим требованиям предприятия» [8]
С точки зрения стандартов качество данных – это:
- «степень, в которой набор присущих характеристик (параметров качества) объекта (данных) соответствует требованиям» [9] [5]
- «полезность, точность и правильность данных для их применения» [10]
Можно утверждать, что во всех этих случаях «качество данных» — это сравнение фактического состояния конкретного набора данных с желаемым состоянием, при этом желаемое состояние обычно называют «пригодным для использования», «соответствующим спецификации». отвечающий ожиданиям потребителей», «без дефектов» или «соответствующий требованиям». Эти ожидания, спецификации и требования обычно определяются одним или несколькими отдельными лицами или группами, организациями по стандартизации, законами и постановлениями, бизнес-политикой или политикой разработки программного обеспечения. [5]
Атрибуты качества данных
[ редактировать ]Если углубляться дальше, эти ожидания, спецификации и требования излагаются в виде характеристик или размеров данных, таких как: [5] [6] [7] [8] [11]
- доступность или доступность
- точность или правильность
- сопоставимость
- полнота или всесторонность
- последовательность, последовательность или ясность
- доверие, надежность или репутация
- гибкость
- правдоподобие
- актуальность, уместность или полезность
- своевременность или задержка
- уникальность
- обоснованность или разумность
Систематический обзор литературы показывает, что параметры качества данных и методы с реальными данными не согласуются в литературе, и в результате оценка качества является сложной задачей из-за сложной и разнородной природы этих данных. [11]
История
[ редактировать ]До появления недорогих компьютерных систем хранения данных массивные мейнфреймы для хранения данных об именах и адресах служб доставки использовались . Это было сделано для того, чтобы почта могла быть правильно направлена к месту назначения. Мэйнфреймы использовали бизнес-правила для исправления распространенных орфографических и опечаток в именах и адресах, а также для отслеживания клиентов, которые переехали, умерли, попали в тюрьму, женились, развелись или пережили другие события, изменившие жизнь. Правительственные учреждения начали предоставлять почтовые данные нескольким сервисным компаниям для сопоставления данных о клиентах с Национальным реестром смены адресов (NCOA) . Эта технология сэкономила крупным компаниям миллионы долларов по сравнению с ручной коррекцией данных клиентов. Крупные компании экономили на почтовых расходах, поскольку счета и материалы прямого маркетинга более точно добирались до предполагаемого клиента. Первоначально продававшаяся как услуга, качество данных переместилось в стены корпораций, когда стали доступны недорогие и мощные серверные технологии. [ нужна ссылка ]
Компании, уделяющие особое внимание маркетингу, часто сосредотачивают свои усилия по обеспечению качества на информации об имени и адресе, но качество данных признается. [ кем? ] как важное свойство всех типов данных. Принципы качества данных могут применяться к данным о цепочке поставок, данным о транзакциях и почти к любой другой категории найденных данных. Например, приведение данных о цепочке поставок в соответствие с определенным стандартом имеет ценность для организации, поскольку: 1) позволяет избежать затоваривания аналогичных, но немного отличающихся запасов; 2) избежание ложного дефицита; 3) улучшение понимания закупок у поставщиков для согласования оптовых скидок; и 4) избежать затрат на логистику при хранении и доставке деталей в крупную организацию. [ нужна ссылка ]
Для компаний, прилагающих значительные исследовательские усилия, качество данных может включать разработку протоколов для методов исследования, уменьшение ошибок измерения , проверку границ данных, перекрестное составление таблиц , моделирование и обнаружение выбросов , проверку целостности данных и т. д. [ нужна ссылка ]
Обзор
[ редактировать ]Существует ряд теоретических основ для понимания качества данных. Теоретико-системный подход, находящийся под влиянием американского прагматизма, расширяет определение качества данных, включив в него качество информации, и подчеркивает инклюзивность фундаментальных измерений точности и прецизионности на основе теории науки (Иванов, 1972). Одна структура, получившая название «Данные с нулевым дефектом» (Hansen, 1991), адаптирует принципы статистического управления процессами к качеству данных. Другая структура стремится объединить перспективу продукта (соответствие спецификациям) и перспективу обслуживания (соответствие ожиданиям потребителей) (Kahn et al. 2002). Другая основа основана на семиотике и предназначена для оценки качества формы, значения и использования данных (Прайс и Шанкс, 2004). Один высокотеоретический подход анализирует онтологическую природу информационных систем для строгого определения качества данных (Wand and Wang, 1996).
Значительный объем исследований качества данных включает изучение и описание различных категорий желаемых атрибутов (или измерений) данных. Было идентифицировано около 200 таких терминов, и существует мало согласия по их природе (концепции, цели или критерии?), их определениям или показателям (Wang et al., 1993). Инженеры-программисты могут признать это проблемой, похожей на « способности ».
В Массачусетском технологическом институте действует программа качества информации (MITIQ), возглавляемая профессором Ричардом Вангом, которая выпускает большое количество публикаций и проводит значительную международную конференцию в этой области (International Conference on Information Quality, ICIQ). Эта программа выросла из работы Хансена над структурой «Ноль данных о дефектах» (Hansen, 1991).
На практике качество данных вызывает беспокойство у специалистов, работающих с широким спектром информационных систем, от хранилищ данных и бизнес-аналитики до управления взаимоотношениями с клиентами и управления цепочками поставок . По оценкам одного отраслевого исследования, общий ущерб для экономики США от проблем с качеством данных составляет более 600 миллиардов долларов США в год (Eckerson, 2002). Неправильные данные, в том числе недействительная и устаревшая информация, могут поступать из разных источников данных – в результате ввода данных или проектов миграции и преобразования данных. [12]
В 2002 году USPS и PricewaterhouseCoopers опубликовали отчет, в котором говорилось, что 23,6 процента всей отправляемой почты в США адресуются неправильно. [13]
Одна из причин, по которой контактные данные в средней базе данных очень быстро устаревают: более 45 миллионов американцев меняют свой адрес каждый год. [14]
Фактически, проблема настолько серьезна, что компании начинают создавать команду по управлению данными , единственная роль которой в корпорации — отвечать за качество данных. В некоторых [ ВОЗ? ] В организациях эта функция управления данными была создана как часть более широкой функции обеспечения соответствия нормативным требованиям, что является признанием важности качества данных/информации для организаций.
Проблемы с качеством данных возникают не только из-за неверных данных; противоречивые данные также являются проблемой. Устранение теневых систем данных и централизация данных в хранилище — одна из инициатив, которую компания может предпринять для обеспечения согласованности данных.
Предприятия, ученые и исследователи начинают участвовать в сообществах по курированию данных, чтобы улучшить качество своих общих данных. [15]
Рынок движется к обеспечению качества данных. Ряд поставщиков создают инструменты для анализа и исправления данных низкого качества на месте , поставщики услуг могут очищать данные на контрактной основе, а консультанты могут давать советы по исправлению процессов или систем, чтобы в первую очередь избежать проблем с качеством данных. Большинство инструментов обеспечения качества данных предлагают ряд инструментов для улучшения данных, которые могут включать в себя некоторые или все из следующих элементов:
- Профилирование данных — первоначальная оценка данных для понимания их текущего состояния, часто включая распределение значений.
- Стандартизация данных — механизм бизнес-правил , обеспечивающий соответствие данных стандартам.
- Геокодирование — для данных имени и адреса. Корректирует данные в соответствии с географическими стандартами США и мира.
- Сопоставление или связывание — способ сравнения данных, чтобы можно было сопоставить похожие, но немного отличающиеся записи. При сопоставлении может использоваться «нечеткая логика» для поиска дубликатов в данных. Он часто признает, что «Боб» и «Ббо» могут быть одним и тем же человеком. Например, он может управлять «домашним хозяйством» или находить связи между супругами по одному и тому же адресу. Наконец, он часто может создать «лучшую в своем классе» запись, взяв лучшие компоненты из нескольких источников данных и создав одну суперзапись.
- Мониторинг — отслеживание качества данных с течением времени и отчетность об изменениях качества данных. Программное обеспечение также может автоматически корректировать отклонения на основе заранее определенных бизнес-правил.
- Пакетная обработка и обработка в режиме реального времени. После первоначальной очистки данных (пакетной) компании часто хотят встроить эти процессы в корпоративные приложения, чтобы обеспечить их чистоту.
ISO 8000 — международный стандарт качества данных. [16]
Обеспечение качества данных
[ редактировать ]Обеспечение качества данных — это процесс профилирования данных для обнаружения несоответствий и других аномалий в данных, а также выполнения очистки данных. [17] [18] действия (например, удаление выбросов отсутствующих данных , интерполяция ) для улучшения качества данных.
Эти действия могут осуществляться как часть хранилища данных или как часть администрирования базы данных существующего прикладного программного обеспечения . [19]
Контроль качества данных
[ редактировать ]Контроль качества данных — это процесс контроля использования данных приложением или процессом. Этот процесс выполняется как до, так и после процесса обеспечения качества данных (QA), который состоит из обнаружения несогласованности данных и их исправления.
До:
- Ограничивает ввод
После процесса контроля качества собираются следующие статистические данные для управления процессом контроля качества (КК):
- Серьезность несоответствия
- незавершенность
- Точность
- Точность
- Пропал без вести / Неизвестно
Процесс контроля качества данных использует информацию из процесса контроля качества для принятия решения об использовании данных для анализа, приложения или бизнес-процесса. Общий пример: если процесс контроля качества данных обнаруживает, что данные содержат слишком много ошибок или несоответствий, он предотвращает использование этих данных для запланированного процесса, что может привести к сбоям. Конкретный пример: предоставление неверных измерений от нескольких датчиков функции автопилота на самолете может привести к его крушению. Таким образом, установление процесса контроля качества обеспечивает защиту использования данных. [ нужна ссылка ]
Оптимальное использование качества данных
[ редактировать ]Качество данных (DQ) — это нишевая область, необходимая для обеспечения целостности управления данными путем устранения пробелов в данных. Это одна из ключевых функций, которые помогают управлять данными, отслеживая данные и находя исключения, не обнаруженные текущими операциями по управлению данными. Проверки качества данных могут быть определены на уровне атрибутов, чтобы иметь полный контроль над этапами исправления. [ нужна ссылка ]
Проверки DQ и бизнес-правила могут легко перекрываться, если организация не уделяет должного внимания объему DQ. Бизнес-команды должны тщательно понимать объем DQ, чтобы избежать дублирования. Проверки качества данных излишни, если бизнес-логика охватывает те же функции и выполняет ту же цель, что и DQ. Объем DQ организации должен быть определен в стратегии DQ и хорошо реализован. Некоторые проверки качества данных могут быть преобразованы в бизнес-правила после неоднократных исключений в прошлом. [ нужна ссылка ]
Ниже приведены несколько областей потоков данных, которые могут нуждаться в постоянных проверках DQ:
Проверки полноты и точности DQ для всех данных могут выполняться в точке ввода для каждого обязательного атрибута из каждой исходной системы. Немногие значения атрибутов создаются после первоначального создания транзакции; в таких случаях администрирование этих проверок становится сложным и должно выполняться сразу после определенного события источника этого атрибута и выполнения других основных условий атрибута транзакции.
Все данные, имеющие атрибуты, относящиеся к справочным данным в организации, могут быть проверены на соответствие набору четко определенных допустимых значений справочных данных для обнаружения новых или несоответствующих значений посредством проверки достоверности DQ. Результаты могут использоваться для обновления справочных данных , администрируемых в рамках управления основными данными (MDM) .
Все данные, полученные от третьей стороны внутренним командам организации, могут пройти проверку точности (DQ) по данным третьих сторон. Результаты проверки DQ полезны при администрировании данных, которые прошли несколько переходов после точки входа этих данных, но до того, как эти данные будут авторизованы или сохранены для корпоративной аналитики.
Все столбцы данных, которые относятся к основным данным, могут быть проверены на предмет их согласованности . Проверка DQ, проводимая для данных в точке входа, обнаруживает новые данные для процесса MDM, но проверка DQ, проводимая после точки входа, обнаруживает нарушение (а не исключения) согласованности.
По мере преобразования данных фиксируются несколько временных меток и положения этих временных меток, которые можно сравнивать друг с другом, а также с возможностью проверки их значения, затухания и эксплуатационной значимости в соответствии с определенным SLA (соглашением об уровне обслуживания). Эту проверку своевременности DQ можно использовать для уменьшения скорости затухания значений данных и оптимизации политики временной шкалы перемещения данных.
В организации сложная логика обычно разделяется на более простую логику нескольких процессов. Разумность DQ-проверки такой сложной логики, приводящей к логическому результату в пределах определенного диапазона значений или статических взаимосвязей (агрегированных бизнес-правил), могут быть проверены для обнаружения сложных, но важных бизнес-процессов и выбросов данных, их отклонения от BAU (обычный бизнес). ) ожидания и могут содержать возможные исключения, которые в конечном итоге приводят к проблемам с данными. Эта проверка может представлять собой простое общее правило агрегирования, охватываемое большим объемом данных, или сложную логику для группы атрибутов транзакции, относящейся к основному бизнесу организации. Эта проверка DQ требует высокого уровня деловых знаний и сообразительности. Обнаружение проблем разумности может помочь в изменении политики и стратегии либо в сфере управления бизнесом, либо в управлении данными, либо в обоих случаях.
Проверки соответствия и проверки целостности не обязательно должны охватывать все потребности бизнеса, это исключительно на усмотрение архитектуры базы данных.
В процессе перемещения данных существует множество мест, где проверки DQ могут не потребоваться. Например, проверка DQ на полноту и точность столбцов, отличных от NULL, является избыточной для данных, полученных из базы данных. Точно так же данные должны быть проверены на предмет их точности по времени, когда данные объединяются из разных источников. Однако это бизнес-правило, и оно не должно входить в область действия DQ. [ нужна ссылка ]
К сожалению, с точки зрения разработки программного обеспечения DQ часто рассматривается как нефункциональное требование. Таким образом, ключевые проверки/процессы качества данных не учитываются в окончательном программном решении. В сфере здравоохранения носимые технологии или сети Body Area Network генерируют большие объемы данных. [20] Уровень детализации, необходимый для обеспечения качества данных, чрезвычайно высок и часто недооценивается. Это также верно для подавляющего большинства приложений мобильного здравоохранения , электронных медицинских документов и других программных решений, связанных со здоровьем. Однако существуют некоторые инструменты с открытым исходным кодом, которые проверяют качество данных. [21] Основная причина этого связана с дополнительными затратами, которые добавляются к более высокой степени строгости в архитектуре программного обеспечения.
Безопасность и конфиденциальность медицинских данных
[ редактировать ]Использование мобильных устройств в здравоохранении, или мобильном здравоохранении, создает новые проблемы для безопасности и конфиденциальности медицинских данных , что напрямую влияет на качество данных. [2] Мобильное здравоохранение становится все более важной стратегией предоставления медицинских услуг в странах с низким и средним уровнем дохода. [22] Мобильные телефоны и планшеты используются для сбора, отчетности и анализа данных практически в реальном времени. Однако эти мобильные устройства обычно используются и для личных целей, что делает их более уязвимыми для угроз безопасности, которые могут привести к утечке данных. Без надлежащих мер безопасности такое личное использование может поставить под угрозу качество, безопасность и конфиденциальность медицинских данных . [23]
Качество данных в общественном здравоохранении
[ редактировать ]В последние годы качество данных стало основным направлением программ общественного здравоохранения, особенно по мере того, как растет спрос на подотчетность. [24] Работа по достижению амбициозных целей, связанных с борьбой с такими заболеваниями, как СПИД, туберкулез и малярия, должна основываться на надежных системах мониторинга и оценки, которые производят качественные данные, связанные с реализацией программ. [25] Эти программы и аудиторы программ все чаще ищут инструменты для стандартизации и оптимизации процесса определения качества данных. [26] проверять качество сообщаемых данных и оценивать базовые системы управления данными и отчетности по показателям. [27] Примером может служить инструмент проверки качества данных ВОЗ и MEASURE Evaluation. [28] ВОЗ, Глобальный фонд, ГАВИ и MEASURE Evaluation сотрудничали для разработки гармонизированного подхода к обеспечению качества данных по различным заболеваниям и программам. [29]
Качество открытых данных
[ редактировать ]Существует ряд научных работ, посвященных анализу качества данных в открытых источниках данных, таких как Wikipedia , Wikidata , DBpedia и других. В случае с Википедией анализ качества может относиться ко всей статье. [30] Моделирование качества здесь осуществляется с помощью различных методов. Некоторые из них используют машинного обучения алгоритмы , включая Random Forest , [31] Машина опорных векторов , [32] и другие. Методы оценки качества данных в Викиданных, DBpedia и других источниках LOD различаются. [33]
Профессиональные ассоциации
[ редактировать ]- IQ International — Международная ассоциация по качеству информации и данных. [34]
- IQ International — это некоммерческая, нейтральная к поставщикам профессиональная ассоциация, созданная в 2004 году и занимающаяся созданием профессии в области качества информации и данных.
ECCMA (Ассоциация управления кодами электронной торговли)
[ редактировать ]Ассоциация управления кодами электронной коммерции (ECCMA) — это международная некоммерческая ассоциация, основанная на членах и стремящаяся улучшить качество данных посредством внедрения международных стандартов. ECCMA в настоящее время является руководителем проекта по разработке ISO 8000 и ISO 22745, которые являются международными стандартами качества данных и обмена основными данными о материалах и услугах соответственно. ECCMA предоставляет платформу для сотрудничества между профильными экспертами по качеству данных и управлению данными по всему миру для создания и поддержки глобальных словарей открытых стандартов, которые используются для однозначной маркировки информации. Существование этих словарей меток позволяет передавать информацию из одной компьютерной системы в другую без потери смысла. [35]
См. также
[ редактировать ]- Брандмауэр качества данных
- Проверка данных
- Связь с записью
- Качество информации
- Управление основными данными
- Управление данными
- Нормализация базы данных
- Визуализация данных
- Анализ данных
- Наука о данных
- Управление клиническими данными
Ссылки
[ редактировать ]- ^ Редман, Томас К. (30 декабря 2013 г.). На основе данных: получение прибыли от вашего самого важного бизнес-актива . Гарвардская деловая пресса. ISBN 978-1-4221-6364-1 .
- ^ Перейти обратно: а б Фадахунси, Кайоде Филип; Акинлуа, Джеймс Тосин; О'Коннор, Шивон; Уорк, Петра А; Галлахер, Джозеф; Кэрролл, Кристофер; Маджид, Азим; О'Донохью, Джон (март 2019 г.). «Протокол систематического обзора и качественного синтеза рамок качества информации в электронном здравоохранении» . БМЖ Опен . 9 (3): e024722. doi : 10.1136/bmjopen-2018-024722 . ISSN 2044-6055 . ПМК 6429947 . ПМИД 30842114 .
- ^ Фадахунси, Кайоде Филип; О'Коннор, Шивон; Акинлуа, Джеймс Тосин; Уорк, Петра А.; Галлахер, Джозеф; Кэрролл, Кристофер; Автомобиль, Иосип; Маджид, Азим; О'Донохью, Джон (17 мая 2021 г.). «Системы качества информации для цифровых технологий здравоохранения: систематический обзор» . Журнал медицинских интернет-исследований . 23 (5): e23479. дои : 10.2196/23479 . ПМЦ 8167621 . ПМИД 33835034 .
- ^ Смоллвуд, РФ (2014). Управление информацией: концепции, стратегии и передовой опыт . Джон Уайли и сыновья. п. 110. ИСБН 9781118218303 . Архивировано из оригинала 30 июля 2020 г. Проверено 18 апреля 2020 г.
Наличие стандартизированной программы управления данными означает очистку поврежденных или дублированных данных и предоставление пользователям чистых и точных данных в качестве основы для бизнес-приложений и для аналитики поддержки принятия решений в приложениях бизнес-аналитики (BI).
- ^ Перейти обратно: а б с д и Фюрбер, К. (2015). «3. Качество данных» . Управление качеством данных с помощью семантических технологий . Спрингер. стр. 20–55. ISBN 9783658122249 . Архивировано из оригинала 31 июля 2020 года . Проверено 18 апреля 2020 г.
- ^ Перейти обратно: а б Херцог, Теннесси; Шойрен, Ф.Дж.; Винклер, МЫ (2007). «Глава 2: Что такое качество данных и почему нас это должно волновать?» . Качество данных и методы связывания записей . Springer Science & Business Media. стр. 7–15. ISBN 9780387695020 . Архивировано из оригинала 31 июля 2020 года . Проверено 18 апреля 2020 г.
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Перейти обратно: а б Флекенштейн, М.; Феллоуз, Л. (2018). «Глава 11: Качество данных» . Современная стратегия обработки данных . Спрингер. стр. 101–120. ISBN 9783319689920 . Архивировано из оригинала 31 июля 2020 года . Проверено 18 апреля 2020 г.
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Перейти обратно: а б Махати, Р. (2019). «Глава 1: Данные, качество данных и цена плохого качества данных». Качество данных: измерения, измерение, стратегия, управление и управление . Качественная пресса. стр. 5–6. ISBN 9780873899772 . Архивировано из оригинала 23 ноября 2020 года . Проверено 18 апреля 2020 г.
- ^ Международная организация по стандартизации (сентябрь 2015 г.). «ISO 9000:2015(ru) Системы менеджмента качества. Основы и словарь» . Международная организация по стандартизации. Архивировано из оригинала 19 мая 2020 года . Проверено 18 апреля 2020 г.
- ^ Общественная рабочая группа NIST по большим данным, подгруппа по определениям и таксономии (октябрь 2019 г.). «Структура совместимости больших данных NIST: Том 4, Безопасность и конфиденциальность» (PDF) . Специальная публикация NIST 1500-4r2 (3-е изд.). Национальный институт стандартов и технологий. дои : 10.6028/NIST.SP.1500-4r2 . Архивировано (PDF) из оригинала 9 мая 2020 года . Проверено 18 апреля 2020 г.
Валидность означает полезность, точность и правильность данных для их применения. Традиционно это называется качеством данных.
- ^ Перейти обратно: а б Бянь, Цзян; Лю, Тяньчен; Лойаконо, Александр; Вирамонтес, Тонатиу Мендоса; Липори, Глория; Го, И; Ву, Юнхуэй; Проспери, Маттиа; Джордж, Томас Дж; Харл, Кристофер А; Шенкман, Элизабет А. (9 декабря 2020 г.). «Оценка практики оценки качества данных в национальной сети исследования клинических данных посредством систематического обзора в эпоху реальных данных» . Журнал Американской ассоциации медицинской информатики . 27 (12): 1999–2010. дои : 10.1093/jamia/ocaa245 . ISSN 1527-974X . ПМЦ 7727392 . ПМИД 33166397 .
- ^ «Ответственность и кредитное плечо – аргументы в пользу качества данных» . Информационный менеджмент. Август 2006 г. Архивировано из оригинала 27 января 2011 г. Проверено 25 июня 2010 г.
- ^ «Управление адресами для почтовых заказов и розничной торговли» . Журнал «Направления». Архивировано из оригинала 28 апреля 2005 г. Проверено 25 июня 2010 г.
- ^ «USPS | PostalPro» (PDF) . Архивировано (PDF) из оригинала 15 февраля 2010 г. Проверено 25 июня 2010 г.
- ^ Э. Карри, А. Фрейтас и С. О'Риайн, «Роль управления данными для предприятий, управляемого сообществом» , Архивировано 23 января 2012 г. в Wayback Machine в Linking Enterprise Data , Д. Вуд, под ред. Бостон, Массачусетс: Springer US, 2010, стр. 25–47.
- ^ «ISO/TS 8000-1:2011 Качество данных. Часть 1: Обзор» . Международная организация по стандартизации. Архивировано из оригинала 21 декабря 2016 года . Проверено 8 декабря 2016 г.
- ^ «Можете ли вы доверять качеству ваших данных?» . Spotlessdata.com. Архивировано из оригинала 11 февраля 2017 г.
- ^ «Что такое очистка данных? — Качество данных Experian» . 13 февраля 2015 года. Архивировано из оригинала 11 февраля 2017 года . Проверено 9 февраля 2017 г.
- ^ «Лекция 23. Учебное пособие по концепциям качества данных. Хранилище данных» . Посмотрите бесплатное видео-обучение онлайн. Архивировано из оригинала 21 декабря 2016 г. Проверено 8 декабря 2016 г.
- ^ О'Донохью, Джон и Джон Герберт. «Управление данными в среде мобильного здравоохранения: датчики пациентов, мобильные устройства и базы данных». Журнал качества данных и информации ( JDIQ ) 4.1 (2012): 5.
- ^ Хузер, Войтех; ДеФалко, Фрэнк Дж; Шуми, Мартин; Райан, Патрик Б; Шан, Нин; Велес, Марк; Пак, Рэ Ун; Бойс, Ричард Д.; Дьюк, Джон; Харе, Риту; Утиджян, Левон; Бейли, Чарльз (30 ноября 2016 г.). «Многосайтовая оценка инструмента качества данных для наборов клинических данных на уровне пациента» . eGEM . 4 (1): 24. дои : 10.13063/2327-9214.1239 . ПМК 5226382 . ПМИД 28154833 .
- ^ ИЗМЕРЕНИЕ Оценка. (2017) Улучшение качества данных в мобильных информационных системах здравоохранения на уровне сообществ: Рекомендации по проектированию и внедрению (tr-17-182). Чапел-Хилл, Северная Каролина: Оценка MEASURE, Университет Северной Каролины. Получено с https://www.measureevaluation.org/resources/publications/tr-17-182. Архивировано 8 августа 2017 г. в Wayback Machine.
- ^ Вамбугу, С. и Виллелла, К. (2016). Мобильное здравоохранение для информационных систем здравоохранения в странах с низким и средним уровнем дохода: проблемы и возможности в области качества данных, конфиденциальности и безопасности (tr-16-140). Чапел-Хилл, Северная Каролина: Оценка MEASURE, Университет Северной Каролины. Получено с https://www.measureevaluation.org/resources/publications/tr-16-140. Архивировано 8 августа 2017 г. в Wayback Machine.
- ^ ИЗМЕРЕНИЕ Оценка. (2016) Качество данных для систем мониторинга и оценки (fs-16-170). Чапел-Хилл, Северная Каролина: Оценка MEASURE, Университет Северной Каролины. Получено с https://www.measureevaluation.org/resources/publications/fs-16-170-en. Архивировано 8 августа 2017 г. на Wayback Machine.
- ^ ИЗМЕРЕНИЕ Оценка. (2016). Регулярные информационные системы здравоохранения: учебная программа по основным понятиям и практике - Программа (sr-16-135a). Чапел-Хилл, Северная Каролина: Оценка MEASURE, Университет Северной Каролины. Получено с https://www.measureevaluation.org/resources/publications/sr-16-135a. Архивировано 8 августа 2017 г. на Wayback Machine.
- ^ «Инструменты обеспечения качества данных» . ИЗМЕРЕНИЕ Оценка . Архивировано из оригинала 8 августа 2017 года . Проверено 8 августа 2017 г.
- ^ «Модуль 4: Качество данных RHIS» . ИЗМЕРЕНИЕ Оценка . Архивировано из оригинала 8 августа 2017 года . Проверено 8 августа 2017 г.
- ^ ИЗМЕРЕНИЕ Оценка. «Качество данных» . ИЗМЕРЕНИЕ Оценка . Архивировано из оригинала 8 августа 2017 года . Проверено 8 августа 2017 г.
- ^ Всемирная организация здравоохранения (ВОЗ). (2009). Мониторинг и оценка укрепления систем здравоохранения . Женева, Швейцария: ВОЗ. Получено с http://www.who.int/healthinfo/HSS_MandE_framework_Nov_2009.pdf. Архивировано 28 августа 2017 г. в Wayback Machine.
- ^ Месгари, Мостафа; Читу, Околи; Мехди, Мохамад; Финн Аруп, Нильсен; Ланамяки, Арто (2015). « Сумма всех человеческих знаний»: систематический обзор научных исследований содержания Википедии» (PDF) . Журнал Ассоциации информационных наук и технологий . 66 (2): 219–245. дои : 10.1002/asi.23172 . S2CID 218071987 . Архивировано (PDF) из оригинала 10 мая 2020 г. Проверено 21 января 2020 г.
- ^ Варнке-Ванг, Мортен; Косли, Дэн; Ридл, Джон (2013). «Расскажи мне больше». Материалы 9-го Международного симпозиума по открытому сотрудничеству . стр. 1–10. дои : 10.1145/2491055.2491063 . ISBN 9781450318525 . S2CID 18523960 .
- ^ Хасан Далип, Дэниел; Андре Гонсалвес, Маркос; Кристо, Марко; Каладо, Павел (2009). «Автоматическая оценка качества контента, созданного совместно веб-сообществами». Материалы совместной международной конференции по электронным библиотекам 2009 г. - JCDL '09 . п. 295. дои : 10.1145/1555400.1555449 . ISBN 9781605583228 . S2CID 14421291 .
- ^ Фербер, Майкл; Барчерер, Фредерик; Менне, Карстен; Реттингер, Ахим (30 ноября 2017 г.). «Качество связанных данных DBpedia, Freebase, OpenCyc, Wikidata и YAGO» . Семантическая сеть . 9 (1): 77–129. дои : 10.3233/SW-170275 . Архивировано из оригинала 22 января 2018 г.
- ^ «IQ International — Международная ассоциация качества информации и данных» . Сайт IQ International. Архивировано из оригинала 10 мая 2017 г. Проверено 5 августа 2016 г.
- ^ "Дом" . ЕСКМА . Архивировано из оригинала 19 августа 2018 г. Проверено 3 октября 2018 г.
Дальнейшее чтение
[ редактировать ]- Бронселаер, Антон (16 сентября 2021 г.). Управление качеством данных: обзор методов и проблем . Спрингер.
- Себастьян-Коулман, Лаура (12 декабря 2012 г.). Измерение качества данных для постоянного улучшения: система оценки качества данных (1-е изд.). Морган Кауфманн. ISBN 0123970334 .
- Лошин, Давид (29 октября 2010 г.). Руководство для практикующих специалистов по улучшению качества данных (1-е изд.). Морган Кауфманн. ISBN 0123737176 .
- МакГилврей, Данетт (25 июля 2008 г.). Реализация проектов по обеспечению качества данных: десять шагов к обеспечению качества данных и достоверной информации . Морган Кауфманн. ISBN 0123743699 .
- Редман, Томас К. (2008). Управление данными: получение прибыли от вашего самого важного бизнес-актива . Гарвардская деловая пресса. ISBN 9781422119129 .
- Олсон, Джек Э. (2003). Качество данных: параметр точности . Морган Кауфманн. ISBN 9781558608917 .
- Башкарада, С; Корониос, А (2014). «Система критических факторов успеха для управления качеством информации». Управление информационными системами . 31 (4): 1–20. дои : 10.1080/10580530.2014.958023 . S2CID 33018618 .
- Бааманн, Катарина, «Аспекты качества данных при обеспечении доходов», статья
- Экерсон, В. (2002) «Специальный отчет о хранении данных: качество данных и конечный результат», статья
- Иванов, К. (1972) «Контроль качества информации: О концепции точности информации в банках данных и в информационных системах управления» . Стокгольмский университет и Королевский технологический институт. Докторская диссертация.
- Хансен, М. (1991) Данные о нулевых дефектах, Массачусетский технологический институт. Магистерская диссертация [1]
- Кан Б., Стронг Д., Ван Р. (2002) «Показатели качества информации: производительность продуктов и услуг», Communications of ACM, апрель 2002 г., стр. 184–192. Статья
- Прайс Р. и Шэнкс Г. (2004) Структура качества семиотической информации, Proc. Международная конференция ИФИП по системам поддержки принятия решений (DSS2004): Поддержка принятия решений в нестабильном и сложном мире, Прато. Статья
- Ванд Ю. и Ван Р. (1996) «Закрепление измерений качества данных в онтологических основах», Сообщения ACM, ноябрь 1996 г., стр. 86–95. Статья
- Ван Р., Кон Х. и Мэдник С. (1993), Анализ и моделирование требований к качеству данных, Девятая Международная конференция по инженерии данных, Вена, Австрия. Статья
- Фурнель Мишель, Повышение качества и ценности данных ваших клиентов, издания Publibook, 2007 г. ISBN 978-2-7483-3847-8 .
- Дэниел Ф., Казати Ф., Палпанас Т., Чайка О., Каппиелло К. (2008) «Возможность принятия более эффективных решений посредством отчетов с учетом качества», Международная конференция по качеству информации (ICIQ), Массачусетский технологический институт. Статья
- Вудалл, П; Оберхофер, М; Борек, А (2014). «Классификация методов оценки и улучшения качества данных» . Международный журнал качества информации . 3 (4): 298–321. дои : 10.1504/IJIQ.2014.068656 .
- Вудалл, П.; Борек, А.; Парликад, А. (2013). «Оценка качества данных: гибридный подход». Информация и управление . 50 (7): 369–382.
Внешние ссылки
[ редактировать ]- Курс по качеству данных от Глобального учебного центра здравоохранения.