Детализация данных
Эта статья нуждается в дополнительных цитатах для проверки . ( январь 2021 г. ) |
Детализация данных (также детализация ) относится к любым различным операциям и преобразованиям над табличными, реляционными и многомерными данными. Термин широко используется в различных контекстах, но в первую очередь связан со специализированным программным обеспечением, разработанным специально для анализа данных .
Общие операции детализации данных
[ редактировать ]Существуют определенные операции, общие для приложений, позволяющих детализировать данные. Среди них:
запроса Операции :
- табличный запрос
- сводный запрос
Табличный запрос
[ редактировать ]Операции табличных запросов состоят из стандартных операций с таблицами данных.
К числу таких операций относятся:
- поиск
- сортировать
- фильтр (по значению)
- фильтр (по расширенной функции или условию)
- преобразование (например, путем добавления или удаления столбцов)
Рассмотрим следующий пример:
Стол Фреда и Вильмы (рис. 001) :
gender, fname, lname, home male, fred, chopin, Poland male, fred, flintstone, bedrock male, fred, durst, usa female, wilma, flintstone, bedrock female, wilma, rudolph, usa female, wilma, webb, usa male, fred, johnson, usa
Выше приведен пример простой таблицы в плоском файле, отформатированной как значения, разделенные запятыми. В таблице указаны имя, фамилия, пол и страна проживания разных людей по имени Фред или Вильма. Хотя пример отформатирован таким образом, важно подчеркнуть, что операции табличного запроса (а также все операции детализации данных) могут применяться к любому мыслимому типу данных , независимо от базового форматирования. Единственное требование состоит в том, чтобы данные были доступны для чтения используемым программным приложением.
Сводный запрос
[ редактировать ]Сводный запрос допускает несколько представлений данных в соответствии с разными измерениями. Этот тип запроса аналогичен табличному запросу, за исключением того, что он также позволяет представлять данные в сводном формате в соответствии с гибкой иерархией , выбираемой пользователем . Этот класс операций детализации данных формально (и в общих чертах) известен под разными названиями, включая перекрестный запрос , сводную таблицу , пилотные данные , выборочную иерархию , межкрыльевость и другие.
Чтобы проиллюстрировать основы операций сводного запроса, рассмотрим таблицу Фреда и Вильмы (рис. 001) . Быстрое сканирование данных показывает, что таблица содержит избыточную информацию. Эту избыточность можно объединить с помощью схемы, древовидной структуры или каким-либо другим способом. Более того, после консолидации данные могут иметь множество различных альтернативных макетов.
Используя в качестве вывода простой текстовый контур, с помощью сводного запроса возможны следующие альтернативные макеты:
Подведите итоги по полу (рис. 001) :
female flintstone, wilma rudolph, wilma webb, wilma male chopin, fred flintstone, fred durst, fred johnson, fred (Dimensions = gender; Tabular fields = lname, fname;)
Суммируем по домашнему имени (рис. 001) :
bedrock flintstone fred wilma Poland chopin fred usa ... (Dimensions = home, lname; Tabular fields = fname;)
Использование
[ редактировать ]Операции сводных запросов полезны для обобщения массива данных несколькими способами, тем самым иллюстрируя различные представления одной и той же базовой информации. Хотя этот тип операций широко распространен в электронных таблицах и настольном программном обеспечении баз данных , его гибкость, возможно, используется недостаточно. Существует множество приложений, которые допускают только «фиксированную» иерархию представления данных, и это представляет собой существенное ограничение.
Дриллап
[ редактировать ]Детализация является противоположностью детализации. Например, если вы хотите просмотреть доход от одного продукта, вам может потребоваться перейти к детализации, чтобы увидеть доход от всех продуктов. [ 1 ]
Ссылки
[ редактировать ]- ^ «Бурение вверх и вниз» . ИБМ . 4 июля 2018 года . Проверено 5 мая 2020 г.