Кардинальность (операторы SQL)
Эта статья нуждается в дополнительных цитатах для проверки . ( январь 2021 г. ) |
В SQL (язык структурированных запросов) термин мощность относится к уникальности значений данных, содержащихся в определенном столбце (атрибуте) базы данных таблицы . Чем меньше мощность, тем больше повторяющихся элементов в столбце. Таким образом, столбец с минимально возможной мощностью будет иметь одинаковое значение для каждой строки. Базы данных SQL используют кардинальность, чтобы помочь определить оптимальный план запроса для данного запроса. [1]
Значения мощности
[ редактировать ]При работе со столбчатыми наборами значений существует три типа мощности: высокая мощность, нормальная мощность и низкая мощность.
Высокая мощность относится к столбцам со значениями, которые очень необычны или уникальны. Значения столбца с высокой мощностью обычно представляют собой идентификационные номера, адреса электронной почты или имена пользователей. Примером столбца таблицы данных с высокой мощностью может быть таблица USERS со столбцом с именем USER_ID. Этот столбец будет содержать уникальные значения от 1 до n . Каждый раз, когда в таблице USERS создается новый пользователь, в столбце USER_ID создается новый номер для его уникальной идентификации. Поскольку значения, содержащиеся в столбце USER_ID, уникальны, тип мощности этого столбца будет называться высокой мощностью.
Нормальная мощность относится к столбцам со значениями, которые несколько необычны. Значения столбца с нормальной мощностью обычно представляют собой имена, почтовые адреса или типы транспортных средств. Примером столбца таблицы данных с нормальной мощностью может быть таблица CUSTOMER со столбцом с именем LAST_NAME, содержащим фамилии клиентов. Хотя у некоторых людей общие фамилии, например Смит, у других необычные фамилии. Таким образом, проверка всех значений, содержащихся в столбце LAST_NAME, покажет в некоторых местах «скопления» имен (например, во многих Смитах), окруженных с обеих сторон длинным рядом уникальных значений. Поскольку в этом столбце содержится множество возможных значений, его тип мощности будет называться нормальной мощностью.
Низкая мощность относится к столбцам с небольшим количеством уникальных значений. Значения столбцов с низкой мощностью обычно представляют собой флаги состояния , логические значения или основные классификации, такие как пол. Примером столбца таблицы данных с низкой мощностью может быть таблица CUSTOMER со столбцом с именем NEW_CUSTOMER. Этот столбец будет содержать только два различных значения: Y или N, обозначающие, был ли клиент новым или нет. Поскольку в этом столбце содержится только два возможных значения, его тип мощности будет называться низкой мощностью. [2]