Jump to content

R*-дерево

R*-дерево
Изобретенный 1990
Изобретён Норберт Бекманн, Ханс-Петер Кригель , Ральф Шнайдер и Бернхард Зегер
Временная сложность в обозначении большого О
Операция Средний Худший случай
Поиск О( вход )
Вставлять О( вход )
Пространственная сложность
Космос На ) На )

В обработке данных R*-деревья представляют собой вариант R-деревьев, используемых для индексации пространственной информации. Стоимость создания R*-деревьев немного выше, чем у стандартных R-деревьев, поскольку данные, возможно, придется вставлять повторно; но полученное дерево обычно будет иметь лучшую производительность запросов. Как и стандартное R-дерево, оно может хранить как точечные, так и пространственные данные. Его предложили Норберт Бекманн, Ханс-Петер Кригель , Ральф Шнайдер и Бернхард Зегер в 1990 году. [ 1 ]

Разница между R*-деревьями и R-деревьями

[ редактировать ]
R*-дерево, построенное методом повторной вставки (в ELKI ). В этом дереве мало перекрытий, что приводит к хорошей производительности запросов. Красные и синие MBR — это индексные страницы, зеленые MBR — конечные узлы.

Минимизация покрытия и перекрытия имеет решающее значение для производительности R-деревьев. Перекрытие означает, что при запросе или вставке данных необходимо расширить более одной ветви дерева (из-за способа разделения данных на области, которые могут перекрываться). Минимальное покрытие повышает производительность сокращения, позволяя чаще исключать целые страницы из поиска, особенно для запросов с отрицательным диапазоном. R*-дерево пытается уменьшить и то, и другое, используя комбинацию пересмотренного алгоритма разделения узлов и концепцию принудительной повторной вставки при переполнении узла. Это основано на наблюдении, что структуры R-дерева очень восприимчивы в том порядке, в котором их записи вставлены, поэтому структура, созданная вставкой (а не массовой загрузкой) скорее всего, будет неоптимальным. Удаление и повторная вставка записей позволяет им «найти» место в дереве. это может быть более подходящим, чем их исходное местоположение.

При переполнении узла часть его записей удаляется из узла и повторно вставляется в дерево. (Чтобы избежать неопределенного каскада повторных вставок, вызванного последующим переполнением узла, повторная вставка подпрограмму можно вызвать только один раз на каждом уровне дерева при вставке любой новой записи.) Это имеет эффект создания более хорошо кластеризованных групп записей в узлах, уменьшающий охват узлов. Более того, фактическое разделение узлов часто откладывается, что приводит к увеличению средней занятости узла. Повторную вставку можно рассматривать как метод дополнительной оптимизации дерева, запускаемой при переполнении узла.

R*-дерево описывает три метрики, с помощью которых можно количественно оценить качество разделения. Это перекрытие (общее между R*-деревьями и R-деревьями), определяемое как область пересечения ограничивающих рамок двух кластеров; Значение площади представляет собой сумму площадей двух ограничивающих рамок кластера, а значение поля представляет собой сумму периметров двух ограничивающих рамок кластера.

Производительность

[ редактировать ]
  • Улучшенная эвристика разделения делает страницы более прямоугольными и, следовательно, лучше подходит для многих приложений.
  • Метод повторной вставки оптимизирует существующее дерево, но увеличивает сложность.
  • Эффективно поддерживает одновременно точечные и пространственные данные.

Алгоритм и сложность

[ редактировать ]
  • R*-дерево использует тот же алгоритм, что и обычное R-дерево для операций запроса и удаления.
  • При вставке R*-дерево использует комбинированную стратегию. Для конечных узлов перекрытие сведено к минимуму, а для внутренних узлов минимизированы увеличение и площадь.
  • При разбиении R*-дерево использует топологическое разбиение, при котором ось разделения выбирается на основе периметра, а затем минимизируется перекрытие.
  • В дополнение к улучшенной стратегии разделения, R*-дерево также пытается избежать разделения путем повторной вставки объектов и поддеревьев в дерево, вдохновленное концепцией балансировки B-дерева .

Таким образом, сложность запроса и удаления в худшем случае идентична R-дереву. Стратегия вставки в R*-дерево следующая: более сложная, чем стратегия линейного разделения ( ) R-дерева, но менее сложная, чем стратегия квадратичного расщепления ( ) для размера страницы объектов и мало влияет на общую сложность. Общая сложность вставки по-прежнему сравнима с R-деревом: повторные вставки затрагивают не более одной ветви дерева и, таким образом, повторных вставок, что сравнимо с выполнением разделения обычного R-дерева. Итак, в целом сложность R*-дерева такая же, как и у обычного R-дерева.

Реализация полного алгоритма должна учитывать многие крайние случаи и ситуации, которые здесь не обсуждаются.

  1. ^ Перейти обратно: а б Бекманн, Н.; Кригель, HP ; Шнайдер, Р.; Сигер, Б. (1990). «R*-дерево: эффективный и надежный метод доступа к точкам и прямоугольникам». Материалы международной конференции ACM SIGMOD 1990 г. по управлению данными - SIGMOD '90 (PDF) . п. 322. дои : 10.1145/93597.98741 . ISBN  0897913655 .
  2. ^ Гуттман, А. (1984). «R-деревья: структура динамического индекса для пространственного поиска». Материалы международной конференции ACM SIGMOD 1984 года по управлению данными - SIGMOD '84 (PDF) . п. 47. дои : 10.1145/602259.602266 . ISBN  0897911288 .
  3. ^ Анг, CH; Тан, ТК (1997). «Новый алгоритм линейного разделения узлов для R-деревьев». Ин Шолль, Мишель; Вуазар, Аньес (ред.). Материалы 5-го Международного симпозиума по достижениям в области пространственных баз данных (SSD '97), Берлин, Германия, 15–18 июля 1997 г. Конспекты лекций по информатике. Том. 1262. Спрингер. стр. 337–349. дои : 10.1007/3-540-63238-7_38 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 482b81fbda1c68c59af72bad4367eead__1711998180
URL1:https://arc.ask3.ru/arc/aa/48/ad/482b81fbda1c68c59af72bad4367eead.html
Заголовок, (Title) документа по адресу, URL1:
R*-tree - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)