Jump to content

Проблема с самой длинной повторяющейся подстрокой

Суффиксное дерево букв ATCGATCGA$

В информатике проблема самой длинной повторяющейся подстроки — это проблема поиска самой длинной подстроки строки , которая встречается как минимум дважды.

Эту задачу можно решить в линейном времени и пространстве. путем построения суффиксного дерева для строки (со специальным символом конца строки, например '$'), и поиска самого глубокого внутреннего узла в дереве с более чем одним дочерним элементом. Глубина измеряется количеством символов, пройденных от корня. Строка, образованная ребрами от корня до такого узла, является самой длинной повторяющейся подстрокой. Задача найти самую длинную подстроку, содержащую не менее Вхождения можно решить, сначала предварительно обработав дерево для подсчета количества листовых потомков для каждого внутреннего узла, а затем найдя самый глубокий узел с по крайней мере потомки листьев. Чтобы избежать перекрытия повторов, вы можете проверить, что в списке длин суффиксов нет последовательных элементов с разницей в длине префикса меньше.

На рисунке со строкой «ATCGATCGA$» самая длинная подстрока, которая повторяется не менее двух раз, — это «ATCGA».

[ редактировать ]
  • Эллисон, Л. «Суффиксные деревья» . Проверено 14 октября 2008 г.
  • Реализация на C самой длинной повторяющейся подстроки с использованием суффиксного дерева
  • Онлайн-демо: самая длинная повторяющаяся подстрока


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d57a120d28fd1be2b8d1aba481fb3813__1691763900
URL1:https://arc.ask3.ru/arc/aa/d5/13/d57a120d28fd1be2b8d1aba481fb3813.html
Заголовок, (Title) документа по адресу, URL1:
Longest repeated substring problem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)