Jump to content

Линдон слово

В математике , в области комбинаторики и информатики слово Линдона представляет собой непустую строку , которая в лексикографическом порядке строго меньше всех ее вращений . Слова Линдона названы в честь математика Роджера Линдона , который исследовал их в 1954 году, назвав их стандартными лексикографическими последовательностями . [1] Анатолий Ширшов ввел слова Линдона в 1953 году, назвав их обычными словами . [2] Слова Линдона представляют собой особый случай слов Холла ; почти все свойства слов Линдона совпадают со словами Холла.

Определения [ править ]

Существует несколько эквивалентных определений.

А -ари Линдон слово длины это символов -строка в алфавите определенного размера , и который является уникальным минимальным элементом лексикографического порядка в мультимножестве всех его вращений. Наименьшее вращение означает, что слово Линдона отличается от любого из своих нетривиальных вращений и, следовательно, является апериодическим. [3]

Как вариант, слово является словом Линдона тогда и только тогда, когда оно непусто и лексикографически строго меньше любого из его собственных суффиксов, то есть для всех непустых слов такой, что и непусто.

Другая характеристика такова: слово Линдона обладает тем свойством, что оно непусто, и всякий раз, когда оно разбивается на две непустые подстроки, левая подстрока всегда лексикографически меньше правой подстроки. То есть, если это слово Линдона, и — это любая факторизация на две подстроки, при этом и понимается как непустое, то . Это определение подразумевает, что строка длины является словом Линдона тогда и только тогда, когда существуют слова Линдона и такой, что и . [4] Хотя вариантов может быть несколько. и с этим свойством существует особый выбор, называемый стандартной факторизацией , при котором это как можно дольше. [5]

Перечисление [ править ]

Слова Линдона в двухсимвольном двоичном алфавите {0,1}, отсортированные по длине, а затем лексикографически внутри каждого класса длины, образуют бесконечную последовательность, которая начинается

0, 1, 01, 001, 011, 0001, 0011, 0111, 00001, 00011, 00101, 00111, 01011, 01111, ...

Первая строка, не принадлежащая этой последовательности, «00», опускается, поскольку она периодическая (состоит из двух повторений подстроки «0»); вторая пропущенная строка, «10», является апериодической, но не является минимальной в своем классе перестановок, поскольку ее можно циклически переставлять в меньшую строку «01».

Пустая строка также соответствует определению слова Линдона нулевой длины. Числа двоичных слов Линдона каждой длины, начиная с нулевой длины, образуют целочисленную последовательность

1, 2, 1, 2, 3, 6, 9, 18, 30, 56, 99, 186, 335, ... (последовательность A001037 в OEIS )

Слова Линдона соответствуют апериодическим представителям класса ожерелья и, таким образом, могут быть подсчитаны с помощью функции подсчета ожерелья Моро . [3] [6]

Поколение [ править ]

Дюваль (1988) предлагает эффективный алгоритм для перечисления слов Линдона длиной не более с заданным размером алфавита в лексикографическом порядке . Если одно из слов последовательности, затем следующее слово после можно найти, выполнив следующие действия:

  1. Повторить и сократить его до нового слова длины ровно .
  2. Пока последний символ — последний символ в отсортированном алфавите, удалите его, получив более короткое слово.
  3. Замените последний оставшийся символ его преемником в отсортированном порядке алфавита.

Например, предположим, что мы сгенерировали двоичные слова Линдона длиной до 7, и мы сгенерировали до , то шаги следующие:

  1. Повторите и обрежьте, чтобы получить
  2. Поскольку последний символ равен 0, это не последний символ.
  3. Увеличьте последний символ, чтобы получить .

Наихудшее время для создания преемника слова с помощью этой процедуры .Однако если генерируемые слова хранятся в массиве длиной , и строительство от выполняется путем добавления символов в конец а не создавать новую копию , то среднее время создания преемника (при условии, что каждое слово одинаково вероятно) является постоянным. Следовательно, последовательность всех слов Линдона длиной не более может быть сгенерирован за время, пропорциональное длине последовательности. [7] Постоянная часть слов в этой последовательности имеет длину ровно , поэтому ту же процедуру можно использовать для эффективной генерации слов длиной ровно или слова, длина которых делит , отфильтровывая сгенерированные слова, которые не соответствуют этим критериям.

Стандартная факторизация [ править ]

Согласно теореме Чена-Фокса-Линдона , каждая строка может быть сформирована уникальным способом путем объединения последовательности слов Линдона таким образом, чтобы слова в последовательности не увеличивались лексикографически. [8] Последнее слово Линдона в этой последовательности — это лексикографически наименьший суффикс данной строки. [9] Факторизация в невозрастающую последовательность слов Линдона (так называемая факторизация Линдона) может быть построена за линейное время . [9] Факторизации Линдона могут использоваться как часть биективного варианта преобразования Берроуза – Уиллера для сжатия данных . [10] и в алгоритмах цифровой геометрии . [11]

Такие факторизации могут быть записаны (единственным образом) в виде конечных двоичных деревьев с листьями, помеченными алфавитом, причем каждая правая ветвь задается последним словом Линдона в последовательности. [12] Такие деревья иногда называют стандартными скобками и могут рассматриваться как факторизация элементов свободной группы или как базисные элементы свободной алгебры Ли . Эти деревья являются частным случаем деревьев Холла (поскольку слова Линдона являются частным случаем слов Холла), и поэтому слова Холла обеспечивают стандартный порядок, называемый процессом сбора коммутаторов для групп, и основу для алгебр Ли. [13] Действительно, они обеспечивают явную конструкцию коммутаторов, фигурирующих в теореме Пуанкаре–Биркгофа–Витта, необходимую для построения универсальных обертывающих алгебр .

Каждое слово Линдона можно понимать как перестановку , суффиксную стандартную перестановку .

Алгоритм Дюваля [ править ]

Дюваль (1983) разработал алгоритм нахождения стандартной факторизации, работающий в линейном времени и постоянном пространстве. Он перебирает строку, пытаясь найти как можно более длинное слово Линдона. Когда он его находит, он добавляет его в список результатов и переходит к поиску оставшейся части строки. Результирующий список строк представляет собой стандартную факторизацию данной строки. Далее следует более формальное описание алгоритма.

Учитывая строку S длины N , следует выполнить следующие шаги:

  1. Пусть m будет индексом символа-кандидата, который будет добавлен к уже собранным символам. Изначально m = 1 (индексы символов в строке начинаются с нуля).
  2. Пусть k — индекс символа, с которым мы будем сравнивать другие. Первоначально к = 0 .
  3. Пока k и m меньше N , сравните S[k] ( k -й символ строки S ) с S[m] . Есть три возможных результата:
    1. S[k] равно S[m] : добавьте S[m] к текущим собранным символам. Приращение k и m .
    2. S[k] меньше, чем S[m] : если мы добавим S[m] к текущим собранным символам, мы получим слово Линдона. Но мы пока не можем добавить его в список результатов, поскольку оно может быть лишь частью более крупного слова Линдон. Таким образом, просто увеличьте m и установите k равным 0, чтобы следующий символ сравнивался с первым в строке.
    3. S[k] больше, чем S[m] : если мы добавим S[m] к текущим собранным символам, это не будет ни словом Линдона, ни возможным его началом. Таким образом, добавьте первые mk собранных символов в список результатов, удалите их из строки, установите m равным 1 и k равным 0, чтобы они указывали на второй и первый символ строки соответственно.
  4. Когда m > N , это по сути то же самое, что встретить минус бесконечность, поэтому добавьте первые mk собранных символов в список результатов после удаления их из строки, установите m равным 1 и k равным 0 и вернитесь к предыдущему шагу.
  5. Добавьте S в список результатов.

с последовательностями Брейна Связь де

Если соединить вместе в лексикографическом порядке все слова Линдона, длина которых делит заданное число n , в результате получится последовательность де Брейна , круговая последовательность символов, такая, что каждая возможная длины n последовательность появляется ровно один раз как одна из ее смежные подпоследовательности. Например, конкатенация двоичных слов Линдона, длина которых делит четыре, равна

0 0001 0011 01 0111 1

Эта конструкция вместе с эффективной генерацией слов Линдона обеспечивает эффективный метод построения конкретной последовательности де Брейна в линейном времени и логарифмическом пространстве . [14]

Дополнительные свойства и приложения [ править ]

Слова Линдона применяются к описанию свободных алгебр Ли при построении базиса однородной части данной степени; это была первоначальная мотивация Линдона ввести эти слова. [4] Слова Линдона можно понимать как частный случай множеств Холла . [4]

Для простого числа p количество неприводимых монических полиномов степени d над полем равно числу слов Линдона длины d в алфавите из p символов; их можно поместить в явную переписку. [15]

Теорема Рэдфорда утверждает, что тасованную алгебру над полем характеристики 0 можно рассматривать как полиномиальную алгебру над словами Линдона. Точнее, пусть A — алфавит, пусть k — поле характеристики 0 (или, в более общем смысле, коммутативное поле -алгебра), и пусть R — свободная некоммутативная k -алгебра k x a | а А . Тогда слова над A можно отождествить с «некоммутативными мономами» (т. е. произведениями x a ) в R ; а именно, мы отождествляем слово ( a 1 , a 2 ,..., ) an с мономом x a 1 x a 2 ... x a n . Таким образом, слова над A образуют базис k -векторного пространства R . Затем тасованный продукт определяется на R ; это k -билинейное, ассоциативное и коммутативное произведение, которое обозначается ш и которое по словам можно рекурсивно определить как

1 ш v = v for any word v ;
u ш 1 = u для любого слова u ;
ua ø vb знак равно ( u ø vb ) a + ( ua ø v ) b для любых a , b ∈ A и любых слов u и v .

Алгебра тасования в алфавите A определяется как аддитивная группа R, наделенная ш для умножения. Теорема Рэдфорда [16] теперь заявляет, что слова Линдона являются алгебраически независимыми элементами этой тасованной алгебры, и порождает ее; таким образом, тасованная алгебра изоморфна кольцу полиномов над k , причем неопределенные значения соответствуют словам Линдона. [16]

См. также [ править ]

Примечания [ править ]

  1. ^ Линдон (1954) .
  2. ^ Ширшов (1953) .
  3. Перейти обратно: Перейти обратно: а б Берстель и Перрин (2007) ; Мелансон (2001) .
  4. Перейти обратно: Перейти обратно: а б с Мелансон (2001) .
  5. ^ Берстель и Перрин (2007) .
  6. ^ Раски (2003) предоставляет подробную информацию об этом подсчете слов Линдона и нескольких связанных с ними концепций.
  7. ^ Берстель и Покчиола (1994) .
  8. ^ Мелансон (2001) . Берстель и Перрин (2007) пишут, что, хотя это обычно приписывают Чену, Фоксу и Линдону (1958) и следует из результатов этой статьи, это не было сформулировано явно до Шютценбергера (1965) . Он был явно сформулирован Ширшовым (1958) , см. Schützenberger & Sherman (1963) .
  9. Перейти обратно: Перейти обратно: а б Дюваль (1983) .
  10. ^ Гил и Скотт (2009) ; Куфлейтнер (2009) .
  11. ^ Брлек и др. (2009) .
  12. ^ Глен (2012) .
  13. ^ Мелансон (1992) ; Мелансон и Ройтенауэр (1989) ; Хольвег и Ройтенауэр (2003)
  14. ^ По мнению Берстеля и Перрина (2007) , последовательность, сгенерированная таким способом, была впервые описана (с другим методом генерации) Мартином (1934) , а связь между ней и словами Линдона наблюдалась Фредриксеном и Майораной (1978) .
  15. ^ Голомб (1969) .
  16. Перейти обратно: Перейти обратно: а б Рэдфорд (1979)

Ссылки [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: adf3f146bb2ff5522f8a427d31a9eb56__1709597220
URL1:https://arc.ask3.ru/arc/aa/ad/56/adf3f146bb2ff5522f8a427d31a9eb56.html
Заголовок, (Title) документа по адресу, URL1:
Lyndon word - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)