Автокорреляция (слова)
В комбинаторике , разделе математики , автокорреляцией слова называется совокупность периодов этого слова. Точнее, это последовательность значений, показывающая, насколько конец слова похож на начало слова. Это значение можно использовать, например, для вычисления среднего значения первого вхождения этого слова в случайную строку.
Определение
[ редактировать ]В этой статье A — алфавит , а слово на A длины n . Автокорреляция можно определить соотношение как с самим собой. Однако ниже мы переопределим это понятие.
Вектор автокорреляции
[ редактировать ]Вектор автокорреляции является , с равно 1, если префикс длины равен суффиксу длины , и с в противном случае будет 0. То есть указывает, есть ли .
Например, вектор автокорреляции является поскольку, очевидно, для равны 0, 1 или 2, префикс длины равен суффиксу длины . Вектор автокорреляции является поскольку никакой строгий префикс не равен строгому суффиксу. Наконец, вектор автокорреляции равно 100011, как показано в следующей таблице:
а | а | б | б | а | а | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
а | а | б | б | а | а | 1 | |||||
а | а | б | б | а | а | 0 | |||||
а | а | б | б | а | а | 0 | |||||
а | а | б | б | а | а | 0 | |||||
а | а | б | б | а | а | 1 | |||||
а | а | б | б | а | а | 1 |
Обратите внимание, что всегда равен 1, поскольку префикс и суффикс длины оба равны слову . Сходным образом, равно 1 тогда и только тогда, когда первая и последняя буквы совпадают.
Автокорреляционный полином
[ редактировать ]Автокорреляционный полином определяется как . Это многочлен степени не более .
Например, автокорреляционный полином является и автокорреляционный полином является . Наконец, автокорреляционный полином является .
Свойство
[ редактировать ]Теперь мы укажем некоторые свойства, которые можно вычислить с помощью полинома автокорреляции.
Первое появление слова в случайной строке
[ редактировать ]Предположим, вы выбрали бесконечную последовательность писем , случайно, каждая буква с вероятностью , где это количество букв . Давайте позвоним ожидание первого появления ? в ? . Затем равно . То есть каждое подслово из который является одновременно префиксом и суффиксом, приводит к получению среднего значения первого вхождения произойти письма позже. Здесь длина v.
Например, над двоичным алфавитом , первое появление находится на позиции в то время как среднее первое появление находится на позиции . Интуитивно тот факт, что первое появление позже, чем первое появление можно объяснить двумя способами:
- Мы можем рассмотреть для каждой позиции , какие требования к первое появление на .
- Первое появление в обоих случаях может находиться в позиции 1 только одним способом. Если начинается с . Это имеет вероятность для обоих рассматриваемых значений .
- Первое появление находится в позиции 2, если префикс длины 3 или есть . Однако первое появление находится в позиции 2 тогда и только тогда, когда префикс длины 3 . (Обратите внимание, что первое появление в находится в позиции 1.).
- В целом количество префиксов длины так, что первое появление находится на позиции меньше для чем для . Это объясняет, почему в среднем первый прибыть позже первого .
- Мы также можем принять во внимание тот факт, что среднее количество появлений в случайной строке длины является . Это число не зависит от полинома автокорреляции. Возникновение может перекрывать другое событие по-разному. Точнее, каждая единица в векторе автокорреляции соответствует способу перекрытия вхождений. Поскольку многие случаи могут быть упакованы вместе с использованием перекрытия, но среднее количество вхождений не меняется, из этого следует, что расстояние между двумя непересекающимися вхождениями больше, когда вектор автокорреляции содержит много единиц.
Обыкновенные производящие функции
[ редактировать ]Автокорреляционные полиномы позволяют дать простые уравнения для обычных производящих функций (ОПФ) многих естественных вопросов.
- ОГФ языков слов, не содержащих является .
- OGF языков слов, содержащих является .
- OGF языков слов, содержащих одно вхождение слова , в конце слова есть .
Ссылки
[ редактировать ]- Флажоле и Седжвик (2010). Аналитическая комбинаторика . Нью-Йорк: Издательство Кембриджского университета. стр. 60 -61. ISBN 978-0-521-89806-5 .
- Розен, Нед. «Ожидаемое время ожидания подбрасывания монеты» (PDF) . Проверено 3 декабря 2017 г.
- Одлыжко А.М.; Гибас, ЖЖ (1981). «Перекрытие строк, сопоставление с образцом и нетранзитивные игры». Журнал комбинаторной теории . Серия А 30 (2): 183–208. дои : 10.1016/0097-3165(81)90005-4 .