Статистика случайных перестановок , такая как структура цикла случайной перестановки, имеет фундаментальное значение при анализе алгоритмов , особенно алгоритмов сортировки, которые работают со случайными перестановками. Предположим, например, что мы используем быстрый выбор (двоюродный брат быстрой сортировки ) для выбора случайного элемента случайной перестановки. Quickselect выполнит частичную сортировку массива, поскольку он разделяет массив в соответствии с точкой поворота. Следовательно, после выполнения быстрого выбора перестановка будет менее беспорядочной. Оставшийся беспорядок можно проанализировать с помощью производящих функций. Эти производящие функции фундаментальным образом зависят от производящих функций статистики случайных перестановок. Следовательно, крайне важно вычислить эти производящие функции.
Перестановки представляют собой наборы помеченных циклов. Используя помеченный случай фундаментальной теоремы Флажоле – Седжвика и написав для множества перестановок и для одноэлементного набора у нас есть
где мы использовали тот факт, что ЭФР комбинаторных видов перестановок (существует n ! перестановок из n элементов) равен
Это одно уравнение позволяет получить большое количество статистик перестановок. Во-первых, исключив термины из , то есть exp, мы можем ограничить количество циклов , содержащихся в перестановке, например, ограничив EGF до получим перестановки, содержащие два цикла. Во-вторых, обратите внимание, что ЭФР меченых циклов, т.е. , является потому что есть k ! / k помеченные циклы. Это означает, что, исключив члены из этой производящей функции, мы можем ограничить размер циклов , встречающихся в перестановке, и получить EGF перестановок, содержащий только циклы заданного размера.
Вместо удаления и выбора циклов можно также присвоить разным весам циклы разного размера. Если — весовая функция, зависящая только от размера k цикла, и для краткости запишем
определение значения b для перестановки быть суммой его значений в циклах, то мы можем пометить циклы длины k символом u б ( к ) и получим производящую функцию с двумя переменными
Это «смешанная» производящая функция: это показательная производящая функция по z и обычная производящая функция по вторичному параметру u. Дифференцируя и оценивая при u = 1, имеем
Это функция, производящая вероятность ожидания b . Другими словами, коэффициент в этом степенном ряду является ожидаемым значением b при перестановках в , учитывая, что каждая перестановка выбирается с одинаковой вероятностью .
В этой статье используется оператор извлечения коэффициентов [ z н ], задокументировано на странице формальных степенных рядов .
Инволюция – это такая перестановка σ, что σ 2 = 1 при композиции перестановок. Отсюда следует, что σ может содержать только циклы длины один или два, т. е. экспоненциальная производящая функция g ( z ) этих перестановок равна [1]
Это дает явную формулу для общего числа перестановок σ ∈ Sn инволюций среди : [1]
Деление на n ! дает вероятность того, что случайная перестановка является инволюцией.Эти номера известны как телефонные номера .
Количество перестановок, являющихся корнями m- й степени из единицы
Это обобщает понятие инволюции. Корень m-й степени из единицы — это такая перестановка σ, что σ м = 1 при композиции перестановок. Теперь каждый раз, когда мы применяем σ, мы перемещаемся на один шаг параллельно по всем его циклам. Цикл длиной d, примененный d раз, дает тождественную перестановку на d элементах ( d фиксированных точках), и d — наименьшее значение, необходимое для этого. Следовательно, m должно быть кратно всем размерам циклов d , т. е. единственными возможными циклами являются те, длина d которых является делителем m . Отсюда следует, что ЭФР g ( x ) этих перестановок равен
Когда m = p , где p — простое число, это упрощается до
Это можно сделать с помощью инверсии Мёбиуса . Используя ту же концепцию, что и в предыдущей статье, отметим, что комбинаторные виды перестановок, порядок которых делит k, определяется выражением
Переводя к экспоненциальным производящим функциям, мы получаем ЭФР перестановок, порядок которых делит k , который равен
Теперь мы можем использовать эту производящую функцию для подсчета перестановок порядка ровно k . Позволять — количество перестановок на n , порядок которых равен d и количество перестановок на n количество перестановок, порядок которых делит k . Тогда у нас есть
присутствуют n Предположим, на вечеринке человек, каждый из которых принес с собой зонтик. В конце вечеринки каждый выбирает зонтик из стопки зонтиков и уходит. Какова вероятность того, что никто не уйдет со своим зонтиком? Эта проблема эквивалентна подсчету перестановок без фиксированных точек (так называемых нарушений ), и, следовательно, EGF, в котором мы вычитаем фиксированные точки (циклы длины 1), удаляя член z из фундаментального соотношения, имеет вид
Умножение на суммирует коэффициенты , так , общее количество нарушений, определяется выражением:
Следовательно, существует около расстройства, а вероятность того, что случайная перестановка является расстройством, равна
Этот результат также может быть доказан методом включения-исключения . Использование наборов где для обозначения набора перестановок, которые фиксируют p , мы имеем
Эта формула подсчитывает количество перестановок, имеющих хотя бы одну фиксированную точку.Кардинальность следующая:
Следовательно, количество перестановок без неподвижной точки равно
или
и у нас есть претензии.
Существует обобщение этих чисел, известное как числа rencontres , т.е.число перестановок содержащий m неподвижных точек.Соответствующий EGF получается путем маркировки циклов размера один переменной u , т.е. выбирая b ( k ) равным единице для и ноль в противном случае, что даетпроизводящая функция множества перестановок по числу неподвижных точек:
Если P — перестановка, порядок то P — это наименьшее целое положительное число n , для которого это тождественная перестановка. Это наименьшее общее кратное длин циклов P .
Теорема Го и Шмутца [2] утверждает, что если — ожидаемый порядок случайной перестановки размера n , тогда
где константа c равна
Нарушения, содержащие четное и нечетное количество циклов
Мы можем использовать ту же конструкцию, что и в предыдущем разделе, для вычисления количества нарушений. содержащий четное число циклов и число содержащий нечетное число циклов. Для этого нам нужно отметить все циклы и вычесть фиксированные точки, дав
Теперь некоторые очень простые рассуждения показывают, что EGF из дается
Тюремный надзиратель хочет освободить место в своей тюрьме и рассматривает возможность освобождения ста заключенных, тем самым освободив сто камер. Поэтому он собирает сто заключенных и предлагает им сыграть в следующую игру: он выстраивает в ряд сто урн, в каждой из которых записано имя одного заключенного, причем имя каждого заключенного встречается ровно один раз. Игра проводится следующим образом: каждому заключенному разрешается заглянуть внутрь пятидесяти урн. Если он или она не найдет свое имя ни в одной из пятидесяти урн, все заключенные будут немедленно казнены, в противном случае игра продолжается. У заключенных есть несколько минут, чтобы определиться со стратегией, зная, что после начала игры они не смогут общаться друг с другом, каким-либо образом помечать урны или перемещать урны или имена внутри них. Выбирая урны наугад, их шансы на выживание практически равны нулю, но есть стратегия, дающая им 30% шанс на выживание, если предположить, что имена урнам присвоены случайным образом – что это?
Прежде всего, вероятность выживания при случайном выборе равна
так что это определенно непрактичная стратегия.
Стратегия выживания 30% состоит в том, чтобы рассматривать содержимое урн как перестановку заключенных и пересекать циклы. Чтобы упростить обозначение, присвойте номер каждому заключенному, например, отсортировав их имена в алфавитном порядке. После этого можно считать, что урны содержат номера, а не имена. Теперь ясно, что содержимое урн определяет перестановку. Первый заключенный открывает первую урну. Если он найдет свое имя, значит, он закончил и выжил. В противном случае он открывает урну с номером, найденным в первой урне. Процесс повторяется: заключенный открывает урну и выживает, если находит свое имя, в противном случае он открывает урну с только что полученным номером, но не более пятидесяти урн. Второй заключенный начинает с урны номер два, третий — с урной номер три и так далее. Эта стратегия в точности эквивалентна обходу циклов перестановки, представленной урнами. Каждый заключенный начинает с урны со своим номером и продолжает свой цикл до пятидесяти урн. Номер урны, в которой находится его число, является прообразом этого числа при перестановке. Следовательно, заключенные выживают, если все циклы перестановки содержат не более пятидесяти элементов. Нам нужно показать, что эта вероятность составляет не менее 30%.
Обратите внимание, что это предполагает, что надзиратель выбирает перестановку случайным образом; если надзиратель предвидит эту стратегию, он может просто выбрать перестановку с циклом длиной 51. Чтобы преодолеть это, заключенные могут заранее договориться о случайной перестановке своих имен.
Мы рассматриваем общий случай заключенные и урны открываются. Сначала мы вычисляем дополнительную вероятность, т. е. наличие цикла длиной более элементы. Учитывая это, мы представляем
или
так что искомая вероятность равна
потому что цикл более элементы обязательно будут уникальными. Используя тот факт, что , мы находим это
Связанный с этим результат состоит в том, что асимптотически ожидаемая длина самого длинного цикла равна λn, где λ — константа Голомба – Дикмана , примерно 0,62.
Этот пример принадлежит Анне Галь и Питеру Бро Мильтерсену;обратитесь к статье Питера Винклера для получения дополнительной информации исм. обсуждение на Les-Mathematiques.net .Обратитесь к ссылкам на 100 заключенных, чтобы найти ссылки на эти ссылки.
Вышеупомянутое вычисление может быть выполнено более простым и прямым способом следующим образом: сначала заметим, что перестановка элементы содержат не более одного цикла длиной строго больше, чем . Таким образом, если мы обозначим
затем
Для , количество перестановок, содержащих цикл длины ровно является
Объяснение: это количество способов выбора элементы, составляющие цикл; это количество способов расположения предметы в цикле; и — количество способов переставить оставшиеся элементы. Здесь нет двойного счета, поскольку существует не более одного цикла длины когда . Таким образом,
Мы заключаем, что
Вариант задачи о 100 заключенных (ключи и коробки)
Существует тесно связанная проблема, которая вполне соответствует представленному здесь методу. Предположим, у вас есть n заказанных коробок. Каждый ящик содержит ключ к какому-то другому ящику или, возможно, сам по себе дает перестановку ключей. Вам разрешено выбрать k из этих n ящиков одновременно и одновременно взломать их, получив доступ к k ключам. Какова вероятность того, что с помощью этих ключей вы сможете открыть все n ящиков, причем найденным ключом вы откроете ящик, которому он принадлежит, и повторите действия.
Математическая постановка этой задачи такова: выбрать случайную перестановку из n элементов и k значений из диапазона от 1 до n , также случайным образом, назвать эти метки. Какова вероятность того, что в каждом цикле перестановки окажется хотя бы одна метка? Утверждается, что эта вероятность равна k/n .
Вид перестановок с помощьюциклы с некоторым непустым подмножеством каждого отмеченного цикла имеютспецификация
Индекс во внутренней сумме начинается с единицы, потому что у нас должен быть хотя бы одинотметка в каждом цикле.
Переведя спецификацию на производящие функции, получимдвумерная производящая функция
Это упрощает
или
Чтобы извлечь коэффициенты из этого переписывания, вот так
Теперь следует, что
и, следовательно,
Разделить на чтобы получить
Нам не нужно делить на n! потому что экспоненциально по z .
В этой задаче мы используем двумерную производящую функцию g ( z , u ), как описано во введении. Значение b для цикла размера не m равно нулю, а для цикла размера m — единице . У нас есть
или
Это означает, что ожидаемое количество циклов размера m в перестановке длины n меньше m равно нулю (очевидно). Случайная перестановка длиной не менее m содержит в среднем 1/ m циклов длины m . В частности, случайная перестановка содержит около одной фиксированной точки.
OGF ожидаемого числа циклов длиной меньше или равной m Таким образом, равен
где H m — номер m- й гармоники . Следовательно, ожидаемое количество циклов длины не более m в случайной перестановке составляет около ln m .
Смешанная подруга множества перестановок по числу неподвижных точек равна
Пусть случайная величина X — это количество неподвижных точек случайной перестановки.Используя числа Стирлинга второго рода , мы имеем следующую формулу для m -го момента X :
Предположим, вы выбрали случайную перестановку и возвести его в некоторую степень , с положительное целое число и спросите об ожидаемом количестве фиксированных точек в результате. Обозначим это значение через .
Для каждого делителя из цикл длины распадается на фиксированные точки при возведении в степень Следовательно, нам нужно пометить эти циклы знаком Чтобы проиллюстрировать это, рассмотрим
Мы получаем
который
Продолжая, как описано во введении, мы находим
который
Вывод заключается в том, что для и в среднем имеется четыре фиксированных точки.
Общая процедура
Продолжая, как и прежде, находим
Мы показали, что значение равно ( делителей количество ) как только Это начинается в для и увеличивается на единицу каждый раз достигает делителя до и включительно сам.
Ожидаемое количество циклов любой длины случайной перестановки
(Обратите внимание, что раздел «Сотня заключенных» содержит точно такую же задачу с очень похожими расчетами, а также более простым элементарным доказательством.)
Еще раз начнем с экспоненциальной производящей функции , на этот раз в классе перестановок по размеру, где циклы длиной более отмечены переменной :
Может быть только один цикл длиной более , следовательно, ответ на вопрос дается выражением
или
который
Показатель в срок возведения во власть больше, чем и, следовательно, не имеет значения для возможно, может способствовать
Отсюда следует, что ответ
Сумма имеет альтернативное представление, которое можно встретить, например, в OEIS OEIS : A024167 .
наконец-то давая
Ожидаемое количество транспозиций случайной перестановки
Мы можем использовать разложение перестановки по непересекающимся циклам, чтобы разложить ее на множители как произведение транспозиций, заменив цикл длины k на k - 1 транспозиций. Например, цикл факторы как . Функция для циклов равно и мы получаем
и
Отсюда ожидаемое количество транспозиций является
где это Гармонический номер .Мы также могли бы получить эту формулу, заметив, что количество транспозиций получается путем сложения длин всех циклов (что дает n ) и вычитания по одной для каждого цикла (что дает согласно предыдущему разделу).
Обратите внимание, что снова генерирует беззнаковые числа Стирлинга первого рода , но в обратном порядке. Точнее, мы имеем
Чтобы убедиться в этом, обратите внимание, что приведенное выше эквивалентно
и это
который мы видели как ЭФР беззнаковых чисел Стирлинга первого рода в разделе о перестановках, состоящих ровно из m циклов.
Мы выбираем случайный элемент q случайной перестановки и спросите об ожидаемом размере цикла, содержащего q . Здесь функция равно , поскольку цикл длины k вносит k элементов, которые находятся в циклах длины k . Обратите внимание, что в отличие от предыдущих вычислений, нам нужно усреднить этот параметр после того, как мы извлекли его из производящей функции (делим на n ). У нас есть
Следовательно, ожидаемая длина цикла, содержащего q, равна
Вероятность того, что случайный элемент лежит в цикле размера m
Этот средний параметр представляет собой вероятность того, что, если мы снова выберем случайный элемент случайной перестановки элемент лежит в цикле размера m . Функция равно для и ноль в противном случае, поскольку вклад вносят только циклы длины m , а именно m элементов, лежащих в цикле длины m . У нас есть
Отсюда следует, что вероятность того, что случайный элемент находится в цикле длины m, равна
Вероятность того, что случайное подмножество [ n ] лежит в одном цикле
Выберите случайное подмножество Q из [ n ], содержащее m элементов и случайную перестановку, и спросите о вероятности того, что все элементы Q лежат в одном цикле. Это еще один средний показатель. Функция b ( k ) равна , поскольку цикл длины k вносит вклад подмножества размера m , где для k < m . Это дает
Усредняя, получаем, что вероятность того, что элементы Q находятся в одном цикле, равна
или
В частности, вероятность того, что два элемента p < q находятся в одном цикле, равна 1/2.
Количество перестановок, содержащих четное количество четных циклов
Мы можем напрямую использовать фундаментальную теорему Флажоле-Седжвика и вычислить более сложную статистику перестановок. (На этой странице вы найдете объяснение того, как вычисляются операторы, которые мы будем использовать.) Например, набор перестановок, содержащий четное количество четных циклов, определяется выражением
Это говорит о том, что существует одна перестановка нулевого размера, содержащая четное число четных циклов (пустая перестановка, которая содержит ноль циклов четной длины), одна такая перестановка размера один (фиксированная точка, которая также содержит ноль циклов четной длины). ), и это для , есть такие перестановки.
Рассмотрим, что происходит, когда мы возводим перестановку в квадрат. Фиксированные точки сопоставляются с фиксированными точками. Нечетные циклы сопоставляются с нечетными циклами во взаимно однозначном соответствии, например превращается в . Четные циклы разбиваются на две части и образуют пару циклов вдвое меньшего размера исходного цикла, например превращается в . Следовательно, перестановки, являющиеся квадратами, могут содержать любое количество нечетных циклов, четное количество циклов размера два, четное количество циклов размера четыре и т. д. и определяются выражением
Типы перестановок, представленные в двух предыдущих разделах, т.е. перестановки, содержащие четное количество четных циклов, и перестановки, являющиеся квадратами, являются примерами так называемых инвариантов нечетных циклов , изученных Суном и Чжаном (см. внешние ссылки ). Термин «инвариант нечетного цикла» просто означает, что принадлежность к соответствующему комбинаторному классу не зависит от размера и количества нечетных циклов, встречающихся в перестановке. Фактически мы можем доказать, что все инварианты нечетных циклов подчиняются простой рекуррентности, которую мы и выведем. Во-первых, вот еще несколько примеров инвариантов нечетного цикла.
Перестановки, в которых сумма длин четных циклов равна шести
Здесь есть смысловой нюанс. Мы могли бы считать перестановки, не содержащие четных циклов, принадлежащими к этому классу, поскольку ноль — это четное число . Первые несколько значений
Перестановки, в которых максимальная длина четного цикла равна четырем.
Внимательно обратите внимание на то, как построены характеристики компонента четного цикла. Лучше всего думать о них как о деревьях разбора. Эти деревья имеют три уровня. Узлы на самом низком уровне представляют собой суммы произведений циклов четной длины одноэлементного элемента. . Узлы среднего уровня представляют ограничения оператора множества. Наконец, узел верхнего уровня суммирует произведения вкладов среднего уровня. Обратите внимание, что ограничения оператора множества, примененные к четной производящей функции, сохранят эту особенность, т.е. создадут еще одну четную производящую функцию. Но все входные данные операторов множества четные, поскольку они возникают из циклов четной длины. В результате все задействованные производящие функции имеют вид
где является четной функцией. Это означает, что
тоже четно, и, следовательно,
Сдача в аренду и извлекая коэффициенты, находим, что
где отмечает единицу минус продолжительность способствующего цикла,и отмечает фиксированные точки. Переводя к производящим функциям, получаем
или
Теперь у нас есть
и, следовательно, желаемое количество определяется выражением
Произведя вычисления, получим
или
Извлекая коэффициенты, находим, что коэффициент равен нулю.Константа равна единице, что не соответствует формуле (должно быть равно нулю). Для положительно, однако мы получаем
или
что является желаемым результатом.
Интересно отметить, что мы наблюдаем, что следующего определителя может быть использован для оценки матрица:
где . Напомним формулу определителя:
Теперь значение произведения справа для перестановки является ,где f — количество неподвижных точек . Следовательно
что дает
и наконец
Разница между количеством циклов в четных и нечетных перестановках
Arc.Ask3.Ru Номер скриншота №: a80f7d6fc10dccfd1d4a35d02bd04b37__1698723060 URL1:https://arc.ask3.ru/arc/aa/a8/37/a80f7d6fc10dccfd1d4a35d02bd04b37.html Заголовок, (Title) документа по адресу, URL1: Random permutation statistics - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)