Statystyki permutacji losowych , takie jak struktura cykli permutacji losowych, mają fundamentalne znaczenie w analizie algorytmów , zwłaszcza algorytmów sortowania, które operują na permutacjach losowych. Załóżmy na przykład, że używamy quickselect (kuzyn quicksort ), aby wybrać losowy element losowej permutacji. Quickselect wykona częściowe sortowanie tablicy, ponieważ dzieli tablicę zgodnie z osią obrotu. Stąd permutacja będzie mniej nieuporządkowana po przeprowadzeniu szybkiego wyboru. Ilość pozostałego nieporządku można analizować za pomocą funkcji generujących. Te funkcje generujące zależą w fundamentalny sposób od funkcji generujących statystyki permutacji losowych. Dlatego tak ważne jest obliczenie tych funkcji generujących.
gdzie wykorzystaliśmy fakt, że EGF kombinatorycznych gatunków permutacji (istnieje n ! permutacji n elementów) wynosi
To jedno równanie pozwala wyprowadzić dużą liczbę statystyk permutacji. Po pierwsze, usuwając terminy z tj. exp , możemy ograniczyć liczbę cykli zawartych w permutacji, np. ograniczając EGF do otrzymujemy permutacje zawierające dwa cykle. Po drugie, zauważ, że EGF oznaczonych cykli, tj. , Jest
bo jest k ! / k oznaczonych cykli. Oznacza to, że usuwając wyrazy z tej funkcji generującej, możemy ograniczyć rozmiar cykli występujących w permutacji i otrzymać EGF permutacji zawierających tylko cykle o danym rozmiarze.
Zamiast usuwać i wybierać cykle, można również przypisywać różne wagi cyklom o różnych rozmiarach. Jeśli jest funkcją wagi, która zależy tylko od rozmiaru k cyklu i dla zwięzłości piszemy
definiując wartość b dla permutacji jako sumy jej wartości w cyklach, możemy oznaczyć cykle o długości k za pomocą u b ( k ) i otrzymać funkcję generującą dwie zmienne σ {\ displaystyle
Jest to „mieszana” funkcja generująca: jest to wykładnicza funkcja generująca w z i zwykła funkcja generująca w parametrze drugorzędnym u . Różniczkując i oceniając przy u = 1, mamy
To jest funkcja generująca prawdopodobieństwo oczekiwania b . Innymi słowy, współczynnik jest oczekiwaną wartością b na permutacjach w , biorąc pod uwagę, że permutacja jest wybierana za pomocą to samo prawdopodobieństwo }
W tym artykule zastosowano operator ekstrakcji współczynników [ z n ], udokumentowany na stronie dotyczącej formalnych szeregów potęgowych .
Inwolucja jest permutacją σ tak, że σ 2 = 1 przy złożeniu permutacji. Wynika z tego, że σ może zawierać tylko cykle o długości jeden lub dwa, tj. wykładnicza funkcja generująca g ( z ) tych permutacji to
Daje to wyraźny wzór na całkowitą liczbę inwolucji wśród permutacji σ ∈ S n :
Dzielenie przez n ! daje prawdopodobieństwo, że losowa permutacja jest inwolucją. Numery te są znane jako numery telefonów .
Liczba permutacji, które są m- tym pierwiastkiem jedności
To uogólnia pojęcie inwolucji. Pierwiastek m - ty z jedności jest permutacją σ taką, że σ m = 1 przy złożeniu permutacji. Teraz za każdym razem, gdy stosujemy σ, przesuwamy się równolegle o jeden krok wzdłuż wszystkich jego cykli. Cykl o długości d zastosowany d razy daje permutację identyczności na d elementach ( d stałych punktach), a d jest najmniejszą wartością, która to robi. Stąd m musi być wielokrotnością wszystkich rozmiarów cykli d , tj. jedynymi możliwymi cyklami są te, których długość d jest dzielnikiem m . Wynika z tego, że EGF g ( x ) tych permutacji wynosi
Kiedy m = p , gdzie p jest liczbą pierwszą, upraszcza się to do
Liczba permutacji rzędu dokładnie k
Można to zrobić za pomocą inwersji Möbiusa . Pracując z tą samą koncepcją, co w poprzednim wpisie, zauważamy, że gatunek kombinatoryczny permutacji, których kolejność dzieli k , jest określony przez
Przekładając na wykładnicze funkcje generujące otrzymujemy EGF permutacji, których rząd dzieli k , czyli
Teraz możemy użyć tej funkcji generującej, aby dokładnie policzyć permutacje rzędu k . Niech będzie liczbą permutacji na n , którego kolejność jest dokładnie re i liczbą permutacji na n permutacji liczyć, którego rząd dzieli k . Następnie mamy
, że na przyjęciu jest n osób, z których każda przyniosła parasol. Na koniec imprezy wszyscy wybierają parasol ze stosu parasoli i liści. Jakie jest prawdopodobieństwo, że nikt nie wyszedł z własnym parasolem? Ten problem jest równoważny z liczeniem permutacji bez punktów stałych (zwanych derangementami ), a zatem EGF, w którym odejmujemy punkty stałe (cykle o długości 1) poprzez usunięcie składnika z z podstawowej relacji to
Mnożenie przez sumuje współczynniki mi , więc , łączna liczba zaburzeń, jest dana wzorem:
Stąd istnieje około zaburzenia i prawdopodobieństwo, że losowa permutacja jest zaburzeniem, wynosi
Wynik ten można również udowodnić przez włączenie-wykluczenie . Za gdzie do oznaczenia zestawu permutacji, które naprawiają p , mamy
Ta formuła zlicza liczbę permutacji, które mają co najmniej jeden punkt stały. Liczebności są następujące:
Stąd liczba permutacji bez punktu stałego wynosi
Lub
i mamy roszczenie.
Istnieje uogólnienie tych liczb, które jest znane jako rencontres tj. liczba permutacji zawierających m stała zwrotnica. Odpowiedni EFG uzyskuje się poprzez oznaczenie cykli o rozmiarze jeden zmienną u , tj. wybranie b ( k ) równego jeden dla i zero w przeciwnym razie, co daje funkcję generującą zbioru permutacji według liczby stałych punktów:
Wynika, że
i stąd
To od razu implikuje
dla n dużych, m stałych.
Kolejność losowej permutacji
Jeśli P jest permutacją, rząd P jest najmniejszą dodatnią liczbą całkowitą n , dla której permutacją tożsamości jest P Jest to najmniejsza wspólna wielokrotność długości cykli P .
Twierdzenie Goha i Schmutza stwierdza, że jeśli jest oczekiwanym rzędem losowej permutacji o rozmiarze n , to
jest stała c
Zaburzenia zawierające parzystą i nieparzystą liczbę cykli
aby obliczyć liczbę zaburzeń zawierających parzystą liczbę cykli i liczbę zawierający nieparzystą liczbę cykli. Aby to zrobić musimy zaznaczyć wszystkie cykle i odjąć punkty stałe, dając
Naczelnik więzienia chce zrobić miejsce w swoim więzieniu i rozważa uwolnienie stu więźniów, a tym samym uwolnienie stu cel. Dlatego gromadzi stu więźniów i prosi ich o rozegranie następującej gry: ustawia w rzędzie sto urn, z których każda zawiera imię jednego więźnia, przy czym imię każdego więźnia występuje dokładnie raz. Gra przebiega następująco: każdy więzień może zajrzeć do wnętrza pięćdziesięciu urn. Jeśli nie znajdzie swojego imienia w jednej z pięćdziesięciu urn, wszyscy więźniowie zostaną natychmiast straceni, w przeciwnym razie gra toczy się dalej. Więźniowie mają kilka chwil na podjęcie decyzji o strategii, wiedząc, że po rozpoczęciu gry nie będą mogli się ze sobą komunikować, w żaden sposób oznaczać urn ani przenosić znajdujących się w nich urn lub imion. Wybierając losowo urny, ich szanse przeżycia są bliskie zeru, ale istnieje strategia dająca im 30% szans na przeżycie, przy założeniu, że imiona są przypisywane urnom losowo – co to jest?
Przede wszystkim prawdopodobieństwo przeżycia przy losowych wyborach wynosi
więc zdecydowanie nie jest to praktyczna strategia.
Strategia 30% przetrwania polega na uznaniu zawartości urn za permutację więźniów i cykle przechodzenia. Aby notacja była prosta, przypisz każdemu więźniowi numer, na przykład sortując ich nazwiska alfabetycznie. Następnie można uznać, że urny zawierają raczej liczby niż nazwiska. Teraz wyraźnie zawartość urn definiuje permutację. Pierwszy więzień otwiera pierwszą urnę. Jeśli znajdzie swoje imię, skończył i przeżyje. W przeciwnym razie otwiera urnę z numerem, który znalazł w pierwszej urnie. Proces się powtarza: więzień otwiera urnę i przeżywa, jeśli znajdzie swoje nazwisko, w przeciwnym razie otwiera urnę z numerem właśnie odzyskanym, do limitu pięćdziesięciu urn. Drugi więzień zaczyna z urną numer dwa, trzeci z urną numer trzy i tak dalej. Ta strategia jest dokładnie równoważna przechodzeniu przez cykle permutacji reprezentowanej przez urny. Każdy więzień zaczyna od urny z jego numerem i kontynuuje swój cykl aż do granicy pięćdziesięciu urn. Numer urny, który zawiera jego numer, jest przedobrazem tego numeru pod permutacją. Dlatego więźniowie przeżywają, jeśli wszystkie cykle permutacji zawierają co najwyżej pięćdziesiąt elementów. Musimy pokazać, że prawdopodobieństwo to wynosi co najmniej 30%.
Zauważ, że zakłada to, że naczelnik losowo wybiera permutację; jeśli naczelnik przewidzi tę strategię, może po prostu wybrać permutację z cyklem o długości 51. Aby temu zaradzić, więźniowie mogą z góry uzgodnić losową permutację swoich nazwisk.
Rozważamy ogólny i Najpierw obliczamy prawdopodobieństwo komplementarności, tj. że istnieje cykl składający się z więcej . Mając to na uwadze, przedstawiamy
Lub
tak, że pożądane prawdopodobieństwo jest
ponieważ cykl więcej niż z konieczności unikalny. Korzystając z faktu, że , stwierdzamy, że
Powiązanym wynikiem jest to, że asymptotycznie oczekiwana długość najdłuższego cyklu wynosi λn, gdzie λ jest stałą Golomba-Dickmana , około 0,62.
Ten przykład pochodzi od Anny Gál i Petera Bro Miltersena; więcej informacji można znaleźć w artykule Petera Winklera oraz w dyskusji na stronie Les-Mathematiques.net . Zapoznaj się z odniesieniami do 100 więźniów , aby uzyskać linki do tych odniesień.
, że permutacja elementów zawiera co najwyżej jeden cykl o długości ściśle . Zatem, jeśli oznaczymy
Następnie
Dla liczba permutacji, które zawierają dokładnie cykl o długości k > n wynosi
Wyjaśnienie: to liczba sposobów wyboru elementów składających się na cykl; to liczba sposobów ułożenia elementów w cyklu i to liczba sposobów permutacji pozostałych elementów. Nie ma tu podwójnego liczenia ponieważ istnieje co najwyżej jeden cykl o długości, gdy . Zatem,
Wnioskujemy, że
Wariacja na temat problemu 100 więźniów (klucze i pudełka)
Istnieje ściśle powiązany problem, który całkiem dobrze pasuje do przedstawionej tutaj metody. Załóżmy, że masz n zamówionych pudełek. Każde pudełko zawiera klucz do innego pudełka lub ewentualnie siebie, dając permutację kluczy. Możesz wybrać k z tych n skrzynek jednocześnie i otworzyć je jednocześnie, uzyskując dostęp do k kluczy. Jakie jest prawdopodobieństwo, że za pomocą tych kluczy możesz otworzyć wszystkie n skrzynek, gdzie użyjesz znalezionego klucza, aby otworzyć skrzynkę, do której należy, i powtórzyć.
Matematyczne sformułowanie tego problemu jest następujące: wybierz losową permutację na n elementach i k wartościach z zakresu od 1 do n , również losowo, nazwij te znaki. Jakie jest prawdopodobieństwo, że w każdym cyklu permutacji jest co najmniej jeden znak? Twierdzenie jest takie, że prawdopodobieństwo to wynosi k/n .
Gatunek permutacji według cykli z pewnym niepustym podzbiorem każdego zaznaczonego cyklu ma specyfikację
Indeks w sumie wewnętrznej zaczyna się od jedynki, ponieważ w każdym cyklu musimy mieć co najmniej jeden znak.
Przekładając specyfikację na funkcje generujące, otrzymujemy dwuwymiarową funkcję generującą
To upraszcza do
Lub
Aby wyodrębnić współczynniki z tego przepisz tak
Teraz z tego wynika
i stąd
Podziel przez , aby uzyskać
Nie musimy dzielić przez n! ponieważ jest wykładniczy w z . sol
Możemy obliczyć OGF podpisanych liczb Stirlinga dla n ustalonego, tj
Zacząć od
co daje
Sumując to, otrzymujemy
Korzystając ze wzoru zawierającego logarytm dla , definicję po prawej stronie, m i twierdzenie dwumianowe , otrzymujemy
współczynniki i definicji współczynnika dwumianowego , końcu mamy
silnia opadająca . Obliczanie OGF liczb Stirlinga bez znaku pierwszego rodzaju działa w podobny sposób.
Oczekiwana liczba cykli danego rozmiaru m
W tym zadaniu używamy dwuwymiarowej funkcji generującej g ( z , u ), jak opisano we wstępie. Wartość b dla cyklu o rozmiarze innym niż m wynosi zero, a jeden dla cyklu o rozmiarze m . Mamy
Lub
Oznacza to, że oczekiwana liczba cykli o rozmiarze m w permutacji o długości n mniejszej niż m wynosi zero (oczywiście). Losowa permutacja o długości co najmniej m zawiera średnio 1/ m cykli o długości m . W szczególności losowa permutacja zawiera około jednego punktu stałego.
OGF oczekiwanej liczby cykli o długości mniejszej lub równej m wynosi zatem
gdzie Hm jest m - tą liczbą harmoniczną . Stąd oczekiwana liczba cykli o długości co najwyżej m w losowej permutacji wynosi około ln m .
Momenty punktów stałych
Mieszany GF permutacji według liczby stałych punktów wynosi sol
Niech zmienną losową X będzie liczba stałych punktów losowej permutacji. Używając liczb Stirlinga drugiego rodzaju , mamy następujący wzór na m- ty moment X :
czyli zero, gdy i jeden w przeciwnym razie. Stąd tylko terminy, których suma składa się na To daje
Oczekiwana liczba stałych punktów w losowej permutacji podniesiona do pewnej potęgi k
wybierasz losową permutację ją do pewnej potęgi dodatnią liczbą całkowitą i pytasz o oczekiwaną liczbę stałych punktów w wyniku Oznacz tę wartość przez .
Dla każdego dzielnika k długości dzieli się na potęgi Dlatego musimy oznaczyć te cykle Aby to zilustrować, rozważ
dostajemy
który jest
Po raz kolejny kontynuując, jak opisano we wstępie, znajdujemy
który jest
Wniosek jest taki, że 6 cztery stałe
Ogólna procedura jest
Po raz kolejny kontynuując jak poprzednio, stwierdzamy
Pokazaliśmy, że wartość równa ( liczba dzielników k ) jak tylko Zaczyna się od dla i zwiększa się o jeden za każdym razem uderza w dzielnik włącznie .
Oczekiwana liczba cykli dowolnej długości losowej permutacji
Konstruujemy dwuwymiarową funkcję generującą za pomocą { , gdzie jeden dla wszystkich cykli (każdy cykl dodaje jeden do całkowitej liczby cykli).
Liczba permutacji z cyklem o długości większej niż n /2
(Zauważ, że sekcja stu więźniów zawiera dokładnie ten sam problem z bardzo podobnymi obliczeniami, a także prostszy elementarny dowód).
od wykładniczej funkcji generującej tym razem z klasy permutacji według rozmiaru, w którym cykle o długości większej niż są oznaczone zmienną: :
Może istnieć tylko jeden cykl o długości większej niż n
Lub
który jest
Wykładnik podniesionym do potęgi większy niż a zatem żadna wartość dla nie się do
Wynika z tego, że odpowiedź brzmi
Suma ma alternatywną reprezentację, którą można spotkać np. w OEIS OEIS : A024167 .
wreszcie dać
Oczekiwana liczba transpozycji losowej permutacji
Możemy użyć rozkładu permutacji na cykl rozłączny, aby rozłożyć ją na czynniki jako iloczyn transpozycji, zastępując cykl o długości k przez k - 1 transpozycji. Np. cykl czynniki jako . funkcja dla cykli jest równa i otrzymujemy
I
Stąd oczekiwana liczba transpozycji wynosi
gdzie jest liczbą harmoniczną \ Moglibyśmy również otrzymać ten wzór, zauważając, że liczbę transpozycji uzyskuje się przez dodanie długości wszystkich cykli (co daje n ) i odjęcie jednego dla każdego cyklu (co daje przez poprzedni Sekcja).
Zauważ, że ponownie generuje liczby Stirlinga bez znaku rodzaju Dokładniej, mamy
Aby to zobaczyć, zauważ, że powyższe jest równoważne z
i to
który widzieliśmy jako EGF niepodpisanych liczb Stirlinga pierwszego rodzaju w części dotyczącej permutacji składających się z dokładnie m cykli.
Oczekiwany rozmiar cyklu elementu losowego
Wybieramy losowy element q losowej permutacji cyklu zawierającego q . Tutaj funkcja jest równa Displaystyle o długości wnosi k elementów , które są w cyklach o długości . Zauważ, że w przeciwieństwie do poprzednich obliczeń, musimy uśrednić ten parametr po wyodrębnieniu go z funkcji generującej (podzielenie przez n ). Mamy
Stąd oczekiwana długość cyklu zawierającego q wynosi
Prawdopodobieństwo, że losowy element leży w cyklu o rozmiarze m
, że jeśli ponownie wybierzemy losowy element losowej w cyklu o m . Funkcja jest równa dla m i zero w przeciwnym razie, ponieważ przyczyniają się tylko cykle o długości m , a mianowicie m elementy leżące na cyklu o długości m . Mamy
Wynika z tego, że prawdopodobieństwo, że losowy element leży w cyklu o długości m , wynosi
Prawdopodobieństwo, że losowy podzbiór [ n ] leży w tym samym cyklu
Wybierz losowy podzbiór Q z [ n ] zawierający m elementów i losową permutację i zapytaj o prawdopodobieństwo, że wszystkie elementy Q leżą w tym samym cyklu. To kolejny średni parametr. Funkcja b ( k ) jest równa , ponieważ cykl o długości k przyczynia się podzbiory o rozmiarze m , gdzie dla k < m . To daje
Uśredniając, uzyskujemy prawdopodobieństwo, że elementy Q będą w tym samym cyklu
Lub
W szczególności prawdopodobieństwo, że dwa elementy p < q znajdują się w tym samym cyklu, wynosi 1/2.
Liczba permutacji zawierających parzystą liczbę parzystych cykli
Możemy bezpośrednio użyć fundamentalnego twierdzenia Flajoleta-Sedgewicka i obliczyć bardziej zaawansowane statystyki permutacji. (Zajrzyj na tę stronę, aby dowiedzieć się, w jaki sposób obliczane są operatory, których będziemy używać). Na przykład zbiór permutacji zawierających parzystą liczbę parzystych cykli jest określony wzorem
Oznacza to, że istnieje jedna permutacja o rozmiarze zero zawierająca parzystą liczbę parzystych cykli (permutacja pusta, która zawiera zerowe cykle o parzystej długości), jedna taka permutacja o rozmiarze jeden (punkt stały, który zawiera również zerowe cykle o parzystej długości ) i że dla jest takie permutacje.
Permutacje, które są kwadratami
Zastanówmy się, co się stanie, gdy podniesiemy permutację do kwadratu. Punkty stałe są odwzorowywane na punkty stałe. Cykle nieparzyste są odwzorowywane na cykle nieparzyste w korespondencji jeden do jednego, np. zamienia się w . Parzyste cykle dzielą się na dwie części i tworzą parę cykli o połowę mniejszą od pierwotnego cyklu, np. zamienia się w . Stąd permutacje, które są kwadratami, mogą zawierać dowolną liczbę nieparzystych cykli i parzystą liczbę cykli o rozmiarze dwa, parzystą liczbę cykli o rozmiarze cztery itd., i są dane przez
co daje EFG
Nieparzyste niezmienniki cyklu
Przedstawione w dwóch poprzednich podrozdziałach typy permutacji, tj. permutacje zawierające parzystą liczbę cykli i permutacje będące kwadratami, są przykładami tzw . Termin niezmiennik cyklu nieparzystego oznacza po prostu, że przynależność do odpowiedniej klasy kombinatorycznej jest niezależna od wielkości i liczby nieparzystych cykli występujących w permutacji. W rzeczywistości możemy udowodnić, że wszystkie nieparzyste niezmienniki cyklu podlegają prostej rekurencji, którą wyprowadzimy. Po pierwsze, oto kilka przykładów niezmienników cyklu nieparzystego.
Permutacje, w których suma długości parzystych cykli wynosi sześć
Ta klasa ma specyfikację
i funkcja generująca
Kilka pierwszych wartości to
Permutacje, w których wszystkie parzyste cykle mają tę samą długość
Ta klasa ma specyfikację
i funkcja generująca
Jest tu pewien semantyczny niuans. Możemy uznać permutacje nie zawierające parzystych cykli za należące do tej klasy, ponieważ zero jest parzyste . Kilka pierwszych wartości to
Permutacje, w których maksymalna długość parzystego cyklu wynosi cztery
Ta klasa ma specyfikację
i funkcja generująca
Kilka pierwszych wartości to
Nawrót
Obserwuj uważnie, jak skonstruowane są specyfikacje składowej cyklu parzystego. Najlepiej myśleć o nich w kategoriach drzew analizy. Te drzewa mają trzy poziomy. Węzły na najniższym poziomie reprezentują sumy iloczynów cykli o parzystej długości singletonu. . Węzły na poziomie środkowym reprezentują ograniczenia operatora mnogościowego. Wreszcie węzeł na najwyższym poziomie sumuje iloczyny wkładów z poziomu środkowego. Należy zauważyć, że ograniczenia operatora mnogościowego zastosowane do parzystej funkcji generującej zachowają tę cechę, tj. utworzą inną parzystą funkcję generującą. Ale wszystkie dane wejściowe operatorów zbiorów są parzyste, ponieważ wynikają z cykli o parzystej długości. W rezultacie wszystkie zaangażowane funkcje generujące mają postać
gdzie jest funkcją parzystą. To znaczy że
jest parzyste, a zatem
Pozwalając i wyodrębniając współczynniki, stwierdzamy, że