Model konfiguracji

Rysunek 1. Sekwencja stopni i różne realizacje sieci w modelu konfiguracyjnym

W nauce o sieciach model konfiguracji jest metodą generowania losowych sieci z danej sekwencji stopni . Jest szeroko stosowany jako model referencyjny dla rzeczywistych sieci społecznościowych , ponieważ umożliwia modelarzowi uwzględnienie dowolnych rozkładów stopni.

Uzasadnienie modelu

W modelu konfiguracyjnym stopień każdego wierzchołka jest z góry zdefiniowany, zamiast mieć rozkład prawdopodobieństwa, z którego wybierany jest dany stopień. W przeciwieństwie do modelu Erdősa-Rényiego , sekwencja stopni modelu konfiguracyjnego nie jest ograniczona do rozkładu Poissona , model pozwala użytkownikowi nadać sieci dowolny pożądany rozkład stopni.

Algorytm

Poniższy algorytm opisuje generację modelu:

  1. Weź sekwencję stopni, tj. Przypisz stopień do każdego wierzchołka. Stopnie wierzchołków są reprezentowane jako półogniwa lub odcinki pośrednie. aby móc wykres Sekwencja stopni może być wyprowadzona z rozkładu teoretycznego lub może reprezentować rzeczywistą sieć (określoną na podstawie macierzy sąsiedztwa sieci).
  2. Wybierz równomiernie losowo dwa odcinki i połącz je, aby utworzyć krawędź. parę z pozostałych połącz je Kontynuuj, aż skończą się końcówki. Rezultatem jest sieć z predefiniowaną sekwencją stopni. Realizacja sieci zmienia się wraz z kolejnością wybierania końcówek, mogą one obejmować cykle (b), pętle własne (c) lub wielokrotne łącza (d) (rysunek 1). Jednak oczekiwana liczba pętli własnych i multilinków spada do zera w N → ∞.

Pętle własne, wielokrawędziowe i implikacje

Algorytm opisany powyżej dopasowuje dowolne kody pośredniczące z takim samym prawdopodobieństwem. Jednorodny rozkład dopasowania jest ważną właściwością z punktu widzenia obliczania innych cech generowanych sieci. Proces generowania sieci nie wyklucza zdarzenia wygenerowania pętli własnej lub multilinku. Gdybyśmy zaprojektowali proces, w którym pętle własne i wielokrawędziowe nie są dozwolone, dopasowanie odcinków końcowych nie przebiegałoby zgodnie z równomiernym rozkładem.

Oczekiwana łączna liczba multilinków w sieci z modelem konfiguracji wynosiłaby:

gdzie jest n-tym momentem rozkładu stopni. Dlatego średnia liczba pętli własnych i multilinków jest stała dla niektórych dużych sieci, a gęstość pętli własnych i multilinków, czyli liczba na węzeł, spada do zera, gdy N → ∞ tak długo, jak jest stała i skończona. W przypadku niektórych stopni potęgowych, w których drugi moment jest rozbieżny, gęstość multi-linków może nie zniknąć lub może to .

Dalszą konsekwencją pętli własnych i wielu krawędzi jest to, że nie wszystkie możliwe sieci są generowane z takim samym prawdopodobieństwem. Ogólnie rzecz biorąc, wszystkie możliwe realizacje można wygenerować przez permutację końcówek wszystkich wierzchołków w każdy możliwy sposób. Liczba permutacji wynosi , więc liczba realizacji sekwencji stopni wynosi } Oznaczałoby to, że każda realizacja zachodzi z takim samym prawdopodobieństwem. Jednak pętle własne i wielokrawędziowe mogą zmienić liczbę realizacji, ponieważ permutacja krawędzi własnych może skutkować niezmienioną realizacją. Biorąc pod uwagę, że liczba pętli własnych i wielokrotnych połączeń znika wraz z prawdopodobieństw różnych realizacji będzie niewielka, ale obecna.

Nieruchomości

Prawdopodobieństwo krawędzi

Odgałęzienie węzła z innymi jest i musimy wykluczyć ten, w którym obserwowanie). Wierzchołek ma można połączyć węzeł z takim samym prawdopodobieństwem Prawdopodobieństwo, że odcinek węzła jednego z tych , wynosi . Ponieważ węzeł odcinki prawdopodobieństwo połączenia z wynosi ( k_ wystarczająco duży ). jako prawdopodobieństwo tylko wtedy, gdy krawędzi między węzły i . Należy zauważyć, że ten wzór nie ma zastosowania w przypadku krawędzi własnych.

Biorąc pod uwagę model konfiguracji z rozkładem stopni , prawdopodobieństwo losowo wybranego węzła stopień wynosi . Ale gdybyśmy wzięli jeden z wierzchołków, do których możemy dojść po jednej z krawędzi i , prawdopodobieństwo posiadania stopnia k wynosi . Prawdopodobieństwo dotarcia do węzła o węzły ) na w przeciwieństwie do stopnia typowego węzła z . Zatem oczekuje się, że sąsiad typowego węzła będzie miał wyższy stopień niż sam typowy węzeł. Ta cecha modelu konfiguracyjnego dobrze opisuje zjawisko „moi przyjaciele mają więcej przyjaciół niż ja”.

Współczynnik skupienia

Współczynnik grupowania (średnie prawdopodobieństwo, że sąsiedzi węzła są połączeni) oblicza się w przybliżeniu w następujący sposób: do sol

gdzie oznacza prawdopodobieństwo, że losowa krawędź osiągnie wierzchołek stopnia współczynniki postaci " " zamiast " pojawiają się, ponieważ jeden odcinek pośredni został uwzględniony przez fakt, że są to sąsiedzi Ocena powyższego skutkuje

Używając i p oznaczający rozkład stopni, liczbę wierzchołków, powyższe staje się

gdzie oznaczający drugi moment rozkładu stopni. Zakładając, że są , powyższe zachowuje się jak

gdzie stała zależy od . sposób współczynnik mały w

Gigantyczny składnik

W modelu konfiguracyjnym istnieje gigantyczny komponent (GC), jeśli

gdzie i to pierwszy i drugi moment rozkładu stopni . Oznacza to, że próg krytyczny zależy wyłącznie od wielkości, które są jednoznacznie określone przez rozkład stopni. .

Model konfiguracji generuje lokalnie sieci drzewiaste, co oznacza, że ​​każde lokalne sąsiedztwo w takiej sieci przyjmuje postać drzewa. Dokładniej, jeśli zaczniesz w dowolnym węźle w sieci i utworzysz zbiór wszystkich węzłów w odległości od tego węzła początkowego, zbiór z prawdopodobieństwem dążącym do 1 jako n → ∞ przyjmie re {\ displaystyle d} forma drzewa. strukturach drzewiastych liczba drugich sąsiadów uśredniona w całej wynosi

Wtedy ogólnie średnią liczbę na odległość można zapisać jako:

że ​​jeśli stosunek jest może mieć gigantyczny składnik. Jest to znane jako kryterium Molloya-Reeda. Intuicja stojąca za tym kryterium jest taka, że ​​​​jeśli istnieje gigantyczna składowa (GC), to średni stopień losowo wybranego wierzchołka połączonym komponencie powinien wynosić co najmniej 2. Kryterium Molloya-Reeda można również wyrazić jako ja : co implikuje, że chociaż rozmiar GC może zależeć p i liczba węzłów stopnia 0 i 2 nie ma wpływu na istnienie gigantycznego komponentu

Średnica

Model konfiguracji może przyjąć dowolny rozkład stopni i pokazuje efekt małego świata , ponieważ do wiodącej kolejności średnica modelu konfiguracji wynosi po prostu .

Elementy o skończonej wielkości

liczba wierzchołków dąży do , prawdopodobieństwo znalezienia dwóch gigantycznych komponentów znika. Oznacza to, że w systemie rzadkim model składa się z jednego gigantycznego komponentu (jeśli taki istnieje) i wielu połączonych komponentów o skończonych rozmiarach. Rozmiary połączonych komponentów są charakteryzowane przez ich rozkład wielkości , że losowo próbkowany wierzchołek należy do połączonego komponentu o Istnieje zgodność między rozkładem stopni rozkładem wielkości Gdy całkowita liczba wierzchołków dąży do nieskończoności, zachodzi następująca zależność:

gdzie oznacza splotu n -krotnie . Co więcej wyraźne gdy jest bliskie zeru. Wyrażenia analityczne dla asymptot zależą od skończoności momentów wykładnika ogona rozkładu stopni (gdy \ ciężki ogon) i znak kryterium Molloya-Reeda. Poniższa tabela podsumowuje te relacje (stałe są podane w).

momenty ogon
lekki ogon -1 lub 1
0
ciężki ogon, -1
0
1

ciężki ogon, -1
0
1
ciężki ogon, -1
0
1

ciężki ogon, 1
ciężki ogon, 1

Modelowanie

Porównanie z rzeczywistymi sieciami

Trzy ogólne właściwości złożonych sieci to heterogeniczny rozkład stopni, krótka średnia długość ścieżki i wysokie skupienie. Mając możliwość zdefiniowania dowolnej sekwencji stopni, pierwszy warunek może być spełniony projektowo, ale jak pokazano powyżej, globalny współczynnik grupowania jest odwrotną funkcją rozmiaru sieci, więc w przypadku sieci o dużej konfiguracji klastrowanie jest zwykle małe. Ta cecha modelu bazowego jest sprzeczna ze znanymi właściwościami sieci empirycznych, ale rozszerzenia modelu mogą rozwiązać ten problem (patrz ). do drzewa, pod warunkiem, że średnia rozkładu nadmiaru stopni jest stała lub rośnie wolniej niż z liczby łączy . Innymi słowy, ten model zapobiega tworzeniu się podstruktur, takich jak pętle w limicie dużego rozmiaru. Zanikanie współczynnika grupowania jest szczególnym przypadkiem tego bardziej ogólnego wyniku. Podczas gdy właściwość drzewa sprawia, że ​​model jest mało realistyczny, tak wiele obliczeń, takich jak metody funkcji generującej , jest możliwych dzięki tej funkcji dla modelu konfiguracyjnego.

Zastosowanie: obliczanie modułowości

Model konfiguracyjny jest stosowany jako punkt odniesienia przy obliczaniu modułowości sieci . Modułowość mierzy stopień podziału sieci na moduły. Oblicza się to w następujący sposób:

w którym sąsiedztwa sieci jest porównywana z prawdopodobieństwem posiadania krawędzi między węzłami w modelu konfiguracji ( szczegóły w modułowości strony ) .

Model konfiguracji ukierunkowanej

W DCM (model konfiguracji ukierunkowanej) każdemu węzłowi przypisana jest pewna liczba półkrawędzi zwanych ogonami i głowami. Następnie ogony i głowy są dopasowywane równomiernie losowo, aby utworzyć skierowane krawędzie. Rozmiar gigantycznego komponentu, typowa odległość i średnica DCM zostały zbadane matematycznie. Przeprowadzono również szeroko zakrojone badania dotyczące losowych spacerów w DCM. DCM wymodelował niektóre rzeczywiste złożone sieci, takie jak sieci neuronowe, finansowe i społecznościowe.

Model konfiguracji ukierunkowanej