Centralność pomiędzy

Wykres nieskierowany pokolorowany na podstawie centralności każdego wierzchołka od najmniejszego (czerwony) do największego (niebieski).

W teorii grafów centralność między grafami jest miarą centralności w grafie opartym na najkrótszych ścieżkach . Dla każdej pary wierzchołków w spójnym grafie istnieje co najmniej jedna najkrótsza ścieżka między wierzchołkami, taka że albo liczba krawędzi, przez które przechodzi ścieżka (dla grafów nieważonych), albo suma wag krawędzi (dla grafów ważonych ) jest zminimalizowany. Centralność pośrednia dla każdego wierzchołka to liczba tych najkrótszych ścieżek, które przechodzą przez wierzchołek.

Międzynarodowość centralność została wymyślona jako ogólna miara centralności: odnosi się do szerokiego zakresu problemów w teorii sieci, w tym problemów związanych z sieciami społecznymi , biologią, transportem i współpracą naukową. Chociaż wcześniejsi autorzy intuicyjnie opisywali centralność jako opartą na pośrednictwie, Freeman (1977) podał pierwszą formalną definicję centralności pomiędzy.

Centralność międzynarodowości znajduje szerokie zastosowanie w teorii sieci ; reprezentuje stopień, w jakim węzły stoją między sobą. Na przykład w sieci telekomunikacyjnej węzeł o większej centralności między połączeniami miałby większą kontrolę nad siecią, ponieważ przez ten węzeł przechodzi więcej informacji.

Definicja

Centralność między węzłami określa wyrażenie:

gdzie to całkowita liczba najkrótszych ścieżek od węzła i s to liczba tych ścieżek, które przechodzą przez gdzie punktem końcowym)

Należy zauważyć, że centralność między węzłami skaluje się wraz z liczbą par węzłów, zgodnie z sugestią indeksów sumowania. Dlatego obliczenie można przeskalować, dzieląc przez liczbę par węzłów bez uwzględnienia że . Podział jest wykonywany przez dla skierowanych wykresów i dla grafów nieskierowanych, gdzie węzłów w gigantycznym komponencie. Należy zauważyć, że skaluje się to dla najwyższej możliwej wartości, gdzie jeden węzeł jest przecinany przez każdą najkrótszą ścieżkę. Często tak nie jest, a normalizację można przeprowadzić bez utraty precyzji

Co skutkuje w:

Należy zauważyć, że zawsze będzie to skalowanie z mniejszego zakresu do większego zakresu, więc precyzja nie zostanie utracona.

Sieci ważone

W sieci ważonej łącza łączące węzły nie są już traktowane jako interakcje binarne, ale są ważone proporcjonalnie do ich przepustowości, wpływu, częstotliwości itp., co dodaje kolejny wymiar heterogeniczności w sieci poza efektami topologicznymi. Siła węzła w sieci ważonej jest sumą wag sąsiednich krawędzi.

gdzie macierze sąsiedztwa i wagi między węzłami \ j . Analogicznie do rozkładu potęgowego stopnia występującego w sieciach bez skali, siła danego węzła jest również zgodna z rozkładem prawa potęgowego.

Badanie średniej wartości siły dla wierzchołków z pośrednimi pokazuje że zachowanie funkcjonalne można przybliżyć za pomocą formy skalowania:

Centralność perkolacji

Centralność perkolacji jest wersją centralności ważonej pomiędzy, ale uwzględnia „stan” węzłów źródłowych i docelowych każdej najkrótszej ścieżki przy obliczaniu tej wagi. Perkolacja „zarażenia” występuje w złożonych sieciach w wielu scenariuszach. Na przykład infekcja wirusowa lub bakteryjna może rozprzestrzeniać się w sieciach społecznościowych ludzi, zwanych sieciami kontaktów. Rozprzestrzenianie się chorób można również rozpatrywać na wyższym poziomie abstrakcji, rozważając sieć miast lub skupisk ludności połączonych połączeniami drogowymi, kolejowymi lub lotniczymi. Wirusy komputerowe mogą rozprzestrzeniać się w sieciach komputerowych. Plotki lub wiadomości o ofertach biznesowych i umowach mogą również rozprzestrzeniać się za pośrednictwem sieci społecznościowych. We wszystkich tych scenariuszach „zaraza” rozprzestrzenia się na łącza złożonej sieci, zmieniając „stany” węzłów w miarę rozprzestrzeniania się, w sposób możliwy do odzyskania lub w inny sposób. Na przykład w scenariuszu epidemiologicznym osoby przechodzą ze stanu „podatnego” do „zakażonego” w miarę rozprzestrzeniania się infekcji. Stany, które poszczególne węzły mogą przyjmować w powyższych przykładach, mogą być binarne (takie jak otrzymanie/nieotrzymanie wiadomości), dyskretne (podatne/zainfekowane/wyleczone) lub nawet ciągłe (takie jak odsetek zarażonych osób w mieście ), w miarę rozprzestrzeniania się zarazy. Wspólną cechą wszystkich tych scenariuszy jest to, że rozprzestrzenianie się zarazy powoduje zmianę stanów węzłów w sieciach. Mając to na uwadze, zaproponowano centralność perkolacji (PC), która konkretnie mierzy znaczenie węzłów pod względem wspomagania perkolacji przez sieć. Miara ta została zaproponowana przez Piraveenana, Prokopenko i Hossaina (2013) .

Centralność perkolacji jest zdefiniowana dla danego węzła w danym czasie jako odsetek „ścieżek perkolacji”, które przechodzą przez ten węzeł. „Ścieżka przesiąknięta” to najkrótsza ścieżka między parą węzłów, gdzie węzeł źródłowy jest przesiąknięty (np. zainfekowany). Węzeł docelowy może być przesiąknięty lub nie przesiąknięty lub w stanie częściowo przesiąkniętym.

gdzie to całkowita liczba najkrótszych ścieżek od węzła węzła i i to liczba tych ścieżek, które przechodzą przez . Stan perkolacji węzła w czasie jest oznaczony przez to co wskazuje na stan nieprzesiąknięty w czasie podczas gdy , co wskazuje na stan w pełni przesiąknięty w czasie . Wartości pośrednie wskazują stany częściowo przesiąknięte (np. w sieci miasteczek byłby to odsetek osób zarażonych w tym mieście).

Wagi dołączone do ścieżek perkolacji zależą od poziomów perkolacji przypisanych do węzłów źródłowych, w oparciu o założenie, że im wyższy jest poziom perkolacji węzła źródłowego, tym ważniejsze są ścieżki, które pochodzą z tego węzła. Węzły, które leżą na najkrótszych ścieżkach pochodzących z węzłów o wysokim stopniu perkolacji, są zatem potencjalnie ważniejsze dla perkolacji. Definicję PC można również rozszerzyć, aby obejmowała również wagi węzłów docelowych. Obliczenia centralności perkolacji przebiegają w algorytmu Brandesa i jeśli obliczenia muszą uwzględniać wagi węzłów docelowych, .

Algorytmy

Obliczenie centralności między i bliskości wszystkich wierzchołków na grafie obejmuje obliczenie najkrótszych ścieżek między wszystkimi parami wierzchołków na wykresie, co zajmuje czas z algorytmem Floyda-Warshalla , zmodyfikowanym tak, aby nie tylko znaleźć jedną, ale policzyć wszystkie najkrótsze ścieżki między dwoma węzłami. Na rzadkim wykresie algorytm Johnsona lub algorytm Brandesa mogą być bardziej wydajne, przy czym oba przyjmują czas. zajmuje Brandesa

Przy obliczaniu centralności między i bliskości wszystkich wierzchołków grafu zakłada się, że grafy są nieskierowane i połączone z uwzględnieniem pętli i wielu krawędzi. Kiedy mamy do czynienia z grafami sieciowymi, często grafy są pozbawione pętli lub wielu krawędzi, aby zachować proste relacje (gdzie krawędzie reprezentują połączenia między dwiema osobami lub wierzchołkami). W takim przypadku użycie algorytmu Brandesa podzieli końcowe wyniki centralności przez 2, aby uwzględnić dwukrotne liczenie każdej najkrótszej ścieżki.

Inny algorytm uogólnia rozbieżności Freemana obliczone na podstawie geodezji i rozbieżności Newmana obliczone na wszystkich ścieżkach, wprowadzając hiperparametr kontrolujący kompromis między eksploracją a eksploatacją. Złożoność czasowa to liczba krawędzi pomnożona przez liczbę węzłów w grafie.

Przybliżoną, probabilistyczną ocenę centralności pośrednich można uzyskać znacznie szybciej poprzez próbkowanie ścieżek przy użyciu dwukierunkowego przeszukiwania wszerz .

Aplikacje

Portale społecznościowe

W analizie sieci społecznościowych centralność między powiązaniami może mieć różne implikacje. Z perspektywy makroskopowej pozycje pomostowe lub „dziury strukturalne” (na co wskazuje wysoka centralność pomiędzy) odzwierciedlają władzę, ponieważ pozwalają osobie na pozycji pomostowej sprawować kontrolę (np. decydować, czy dzielić się informacjami, czy nie) nad osobami, które łączy między. Z mikroskopijnej perspektywy sieci ego (tj. biorąc pod uwagę tylko połączenia pierwszego stopnia), w sieciach społecznościowych online wysoka centralność zbiega się z nominacjami najbliższych przyjaciół (tj. silne więzi międzyludzkie ), ponieważ odzwierciedla inwestycje kapitału społecznego w związek, kiedy łączenie odległych kręgów społecznych (np. rodziny i uczelni) (często wynikające z wprowadzenia przez ego).

Sieci rzeczne

złożoności topologicznej sieci rzecznych oraz ich wykorzystania w handlu morskim wykorzystano centralność międzysieciową .

Pojęcia pokrewne

Centralność między powiązaniami jest powiązana z łącznością sieci , ponieważ wierzchołki o wysokim powiązaniu mogą potencjalnie rozłączyć grafy, jeśli zostaną usunięte (patrz zbiór cięć ).

Zobacz też

Bibliografia