Centralność bliskości
W spójnym grafie centralność bliskości (lub bliskość ) węzła jest miarą centralności w sieci , obliczoną jako odwrotność sumy długości najkrótszych ścieżek między węzłem a wszystkimi innymi węzłami w grafie. Zatem im bardziej centralny jest węzeł, tym bliżej wszystkich innych węzłów.
została zdefiniowana przez Bavelasa (1950) jako odwrotność oddalenia , czyli:
gdzie jest odległością (długością najkrótszej ścieżki) między wierzchołkami i . Ta nieznormalizowana wersja bliskości jest czasami nazywana statusem. Mówiąc o centralności bliskości, ludzie zwykle odnoszą się do jej znormalizowanej postaci, która reprezentuje średnią długość najkrótszych ścieżek zamiast ich sumy. Ogólnie jest to podane przez poprzedni wzór pomnożony przez , gdzie jest liczbą węzłów na wykresie, co daje:
Normalizacja bliskości upraszcza porównywanie węzłów w grafach o różnych rozmiarach. W przypadku dużych wykresów minus jeden w normalizacji staje się nieistotny i często jest odrzucany.
Jako jedna z najstarszych miar centralności, bliskość jest często podawana w ogólnych dyskusjach na temat miar centralności sieci w tekstach wprowadzających lub w artykułach porównujących różne miary centralności. Wartości wytwarzane przez wiele miar centralności mogą być wysoce skorelowane. W szczególności wykazano , że bliskość i stopień są powiązane w wielu sieciach poprzez przybliżony związek
gdzie to stopień wierzchołka gdy bliskości i stopnia do tego wzoru. Parametr z reprezentuje współczynnik rozgałęzienia, średni stopień węzłów (z wyłączeniem węzła głównego i liści) drzew o najkrótszej ścieżce używanych do przybliżania sieci podczas demonstrowania tej zależności. To nigdy nie jest dokładna zależność, ale oddaje trend obserwowany w wielu rzeczywistych sieciach.
Bliskość jest powiązana z innymi skalami długości używanymi w nauce o sieciach. Na przykład średnia długość najkrótszej ścieżki odległość między wierzchołkami w sieci, jest po prostu średnią odwrotnych
- .
Przyjmowanie odległości od lub do wszystkich innych węzłów jest nieistotne w przypadku grafów nieskierowanych, podczas gdy w przypadku grafów skierowanych może dać zupełnie inne wyniki (np. witryna internetowa może mieć dużą centralność bliskości z linków wychodzących, ale niską centralność bliskości z linków przychodzących).
Aplikacje
Bliskość jest używana w wielu różnych kontekstach. W bibliometrii bliskość została wykorzystana do przyjrzenia się sposobowi, w jaki naukowcy wybierają swoje czasopisma i bibliografie z różnych dziedzin lub do pomiaru wpływu autora na dziedzinę i jego kapitał społeczny. Gdy jest używany do wybierania potencjalnych potencjalnych klientów w danych klienta, bliskość okazała się prowadzić do znacznego wzrostu wskaźnika sukcesu. Wykazano, że bliskość miasta do sieci transportu lotniczego jest silnie skorelowana ze wskaźnikami społeczno-ekonomicznymi, takimi jak regionalny produkt krajowy brutto. Bliskość została również zastosowana do sieci biologicznych, gdzie na przykład została wykorzystana do zidentyfikowania ponad 50% globalnych regulatorów w obrębie 2% najwyżej sklasyfikowanych genów lub stwierdzono, że geny podstawowe mają większą bliskość niż nieistotne geny w białkach sieci interakcji. W sieci metabolicznej bliskość węzłów może identyfikować najważniejsze metabolity.
W rozłączonych grafach
Kiedy wykres nie jest powiązany , Beauchamp zamiast odwrotności sumy odległości, zgodnie z :
Modyfikacja Beauchampa jest zgodna z (znacznie późniejszą) ogólną zasadą zaproponowaną przez Marchiori i Latora (2000), że w grafach o nieskończonych odległościach średnia harmoniczna zachowuje się lepiej niż średnia arytmetyczna. Rzeczywiście, bliskość Bavelasa można opisać jako zdenormalizowaną odwrotność średniej arytmetycznej odległości, podczas gdy centralność Beauchampa jest odwrotnością średniej harmonicznej odległości.
kilkakrotnie w literaturze, często bez współczynnika normalizacji grafów nieskierowanych pod nazwą centralność wartościowana przez Dekkera (2005) i pod nazwą harmoniczna autorstwa Rochata (2009) ; if został aksjomatyzowany przez Garga (2009) i ponownie zaproponowany później przez Opsahla (2010). Zostało to zbadane na grafach skierowanych ogólnie przez Boldi i Vigna (2014). Pomysł ten jest również dość podobny do potencjału rynkowego zaproponowanego przez Harrisa (1954), który obecnie często określany jest jako dostęp do rynku.
Warianty
Dangalchev (2006) w pracy na temat podatności sieci proponuje dla grafów nieskierowanych inną definicję:
Ta definicja jest skutecznie wykorzystywana do grafów rozłączonych i pozwala tworzyć wygodne formuły operacji na grafach. Na przykład:
Jeśli wykres tworzony przez połączenie węzła wykresu sol + wykresu, to połączona bliskość to:
sol jest tworzony przez zwijanie węzła węzła sol wykresu w jeden węzeł, to bliskość wynosi:
Jeśli wykres wykresem cierniowym wykresu ma , to bliskość to:
Naturalnym uogólnieniem tej definicji jest:
gdzie ). Wraz ze wzrostem od 0 do 1 uogólniona bliskość zmienia się z charakterystyki lokalnej (stopień) na globalną (liczba połączonych węzłów
Informacyjna centralność Stephensona i Zelena (1989) jest kolejną miarą bliskości, która oblicza średnią harmoniczną odległości rezystancji w kierunku wierzchołka x , która jest mniejsza, jeśli x ma wiele ścieżek o małym oporze łączących go z innymi wierzchołkami.
W klasycznej definicji centralności bliskości rozprzestrzenianie się informacji jest modelowane za pomocą najkrótszych ścieżek. Ten model może nie być najbardziej realistyczny dla wszystkich typów scenariuszy komunikacji. W związku z tym omówiono pokrewne definicje do pomiaru bliskości, takie jak centralność bliskości spaceru losowego wprowadzona przez Noh i Rieger (2004). Mierzy prędkość, z jaką losowo poruszające się wiadomości docierają do wierzchołka z innego miejsca na grafie. Hierarchiczna bliskość Tran i Kwon (2014) to rozszerzona centralność bliskości, która jeszcze w inny sposób radzi sobie z ograniczeniem bliskości w grafach, które nie są silnie powiązane. Hierarchiczna bliskość zawiera jawnie informację o zasięgu innych węzłów, na które dany węzeł może oddziaływać.