Moran I
W statystyce I Morana jest miarą autokorelacji przestrzennej opracowanej przez Patricka Alfreda Pierce'a Morana . Autokorelacja przestrzenna charakteryzuje się korelacją sygnału między pobliskimi lokalizacjami w przestrzeni. autokorelacja jednowymiarowa, ponieważ korelacja przestrzenna jest wielowymiarowa (tj. 2 lub 3 wymiary przestrzeni) i wielokierunkowa.
Global Moran I
I Morana jest miarą ogólnego skupienia danych przestrzennych. Określa się jako
Gdzie
- to liczba jednostek przestrzennych indeksowanych przez i ;
- jest zmienną będącą przedmiotem zainteresowania;
- jest średnią ;
- jest macierzą wag przestrzennych z zerami na przekątnej (tj. );
- W {\ jest sumą wszystkich tj. .
Definiowanie macierzy wag
Wartość może w dużym stopniu zależeć od założeń wbudowanych w przestrzenną macierz wag . Macierz jest wymagana, ponieważ aby zająć się autokorelacją przestrzenną, a także modelować interakcje przestrzenne, musimy narzucić strukturę ograniczającą liczbę rozważanych sąsiadów. Jest to związane z pierwszym prawem geografii Toblera , które mówi, że wszystko zależy od wszystkiego innego, ale rzeczy bliższe jeszcze bardziej — innymi słowy, prawo implikuje przestrzenną zaniku odległości , taka, że chociaż wszystkie obserwacje mają wpływ na wszystkie inne obserwacje, to po przekroczeniu pewnego progu odległości wpływ ten można pominąć.
Chodzi o to, aby skonstruować macierz, która dokładnie odzwierciedla twoje założenia dotyczące danego zjawiska przestrzennego. Powszechnym podejściem jest nadawanie wagi 1, jeśli dwie strefy są sąsiadami, a 0 w przeciwnym razie, chociaż definicja „sąsiadów” może się różnić. Innym powszechnym podejściem może być nadanie wagi 1 , w przeciwnym razie 0. Alternatywą jest użycie funkcji zaniku odległości do przypisania wag. Czasami długość wspólnej krawędzi jest używana do przypisywania sąsiadom różnych wag. Przy doborze macierzy wag przestrzennych należy kierować się teorią omawianego zjawiska. Wartość i może wpływać na wnioski wyciągane na temat zjawiska, zwłaszcza przy użyciu odległości.
Wartość oczekiwana
I Morana przy hipotezie zerowej o braku autokorelacji przestrzennej wynosi
Rozkład zerowy używany do tego oczekiwania polega na tym, że są permutowane przez permutację równomiernie losowo (a oczekiwanie jest ponad wybieraniem permutacji)
Przy dużych rozmiarach próbek (tj. gdy N zbliża się do nieskończoności) wartość oczekiwana zbliża się do zera.
Jego wariancja jest równa
Gdzie
Wartości I zwykle mieszczą się w zakresie od -1 do +1. Wartości znacznie poniżej -1/(N-1) wskazują na ujemną autokorelację przestrzenną, a wartości znacznie powyżej -1/(N-1) wskazują na dodatnią autokorelację przestrzenną. I Morana można przekształcić w z-score .
I Morana jest odwrotnie proporcjonalne do C Geary'ego , ale nie jest identyczne. I Morana jest miarą globalnej autokorelacji przestrzennej, podczas gdy C Geary'ego jest bardziej wrażliwa na lokalną autokorelację przestrzenną.
Lokalny Moran I
Globalna analiza autokorelacji przestrzennej daje tylko jedną statystykę podsumowującą cały badany obszar. Innymi słowy, analiza globalna zakłada jednorodność. Jeśli to założenie nie jest spełnione, posiadanie tylko jednej statystyki nie ma sensu, ponieważ statystyka powinna różnić się w przestrzeni.
Co więcej, nawet jeśli nie ma globalnej autokorelacji ani grupowania, nadal możemy znaleźć skupienia na poziomie lokalnym za pomocą analizy lokalnej autokorelacji przestrzennej. Fakt, że I Morana jest sumą poszczególnych iloczynów krzyżowych , jest wykorzystywany przez „lokalne wskaźniki asocjacji przestrzennej” (LISA) do oceny grupowania w tych indywidualnych jednostkach poprzez obliczenie I Morana lokalnego dla każdej jednostki przestrzennej i ocenę istotności statystycznej dla każdej ja ja . Z równania Globalnego Morana I możemy otrzymać:
Gdzie:
Następnie,
I to globalna autokorelacja I mierząca globalną autokorelację Morana, I i to lokalna, a N to liczba jednostek analizy na mapie.
LISA można na przykład obliczyć w GeoDa , który wykorzystuje Local Moran's I , zaproponowany przez Luca Anselina w 1995 roku.
Używa
Moran's I jest szeroko stosowany w dziedzinie geografii i informacji geograficznej . Niektóre przykłady obejmują:
- Analiza różnic geograficznych w zmiennych dotyczących zdrowia.
- Charakterystyka wpływu stężeń litu w wodach publicznych na zdrowie psychiczne.
- W dialektologii do pomiaru znaczenia zmienności języka regionalnego.
- Definiowanie funkcji celu dla sensownej segmentacji terenu do badań geomorfologicznych
Zobacz też
- Pojęcia i techniki we współczesnej geografii
- Zanik odległości
- Geary C
- Wskaźniki asocjacji przestrzennej
- Heterogeniczność przestrzenna
- Pierwsze prawo geografii Toblera