Kowariancja i korelacja
Część serii poświęconej statystycznym |
korelacjom i kowariancji |
---|
W teorii prawdopodobieństwa i statystyce matematyczne koncepcje kowariancji i korelacji są bardzo podobne. Oba opisują stopień, w jakim dwie zmienne losowe lub zestawy zmiennych losowych mają tendencję do odchylania się od swoich oczekiwanych wartości w podobny sposób.
Jeśli X i Y są dwiema zmiennymi losowymi o średnich ( wartościach oczekiwanych) odpowiednio μ X i μ Y oraz odchyleniach standardowych σ X i σ Y , to ich kowariancja i korelacja są następujące:
aby
gdzie E jest operatorem wartości oczekiwanej. Warto zauważyć, że korelacja jest bezwymiarowa , podczas gdy kowariancja jest wyrażona w jednostkach uzyskanych przez pomnożenie jednostek dwóch zmiennych.
Jeśli Y zawsze przyjmuje te same wartości co X , mamy kowariancję zmiennej ze sobą samą (tj. , która nazywana jest wariancją i jest częściej oznaczana jako kwadrat odchylenia standardowego. Korelacja zmiennej z samą sobą wynosi zawsze 1 (z wyjątkiem zdegenerowanego przypadku , w którym dwie wariancje wynoszą zero, ponieważ X zawsze przyjmuje tę samą pojedynczą wartość, w którym to przypadku korelacja nie istnieje, ponieważ jej obliczenie wymagałoby dzielenia przez 0 ). Mówiąc bardziej ogólnie, korelacja między dwiema zmiennymi wynosi 1 (lub –1), jeśli jedna z nich zawsze przyjmuje wartość określoną dokładnie przez funkcję liniową drugiej z odpowiednio dodatnim (lub ujemnym) nachyleniem .
Chociaż wartości kowariancji teoretycznych i korelacji są ze sobą powiązane w powyższy sposób, rozkłady prawdopodobieństwa próbnych oszacowań tych wielkości nie są ze sobą powiązane w żaden prosty sposób i generalnie należy je traktować oddzielnie.
Wiele zmiennych losowych
Przy dowolnej liczbie zmiennych losowych większej niż 1, zmienne te można ułożyć w losowy wektor , którego i -tym elementem jest i- ta zmienna losowa. Następnie wariancje i kowariancje można umieścić w macierzy kowariancji , w której elementem ( i,j ) jest kowariancja między i- tą zmienną losową a j - tą . Podobnie korelacje można umieścić w macierzy korelacji .
Analiza szeregów czasowych
W przypadku szeregów czasowych , które są szeroko rozumiane stacjonarne , zarówno średnie, jak i wariancje są stałe w czasie (E( X n+m ) = E( X n ) = μ X i var( X n+m ) = var( X n ) i podobnie dla zmiennej Y ). W tym przypadku kowariancja krzyżowa i korelacja krzyżowa są funkcjami różnicy czasu:
Jeśli Y jest tą samą zmienną co X , powyższe wyrażenia są nazywane autokowariancją i autokorelacją :