Kowariancja i korelacja

W teorii prawdopodobieństwa i statystyce matematyczne koncepcje kowariancji i korelacji są bardzo podobne. Oba opisują stopień, w jakim dwie zmienne losowe lub zestawy zmiennych losowych mają tendencję do odchylania się od swoich oczekiwanych wartości w podobny sposób.

Jeśli X i Y są dwiema zmiennymi losowymi o średnich ( wartościach oczekiwanych) odpowiednio μ X i μ Y oraz odchyleniach standardowych σ X i σ Y , to ich kowariancja i korelacja są następujące:

kowariancja
korelacja ,

aby

gdzie E jest operatorem wartości oczekiwanej. Warto zauważyć, że korelacja jest bezwymiarowa , podczas gdy kowariancja jest wyrażona w jednostkach uzyskanych przez pomnożenie jednostek dwóch zmiennych.

Jeśli Y zawsze przyjmuje te same wartości co X , mamy kowariancję zmiennej ze sobą samą (tj. , która nazywana jest wariancją i jest częściej oznaczana jako kwadrat odchylenia standardowego. Korelacja zmiennej z samą sobą wynosi zawsze 1 (z wyjątkiem zdegenerowanego przypadku , w którym dwie wariancje wynoszą zero, ponieważ X zawsze przyjmuje tę samą pojedynczą wartość, w którym to przypadku korelacja nie istnieje, ponieważ jej obliczenie wymagałoby dzielenia przez 0 ). Mówiąc bardziej ogólnie, korelacja między dwiema zmiennymi wynosi 1 (lub –1), jeśli jedna z nich zawsze przyjmuje wartość określoną dokładnie przez funkcję liniową drugiej z odpowiednio dodatnim (lub ujemnym) nachyleniem .

Chociaż wartości kowariancji teoretycznych i korelacji są ze sobą powiązane w powyższy sposób, rozkłady prawdopodobieństwa próbnych oszacowań tych wielkości nie są ze sobą powiązane w żaden prosty sposób i generalnie należy je traktować oddzielnie.

Wiele zmiennych losowych

Przy dowolnej liczbie zmiennych losowych większej niż 1, zmienne te można ułożyć w losowy wektor , którego i -tym elementem jest i- ta zmienna losowa. Następnie wariancje i kowariancje można umieścić w macierzy kowariancji , w której elementem ( i,j ) jest kowariancja między i- zmienną losową a j - . Podobnie korelacje można umieścić w macierzy korelacji .

Analiza szeregów czasowych

W przypadku szeregów czasowych , które są szeroko rozumiane stacjonarne , zarówno średnie, jak i wariancje są stałe w czasie (E( X n+m ) = E( X n ) = μ X i var( X n+m ) = var( X n ) i podobnie dla zmiennej Y ). W tym przypadku kowariancja krzyżowa i korelacja krzyżowa są funkcjami różnicy czasu:

kowariancja krzyżowa
korelacja krzyżowa

Jeśli Y jest tą samą zmienną co X , powyższe wyrażenia są nazywane autokowariancją i autokorelacją :

autokowariancja
autokorelacja