Kowariancja i korelacja

W teorii prawdopodobieństwa i statystyce matematyczne koncepcje kowariancji i korelacji są bardzo podobne. Oba opisują stopień, w jakim dwie zmienne losowe lub zestawy zmiennych losowych mają tendencję do odchylania się od swoich oczekiwanych wartości w podobny sposób.

Jeśli X i Y są dwiema zmiennymi losowymi o średnich ( wartościach oczekiwanych) odpowiednio μ _X i μ _Y oraz odchyleniach standardowych σ _X i σ _Y , to ich kowariancja i korelacja są następujące:

kowariancja	${\ Displaystyle {\ tekst {cov}} _ {XY} = \ sigma _ {XY} = E [(X- \mu _{X})\,(Y-\mu _{Y})]}$
korelacja	${\ Displaystyle {\ tekst {poprawić}} _ {XY} = \ rho _ {XY }=E[(X-\mu _{X})\,(Y-\mu _{Y})]/(\sigma _{X}\sigma _{Y})}$ ,

aby

{\ Displaystyle \ rho _ {XY} = \ sigma _ {XY} / (\ sigma _ {X} \ sigma _ {Y})}

gdzie E jest operatorem wartości oczekiwanej. Warto zauważyć, że korelacja jest bezwymiarowa , podczas gdy kowariancja jest wyrażona w jednostkach uzyskanych przez pomnożenie jednostek dwóch zmiennych.

Jeśli Y zawsze przyjmuje te same wartości co X , mamy kowariancję zmiennej ze sobą samą (tj. ${\ Displaystyle \ sigma _ {X} ^ {2},}$ , która nazywana jest wariancją i jest częściej oznaczana jako ${\ Displaystyle \ sigma _ {XX}$ kwadrat odchylenia standardowego. Korelacja zmiennej z samą sobą wynosi zawsze 1 (z wyjątkiem zdegenerowanego przypadku , w którym dwie wariancje wynoszą zero, ponieważ X zawsze przyjmuje tę samą pojedynczą wartość, w którym to przypadku korelacja nie istnieje, ponieważ jej obliczenie wymagałoby dzielenia przez 0 ). Mówiąc bardziej ogólnie, korelacja między dwiema zmiennymi wynosi 1 (lub –1), jeśli jedna z nich zawsze przyjmuje wartość określoną dokładnie przez funkcję liniową drugiej z odpowiednio dodatnim (lub ujemnym) nachyleniem .

Chociaż wartości kowariancji teoretycznych i korelacji są ze sobą powiązane w powyższy sposób, rozkłady prawdopodobieństwa próbnych oszacowań tych wielkości nie są ze sobą powiązane w żaden prosty sposób i generalnie należy je traktować oddzielnie.

Wiele zmiennych losowych

Przy dowolnej liczbie zmiennych losowych większej niż 1, zmienne te można ułożyć w losowy wektor , którego i ^-tym elementem jest i- ^ta zmienna losowa. Następnie wariancje i kowariancje można umieścić w macierzy kowariancji , w której elementem ( i,j ) jest kowariancja między i- ^tą zmienną losową a j - ^tą . Podobnie korelacje można umieścić w macierzy korelacji .

Analiza szeregów czasowych

W przypadku szeregów czasowych , które są szeroko rozumiane stacjonarne , zarówno średnie, jak i wariancje są stałe w czasie (E( X _n+m ) = E( X _n ) = μ _X i var( X _n+m ) = var( X _n ) i podobnie dla zmiennej Y ). W tym przypadku kowariancja krzyżowa i korelacja krzyżowa są funkcjami różnicy czasu:

kowariancja krzyżowa	${\ Displaystyle \ sigma _ {XY} (m) = E [(X_ {n} -\ mu _{X})\,(Y_{n+m}-\mu _{Y})],}$
korelacja krzyżowa	${\ Displaystyle \ rho _ {XY} (m) = E [(X_ {n} - \ mu _ {X}) \, (Y_ {n + m} - \ mu _ {Y})] / (\ sigma _{X}\sigma _{Y}).}$

Jeśli Y jest tą samą zmienną co X , powyższe wyrażenia są nazywane autokowariancją i autokorelacją :

autokowariancja	${\ Displaystyle \ sigma _ {XX} (m) = E [(X_ {n} -\ mu _{X})\,(X_{n+m}-\mu _{X})],}$
autokorelacja	${\ Displaystyle \ rho _ {XX} (m) = E [(X_ {n} - \ mu _ {X}) \, (X_ {n + m} - \ mu _ {X})] / (\ sigma _{X}^{2}).}$