Normalnie rozłożony i nieskorelowany nie oznacza niezależnego

W teorii prawdopodobieństwa , chociaż proste przykłady ilustrują, że liniowa nieskorelacja dwóch zmiennych losowych generalnie nie implikuje ich niezależności , czasami błędnie uważa się, że implikuje to, gdy dwie zmienne losowe mają rozkład normalny . Ten artykuł pokazuje, że założenie rozkładów normalnych nie ma takiej konsekwencji, chociaż wielowymiarowy rozkład normalny , w tym dwuwymiarowy rozkład normalny , ma.

Powiedzieć, że para zmiennych losowych ma dwuwymiarowy rozkład normalny oznacza, X + i dla stałych (tj. nie losowych) współczynników i (nie oba są równe zeru) ma jednowymiarowy rozkład normalny. , jeśli i są są niezależne. Jednak możliwe jest, aby dwie zmienne losowe zmienne tak rozłożone łącznie, że każda z nich ma rozkład marginalnie normalny i są nieskorelowane, ale nie są niezależne przykłady podano poniżej.

Przykłady

Przykład symetryczny

Two normally distributed, uncorrelated but dependent variables.
Wspólny zakres i . Ciemniejszy oznacza wyższą wartość funkcji gęstości.

Załóżmy, ma rozkład normalny z wartością oczekiwaną 0 i wariancją 1. Niech Rademachera , tak że lub każdy z prawdopodobieństwem 1/2 i załóżmy, że jest niezależny od . Niech . Następnie

  • i są nieskorelowane;
  • oba mają ten sam rozkład normalny; I
  • i nie są niezależne.

Aby zobaczyć, że i są nieskorelowane, można rozważyć kowariancję z definicji to Jest

Następnie z definicji zmiennych losowych , i oraz niezależności od W {\ displaystyle W} , ma \

Aby zobaczyć, że { \

ponieważ oba ten sam rozkład normalny jest funkcją standardowego .

Aby zobaczyć, że niezależne , zauważ, lub że .

Wreszcie, rozkład prostej kombinacji liniowej prawdopodobieństwo na 0: . Dlatego zmienna losowa , a więc także i Y nie mają wspólnego rozkładu normalnego (zgodnie z powyższą definicją).

Asymetryczny przykład

Gęstość stawów i . Ciemniejszy oznacza wyższą wartość gęstości.

Załóżmy, z wartością oczekiwaną 0 i wariancją 1. Niech

gdzie jest którą należy określić poniżej. Jeśli do bardzo mała, to korelacja jest bliska if jest bardzo duży, więc jest blisko 1. Ponieważ korelacja jest funkcją ciągłą , twierdzenie o wartości pośredniej implikuje, że istnieje jakaś konkretna wartość Ta wartość wynosi około 1,54. W takim przypadku i , ale wyraźnie nie są niezależne, ponieważ określają .

Aby zobaczyć, że ma normalny - w rzeczywistości, że jego rozkład jest taki sam jak rozkład można obliczyć jego dystrybucję skumulowaną :

gdzie przedostatnia równość wynika z symetrii rozkładu warunku, że .

W tym przykładzie różnica nie jest bliska rozkładowi normalnemu, ponieważ istnieje znaczne prawdopodobieństwo (około 0,88) tego, że będzie równa 0. Z kolei rozkład normalny, będąc rozkładem ciągłym, X - Y { nie ma części dyskretnej - to znaczy nie skupia więcej niż zero prawdopodobieństwa w żadnym pojedynczym punkcie. W konsekwencji nie mają wspólnego normalnego, mimo że mają oddzielny rozkład

Przykłady ze wsparciem prawie wszędzie w ℝ 2

Powszechnie wiadomo, że niezależnych odchyleń ma . dobrze można zacząć od zmiennej losowej Cauchy'ego rozkład warunkowy, warunek, że X_ {i i normalnymi Przechodząc przez matematykę, można to znaleźć

w którym jest zmienną losową Rademachera i jest 2 chi -kwadrat o dwóch stopniach swobody.

Rozważmy dwa zestawy , . Zauważ, że indeksowany przez znaczy ta sama zmienna losowa Cauchy'ego w definicji obu i . To udostępnianie skutkuje zależnościami między wskaźnikami: ani ani nie jest niezależne od . Niemniej jednak wszystkie i } są nieskorelowane, ponieważ wszystkie rozkłady dwuwymiarowe mają symetrię odbicia na osiach.

Nienormalne wspólne rozkłady z normalnymi brzegami.

Rysunek przedstawia wykresy rozrzutu próbek pobranych z powyższego rozkładu. Daje to dwa przykłady rozkładów dwuwymiarowych, które są nieskorelowane i mają normalne rozkłady krańcowe, ale nie są niezależne. Lewy panel pokazuje łączną dystrybucję i ; dystrybucja ma wsparcie wszędzie, ale nie u źródła. Prawy panel pokazuje łączną dystrybucję i ; rozkład ma wsparcie wszędzie poza osiami i ma nieciągłość na początku: gęstość rozchodzi się, gdy zbliżamy się do początku wzdłuż dowolnej prostej ścieżki z wyjątkiem osi.

Zobacz też

Uwagi