Dane dwuwymiarowe

W statystyce dane dwuwymiarowe to dane dotyczące każdej z dwóch zmiennych , gdzie każda wartość jednej ze zmiennych jest powiązana z wartością drugiej zmiennej. Zazwyczaj interesujące byłoby zbadanie możliwego związku między tymi dwiema zmiennymi. Powiązanie można badać za pomocą tabeli lub wykresu lub za pomocą przykładowych statystyk, które można wykorzystać do wnioskowania. Metoda zastosowana do zbadania związku zależałaby od poziomu pomiaru zmiennej. To powiązanie, które obejmuje dokładnie dwie zmienne, można nazwać korelacją dwuwymiarową lub powiązaniem dwuwymiarowym.

W przypadku dwóch zmiennych ilościowych (przedział lub stosunek poziomu pomiaru ) można zastosować wykres rozrzutu, a do ilościowego określenia związku można zastosować współczynnik korelacji lub model regresji . W przypadku dwóch zmiennych jakościowych (nominalnych lub porządkowych na poziomie pomiaru ) można użyć tabeli kontyngencji do przeglądania danych oraz zastosować miarę związku lub test niezależności.

Jeśli zmienne są ilościowe, pary wartości tych dwóch zmiennych są często przedstawiane jako pojedyncze punkty na płaszczyźnie za pomocą wykresu punktowego . Odbywa się to tak, że związek (jeśli istnieje) między zmiennymi jest łatwo widoczny. Na przykład dane dwuwymiarowe na wykresie punktowym można wykorzystać do zbadania związku między długością kroku a długością nóg. W przypadku korelacji dwuwymiarowej wartości odstające mogą być niezwykle problematyczne, gdy obejmują skrajne wyniki obu zmiennych. Najlepszym sposobem na znalezienie tych wartości odstających jest spojrzenie na wykresy rozrzutu i sprawdzenie, czy między zmiennymi wyróżniają się jakieś punkty danych.

Zmienne zależne i niezależne

W niektórych przypadkach danych dwuwymiarowych określa się, że jedna zmienna wpływa lub determinuje drugą zmienną, a terminy zmienne zależne i niezależne są używane do rozróżnienia między tymi dwoma typami zmiennych. W powyższym przykładzie długość nóg osoby jest zmienną niezależną. Długość kroku zależy od długości nóg osoby, więc jest zmienną zależną. Posiadanie długich nóg zwiększa długość kroku, ale zwiększenie długości kroku nie zwiększy długości nóg.

Korelacje między dwiema zmiennymi są określane jako korelacje silne lub słabe i oceniane w skali od –1 do 1, gdzie 1 to doskonała korelacja bezpośrednia, –1 to doskonała korelacja odwrotna, a 0 to brak korelacji. W przypadku długich nóg i długich kroków istniałaby silna bezpośrednia korelacja.

Analiza danych dwuwymiarowych

W analizie danych dwuwymiarowych zwykle porównuje się statystyki zbiorcze każdej ze zmiennych lub wykorzystuje analizę regresji , aby znaleźć siłę i kierunek określonego związku między zmiennymi. Jeśli każda zmienna może przyjmować tylko jedną z niewielkiej liczby wartości, na przykład tylko „mężczyzna” lub „kobieta” lub tylko „leworęczny” lub „praworęczny”, wówczas wspólny rozkład częstotliwości można wyświetlić w przypadku tabela , którą można przeanalizować pod kątem siły związku między dwiema zmiennymi.

  1. ^ „Dwuwymiarowy” . Badania Wolframa . Źródło 2011-08-15 .
  2. ^ Moore, Dawid; McCabe, George (1999). Wprowadzenie do praktyki statystyki (wyd. Trzecie). Nowy Jork: WH Freeman and Company. P. 104.
  3. ^ a b Ott, Lyman; Longnecker, Michael (2010). Wprowadzenie do metod statystycznych i analizy danych (wyd. Szóste). Belmont, Kalifornia: Brooks/Cole. s. 102–112.
  4. ^ Krajowa Rada Nauczycieli Matematyki. „Statystyka i problem prawdopodobieństwa”. Pobrano 7 sierpnia 2013 z http://www.nctm.org/uploadedFiles/Statistics%20and%20Probability%20Problem%202.pdf#search=%22bivariate [ stały martwy link ] data%22
  5. ^ Narodowe Centrum Statystyki Edukacji. „Co to są zmienne niezależne i zależne? Strefa dziecięca NCES”. Pobrano 7 sierpnia 2013 z http://nces.ed.gov/nceskids/help/user_guide/graph/variables.asp
  6. Bibliografia _ (4 stycznia 2013). "Korelacja". Matematyka jest fajna. Pobrano 7 sierpnia 2013 z http://www.mathsisfun.com/data/correlation.html