Skala Guttmana
W analizie wielowymiarowych obserwacji zaprojektowanych do oceny podmiotów w odniesieniu do atrybutu , skala Guttmana (nazwana na cześć Louisa Guttmana ) jest pojedynczą (jednowymiarową) skalą porządkową do oceny cechy, z której można odtworzyć oryginalne obserwacje. Odkrycie skali Guttmana w danych zależy od ich wielowymiarowego rozkładu zgodnego z określoną strukturą (patrz poniżej). Stąd skala Guttmana jest hipotezą o strukturze danych, sformułowanych w odniesieniu do określonego atrybutu i określonej populacji i nie można ich skonstruować dla żadnego zbioru obserwacji. Wbrew powszechnemu przekonaniu skala Guttmana nie ogranicza się do zmiennych dychotomicznych i niekoniecznie określa kolejność zmiennych. Ale jeśli wszystkie zmienne są dychotomiczne, zmienne są rzeczywiście uporządkowane według ich czułości w rejestrowaniu ocenianego atrybutu, jak ilustruje Przykład 1.
Model deterministyczny
Przykład 1: Zmienne dychotomiczne
Można postawić hipotezę skali Guttmana dla następujących pięciu pytań, które dotyczą atrybutu „akceptacja kontaktów społecznych z imigrantami” (opartego na skali dystansu społecznego Bogardus ), prezentowanego odpowiedniej populacji:
- Czy przyjąłbyś imigrantów jako rezydentów w swoim kraju? (Nie=0; Tak=1)
- Czy przyjąłbyś imigrantów jako mieszkańców swojego miasta? (Nie=0; Tak=1)
- Czy zaakceptowałbyś imigrantów jako mieszkańców w swojej okolicy? (Nie=0; Tak=1)
- Czy zaakceptowałbyś imigrantów jako najbliższych sąsiadów? (Nie=0; Tak=1)
- Czy zaakceptowałbyś imigranta jako małżonka swojego dziecka? (Nie=0; Tak=1)
Pozytywna odpowiedź danego respondenta na dowolne pytanie z tej listy sugeruje pozytywne odpowiedzi tego respondenta na wszystkie poprzednie pytania z tej listy. Można więc spodziewać się uzyskania tylko odpowiedzi wymienionych w zacienionej części (kolumny 1-5) tabeli 1.
Każdy wiersz w zacienionej części Tabeli 1 (kolumny 1-5) to profil odpowiedzi dowolnej liczby (≥ 0) respondentów. Każdy profil w tej tabeli wskazuje na akceptację imigrantów we wszystkich znaczeniach wskazanych przez poprzedni profil, plus dodatkowy sens, w jakim imigranci są akceptowani. Jeżeli w dużej liczbie obserwacji obserwowane są tylko profile wymienione w tabeli 1, to hipoteza skali Guttmana jest potwierdzona, a wartości skali (ostatnia kolumna tabeli 1) mają następujące właściwości:
- Oceniają siłę atrybutu „akceptacja kontaktów społecznych z imigrantami”;
- Odtwarzają oryginalne obserwacje. (Na przykład wynik skali respondenta wynoszący 2 oznacza, że respondent odpowiedział pozytywnie na pytania 1 i 2 oraz negatywnie na pytania 3, 4 i 5.)
Skala Guttmana, jeśli jest poparta danymi, jest przydatna do skutecznej oceny podmiotów (respondentów, badanych lub dowolnego zbioru badanych obiektów) w skali jednowymiarowej w odniesieniu do określonej cechy. Zazwyczaj skale Guttmana znajdują się w odniesieniu do atrybutów, które są wąsko zdefiniowane.
Podczas gdy inne techniki skalowania (np. skala Likerta ) tworzą pojedynczą skalę poprzez zsumowanie wyników respondentów – procedura, która zakłada, często bez uzasadnienia, że wszystkie obserwowane zmienne mają równe wagi – skala Guttmana unika ważenia obserwowanych zmiennych; w ten sposób „szanując” dane takimi, jakie są. Jeśli potwierdzona zostanie skala Guttmana, pomiar atrybutu jest z natury jednowymiarowy; jednowymiarowość nie jest wymuszana przez sumowanie lub uśrednianie. Ta cecha sprawia, że nadaje się do konstruowania powtarzalnych teorii naukowych i znaczących pomiarów, jak wyjaśniono w teoria aspektów .
Zmienne porządkowe
Biorąc pod uwagę zbiór danych N osób obserwowanych w odniesieniu do n zmiennych porządkowych, z których każda ma dowolną skończoną liczbę (≥2) kategorii liczbowych uporządkowanych według rosnącej siły wcześniej określonego atrybutu, niech a ij będzie wynikiem uzyskanym przez podmiot i na zmiennej j i zdefiniuj listę wyników, które podmiot i uzyskał na podstawie n zmiennych, a i = a i1 …a w , jako profil podmiotu i . (Liczba kategorii może być różna dla różnych zmiennych, a kolejność zmiennych w profilach nie jest ważna, ale powinna być ustalona).
Definiować:
Dwa profile, a s i a t są równe , oznaczane jako s = a t , jeśli a sj = a tj dla wszystkich j = 1… n
Profil a s jest większy niż Profil a t , oznaczony jako sj s > a t , iff a sj ≥ a tj dla wszystkich j =1… n oraz a ' > a tj' dla co najmniej jednej zmiennej j' .
Profile a s i a t są porównywalne , oznaczane jako s Sa t , iff a s = a t ; lub t ; a > a lub a t > a s
Profile a s i a t są nieporównywalne , oznaczane jako s $ a t , jeśli nie są porównywalne (tzn. dla co najmniej jednej zmiennej j' , a sj' > a tj' i dla co najmniej jednej innej zmiennej j '' , a tj'' > a sj '' .
Dla zbiorów danych, w których kategorie wszystkich zmiennych są podobnie uporządkowane liczbowo (od wysokiego do niskiego lub od niskiego do wysokiego) w odniesieniu do danego atrybutu, skala Guttmana jest definiowana po prostu następująco:
Definicja: Skala Guttmana to zbiór danych, w którym wszystkie pary profili są porównywalne.
Przykład: zmienne niedychotomiczne
Rozważmy następujące cztery zmienne, które oceniają umiejętności arytmetyczne wśród populacji P uczniów:
V1: Czy uczeń (p) potrafi dodawać liczby? nr=1; Tak, ale tylko z liczb dwucyfrowych=2; Tak=3.
V2: Czy uczeń (p) zna tabliczkę mnożenia (1-10)? nr=1; Tak=2.
V3: Czy uczeń (p) potrafi wykonać mnożenie liczb? nr=1; Tak, ale tylko z liczb dwucyfrowych=2; Tak=3.
V4: Czy uczeń (p) potrafi wykonać dzielenie długie? nr=1; Tak=2.
Można postawić hipotezę, że dane zebrane dla powyższych czterech zmiennych wśród populacji dzieci w wieku szkolnym przedstawiają skalę Guttmana przedstawioną poniżej w tabeli 2:
Tabela 2. Przypuszcza się, że dane czterech porządkowych zmiennych umiejętności arytmetycznych tworzą skalę Guttmana
V 1 | V 2 | V 3 | V 4 |
Możliwy
Wynik skali |
1 | 1 | 1 | 1 | 4 |
2 | 1 | 1 | 1 | 5 |
2 | 2 | 1 | 1 | 6 |
3 | 2 | 1 | 1 | 7 |
3 | 2 | 2 | 1 | 8 |
3 | 2 | 3 | 1 | 9 |
3 | 2 | 3 | 2 | 10 |
Zestaw profili, o których przypuszcza się, że występują (zacieniona część w Tabeli 2) ilustruje charakterystyczną cechę skali Guttmana, a mianowicie, że każda para profili jest porównywalna. Tutaj również, jeśli hipoteza zostanie potwierdzona, pojedynczy wynik na skali odtwarza odpowiedzi podmiotu we wszystkich obserwowanych zmiennych.
Dowolny uporządkowany zestaw liczb może służyć jako skala. Na tej ilustracji wybraliśmy sumę wyników profili. Zgodnie z teorią fasetową, tylko w danych zgodnych ze skalą Guttmana takie sumowanie może być uzasadnione.
Powtarzalność
W praktyce doskonałe („deterministyczne”) skale Guttmana są rzadkie, ale przybliżone zostały znalezione w określonych populacjach w odniesieniu do atrybutów, takich jak praktyki religijne, wąsko zdefiniowane dziedziny wiedzy, określone umiejętności i posiadanie sprzętu gospodarstwa domowego. Gdy dane nie są zgodne ze skalą Guttmana, mogą albo reprezentować skalę Guttmana z szumem (i traktowaną stochastycznie), albo mogą mieć bardziej złożoną strukturę wymagającą wielokrotnego skalowania w celu identyfikacji właściwych im skal.
Stopień, w jakim zbiór danych jest zgodny ze skalą Guttmana, można oszacować na podstawie współczynnika odtwarzalności, którego istnieje kilka wersji, w zależności od założeń statystycznych i ograniczeń. Oryginalna definicja współczynnika odtwarzalności Guttmana, C R , wynosi po prostu 1 minus stosunek liczby błędów do liczby wpisów w zbiorze danych. Aby upewnić się, że istnieje zakres odpowiedzi (nie w przypadku, gdy wszyscy respondenci poparli tylko jedną pozycję), stosuje się współczynnik skalowalności.
U Guttmana skalowanie jest początkiem teorii odpowiedzi na pozycje , która w przeciwieństwie do klasycznej teorii testów uznaje, że nie wszystkie pozycje w kwestionariuszach mają ten sam poziom trudności. Opracowano modele niedeterministyczne (tj. stochastyczne), takie jak skala Mokkena i model Rascha . Skala Guttmana została uogólniona na teorię i procedury „wielokrotnego skalowania”, które określa minimalną liczbę skal potrzebnych do zadowalającej odtwarzalności.
Jako procedura łącząca treści merytoryczne z logicznymi aspektami danych, skala Guttmana zwiastowała nadejście teorii fasetowej opracowanej przez Louisa Guttmana i jego współpracowników.
Skala Guttmana w zmiennych jakościowych
skali Guttmana pozwala również na eksploracyjną analizę skalowania zmiennych jakościowych (zmiennych nominalnych lub zmiennych porządkowych, które niekoniecznie należą do z góry określonego wspólnego atrybutu). Ta definicja skali Guttmana opiera się na wcześniejszej definicji prostej funkcji .
Dla całkowicie uporządkowanego zbioru X , powiedzmy 1,2,…, m , i innego zbioru skończonego Y , z k elementami k ≤ m , funkcja od X do Y jest funkcją prostą, jeśli X można podzielić na k przedziałów, które są w relacji jeden do jednego z wartościami Y .
Skalę Guttmana można zatem zdefiniować dla zbioru danych n zmiennych, przy czym j -ta zmienna ma k j (jakościowe, niekoniecznie uporządkowane) kategorie, a więc:
Definicja: Skala Guttmana jest zbiorem danych, dla którego istnieje zmienna porządkowa X , ze skończoną liczbą m kategorii, powiedzmy 1,…, m gdzie m ≥ max j ( k j ) oraz permutacja profili badanych, taka że każda zmienna w zbiorze danych jest prostą funkcją X .
Pomimo pozornej elegancji i atrakcyjności dla badań eksploracyjnych, definicja ta nie została wystarczająco zbadana ani zastosowana.
- ^ a b Coombs, Clyde; Coombs, Lolagene; Języki, James (1978). „Rozdział 11: Stochastyczne skale skumulowane”. W Shye, Samuel (red.). Budowa teorii i analiza danych w naukach behawioralnych . San Francisco: Jossey-Bass. s. 280–298. ISBN 0-87589-379-1 .
- ^ Stouffer, SA, Guttman, L., Suchman, EA, Lazarsfeld, PF, Star, SA, Clausen, JA (1950) Pomiar i przewidywanie Princeton University Press
- ^ a b Guttman, Louis (1944). „Podstawa do skalowania danych jakościowych”. Amerykański Przegląd Socjologiczny . 9 (2): 139–150. doi : 10.2307/2086306 . JSTOR 2086306 .
- ^ Menzel, H. (1953) Nowy współczynnik do analizy skalogramu w kwartalniku edukacyjnym i opinii publicznej, tom: 15, numer: 2, strony: 268-280
Dalsza lektura
- Coombs, CH, Coombs, LC i Lingoes, JC (1978). „Stochastyczne skale skumulowane”. W S. Shye (red.), Budowa teorii i analiza danych w naukach behawioralnych. San Francisco : Jossey-Bass.
- Goodman, LA (1975). „Nowy model skalowania wzorców odpowiedzi: zastosowanie koncepcji quasi-niezależności”. Journal of American Statistical Association , 70, 755–768.
- Guttman, L. (1944). „Podstawa do skalowania danych jakościowych”. Amerykański przegląd socjologiczny , 9, 139–150.
- Zielony, BF (1956). „Metoda analizy skalogramu z wykorzystaniem statystyk podsumowujących”. Psychometria , 21, 79-88.