Regresja ważona jednostkami
W statystyce regresja ważona jednostkami jest uproszczoną i solidną wersją ( Wainer i Thissen, 1976) analizy regresji wielokrotnej , w której szacowany jest tylko wyraz wolny. To znaczy pasuje do modelu
gdzie każda z nich binarną , może pomnożoną przez dowolną wagę.
Porównaj to z bardziej powszechnym modelem regresji wielokrotnej, w którym każdy predyktor ma swój własny szacowany współczynnik:
W naukach społecznych regresja ważona jednostkami jest czasami używana do klasyfikacji binarnej , tj. do przewidywania odpowiedzi tak-nie , gdzie wskazuje „nie”, „tak”. Jest łatwiejsza do interpretacji niż wielokrotna regresja liniowa (znana jako liniowa analiza dyskryminacyjna w przypadku klasyfikacji).
Masy jednostkowe
Regresja ważona jednostkami to metoda solidnej regresji , która przebiega w trzech krokach. Najpierw wybierane są predyktory dla wyniku będącego przedmiotem zainteresowania; w idealnym przypadku wybór powinien mieć dobre empiryczne lub teoretyczne uzasadnienie. Po drugie, predyktory są konwertowane do postaci standardowej. Na koniec predyktory są sumowane, a suma ta nazywana jest zmienną, która służy jako predyktor wyniku.
Metoda Burgessa
Metoda Burgessa została po raz pierwszy przedstawiona przez socjologa Ernesta W. Burgessa w badaniu z 1928 r., Które miało na celu określenie sukcesu lub porażki więźniów zwolnionych warunkowo. Najpierw wybrał 21 zmiennych, które uważa się za związane z sukcesem zwolnienia warunkowego. Następnie przekonwertował każdy predyktor na standardową postać zera lub jeden (Burgess, 1928). Gdy predyktory miały dwie wartości, wartość związana z docelowym wynikiem była kodowana jako jedna. Burgess wybrał sukces na zwolnieniu warunkowym jako docelowy wynik, a więc predyktor, taki jak historia kradzieży został zakodowany jako „tak” = 0 i „nie” = 1. Te zakodowane wartości zostały następnie dodane w celu utworzenia wyniku predyktora, tak aby wyższe wyniki przewidywały większą szansę na sukces. Wyniki mogą wahać się od zera (brak predyktorów sukcesu) do 21 (wszystkie 21 predyktorów oceniono jako przewidywanie sukcesu).
W przypadku predyktorów z więcej niż dwiema wartościami metoda Burgessa wybiera punkt odcięcia na podstawie subiektywnej oceny. Na przykład w badaniu z wykorzystaniem metody Burgessa (Gottfredson i Snyder, 2005) jako jeden z predyktorów wybrano liczbę skarg dotyczących zachowań przestępczych. Przyjmując jako wynik docelowy zwolnienie warunkowe, liczbę skarg zakodowano w następujący sposób: „zero do dwóch skarg” = 0, a „trzy lub więcej skarg” = 1 (Gottfredson i Snyder, 2005. s. 18).
Metoda Kerby'ego
Metoda Kerby'ego jest podobna do metody Burgessa, ale różni się na dwa sposoby. Po pierwsze, podczas gdy metoda Burgessa wykorzystuje subiektywną ocenę, aby wybrać punkt odcięcia dla predyktora wielowartościowego z wynikiem binarnym, metoda Kerby'ego wykorzystuje analizę drzewa klasyfikacji i regresji ( CART ). W ten sposób wybór wyniku odcięcia opiera się nie na subiektywnej ocenie, ale na kryterium statystycznym, takim jak punkt, w którym wartość chi-kwadrat jest maksymalna.
Druga różnica polega na tym, że podczas gdy metodę Burgessa stosuje się do wyniku binarnego, metodę Kerby'ego można zastosować do wyniku wielowartościowego, ponieważ analiza CART może w takich przypadkach identyfikować wyniki odcięcia, stosując takie kryterium, jak punkt, w którym t- wartość jest maksymalna. Ponieważ analiza CART jest nie tylko binarna, ale także rekurencyjna, wynikiem może być to, że zmienna predykcyjna zostanie ponownie podzielona, dając dwa wyniki odcięcia. Standardowa postać dla każdego predyktora polega na dodaniu wyniku wynoszącego jeden, gdy analiza CART tworzy podział.
Jedno badanie (Kerby, 2003) wybrało jako predyktory pięć cech z Wielkiej Piątki cech osobowości , przewidując wielowartościową miarę myśli samobójczych . Następnie wyniki osobowości zostały przekształcone w standardową formę za pomocą analizy CART. Kiedy analiza CART dała jeden podział, wynik był podobny do metody Burgessa, ponieważ predyktor został zakodowany jako zero lub jeden. Ale jeśli chodzi o miarę neurotyzmu, wynikiem były dwa punkty odcięcia. Ponieważ wyższe wyniki neurotyczności korelowały z bardziej samobójczymi myślami, dwa punkty odcięcia doprowadziły do następującego kodowania: „niski neurotyzm” = 0, „umiarkowany neurotyzm” = 1, „wysoki neurotyzm” = 2 (Kerby, 2003).
metoda z -score
Inną metodę można zastosować, gdy predyktory są mierzone w skali ciągłej. W takim przypadku każdy predyktor można przekształcić w wynik standardowy lub z -score, tak aby wszystkie predyktory miały średnią zero i odchylenie standardowe równe jeden. W tej metodzie regresji ważonej jednostkami zmienna jest sumą wyników z (np. Dawes, 1979; Bobko, Roth i Buster, 2007).
Przegląd literatury
Powszechnie uważa się, że pierwszym badaniem empirycznym wykorzystującym regresję ważoną jednostkami było badanie socjologa Ernesta W. Burgessa z 1928 roku . Użył 21 zmiennych, aby przewidzieć powodzenie lub niepowodzenie zwolnienia warunkowego, a wyniki sugerują, że wagi jednostkowe są użytecznym narzędziem przy podejmowaniu decyzji o tym, których osadzonych zwolnić warunkowo. Spośród osadzonych z najlepszymi wynikami, 98% faktycznie odniosło sukces na zwolnieniu warunkowym; a spośród tych z najgorszymi wynikami tylko 24% faktycznie odniosło sukces (Burgess, 1928).
Kwestie matematyczne związane z regresją ważoną jednostkami zostały po raz pierwszy omówione w 1938 roku przez Samuela Stanleya Wilksa , czołowego statystyka, który szczególnie interesował się analizą wielowymiarową . Wilks opisał, w jaki sposób można wykorzystać wagi jednostkowe w praktycznych ustawieniach, gdy dane do oszacowania ciężarów beta nie były dostępne. Na przykład mała uczelnia może chcieć wybrać dobrych studentów do przyjęcia. Ale szkoła może nie mieć pieniędzy na zebranie danych i przeprowadzenie standardowej analizy regresji wielokrotnej. W takim przypadku szkoła mogłaby wykorzystać kilka predyktorów — stopnie w szkole średniej, wyniki SAT, oceny nauczycieli. Wilks (1938) wykazał matematycznie, dlaczego jednostki masy powinny dobrze sprawdzać się w praktyce.
Frank Schmidt (1971) przeprowadził badanie symulacyjne mas jednostkowych. Jego wyniki pokazały, że Wilks rzeczywiście miał rację i że jednostki masy zwykle dobrze sprawdzają się w symulacjach badań praktycznych.
Robyn Dawes (1979) omówiła wykorzystanie ciężarów jednostkowych w badaniach stosowanych, odnosząc się do solidnego piękna modeli ważonych jednostkowo. Jacob Cohen omówił również wartość odważników jednostkowych i zwrócił uwagę na ich praktyczną użyteczność. Rzeczywiście, napisał: „Z praktycznego punktu widzenia, przez większość czasu lepiej jest używać jednostek masy” (Cohen, 1990, s. 1306).
Dave Kerby (2003) wykazał, że masy jednostkowe dobrze wypadają w porównaniu ze standardową regresją, robiąc to za pomocą walidacji krzyżowej - to znaczy, że wyprowadził wagi beta w jednej próbie i zastosował je do drugiej próby. Wynikiem zainteresowania były myśli samobójcze, a zmiennymi predykcyjnymi były szerokie cechy osobowości. W próbie walidacji krzyżowej korelacja między osobowością a myślami samobójczymi była nieco silniejsza w przypadku regresji ważonej jednostkami ( r = 0,48) niż w przypadku standardowej regresji wielokrotnej ( r = 0,47).
Gottfredson i Snyder (2005) porównali metodę Burgessa regresji ważonej jednostkami z innymi metodami, z próbą konstrukcyjną N = 1924 i próbą walidacji krzyżowej N = 7552. Wykorzystując punktowo-dwuszeregowy Pearsona, wielkość efektu w próbie walidacji krzyżowej dla modelu wag jednostkowych wyniosła r = 0,392, czyli była nieco większa niż w przypadku regresji logistycznej ( r = 0,368) i predykcyjnej analizy atrybutów ( r = 0,387 ) i mniej niż regresja wielokrotna tylko na trzecim miejscu po przecinku ( r = 0,397).
W przeglądzie literatury na temat mas jednostkowych Bobko, Roth i Buster (2007) zauważyli, że „masy jednostkowe i masy regresji działają podobnie pod względem wielkości zweryfikowanej krzyżowo korelacji wielokrotnej, a badania empiryczne potwierdziły ten wynik w kilku dziesięcioleci” (s. 693).
Andreas Graefe zastosował podejście równej wagi do dziewięciu ustalonych modeli regresji wielokrotnej do prognozowania wyborów prezydenckich w USA . W dziesięciu wyborach od 1976 do 2012 r. równie ważone predyktory zmniejszyły błąd prognozy oryginalnych modeli regresji średnio o cztery procent. Model równych wag, który obejmuje wszystkie zmienne, dostarczył skalibrowanych prognoz, które zmniejszyły błąd najdokładniejszego modelu regresji o 29%.
Przykład
Przykład może wyjaśnić, w jaki sposób wagi jednostkowe mogą być przydatne w praktyce.
Brenna Bry i współpracownicy (1982) odnieśli się do pytania, co powoduje używanie narkotyków przez młodzież. Poprzednie badania wykorzystywały regresję wielokrotną; przy tej metodzie naturalne jest poszukiwanie najlepszego predyktora, tego o najwyższej wadze beta. Bry i współpracownicy zauważyli, że jedno z wcześniejszych badań wykazało, że wczesne spożywanie alkoholu było najlepszym predyktorem. Inne badanie wykazało, że wyobcowanie od rodziców było najlepszym predyktorem. Jeszcze inne badanie wykazało, że najlepszym predyktorem były niskie stopnie w szkole. Brak replikacji był ewidentnie problemem, który mógł być spowodowany odbijającymi się wersjami beta.
Bry i współpracownicy zaproponowali inne podejście: zamiast szukać najlepszego predyktora, przyjrzeli się liczbie predyktorów. Innymi słowy, każdemu predyktorowi przypisywali wagę jednostkową. Ich badanie miało sześć predyktorów: 1) niskie oceny w szkole, 2) brak przynależności religijnej, 3) wczesny wiek spożywania alkoholu, 4) stres psychiczny, 5) niska samoocena oraz 6) wyobcowanie od rodziców. Aby przekonwertować predyktory na standardową formę, każdy czynnik ryzyka został oceniony jako nieobecny (oceniony jako zero) lub obecny (oceniony jako jeden). Na przykład kodowanie niskich ocen w szkole było następujące: „C lub wyższy” = 0, „D lub F” = 1. Wyniki pokazały, że liczba czynników ryzyka była dobrym predyktorem używania narkotyków: młodzież z większą czynniki ryzyka częściej sięgały po narkotyki.
Model użyty przez Bry i współpracowników polegał na tym, że użytkownicy narkotyków nie różnią się w żaden szczególny sposób od użytkowników niebędących narkotykami. Różnią się raczej liczbą problemów, z którymi muszą się zmierzyć. „Liczba czynników, z którymi jednostka musi sobie poradzić, jest ważniejsza niż to, jakie dokładnie są te czynniki” (s. 277). Biorąc pod uwagę ten model, odpowiednią metodą analizy jest regresja ważona jednostkami.
Wagi beta
W standardowej regresji wielokrotnej każdy predyktor jest mnożony przez liczbę, która jest nazywana wagą beta , wagą regresji lub ważonymi współczynnikami regresji (oznaczanymi jako β W lub BW). [ potrzebne źródło ] Prognozę uzyskuje się przez dodanie tych iloczynów wraz ze stałą. Kiedy wagi są wybierane w celu uzyskania najlepszej prognozy według jakiegoś kryterium, model określany jest jako właściwy model liniowy . Dlatego regresja wielokrotna jest właściwym modelem liniowym. Z kolei regresja ważona jednostkami nazywana jest niewłaściwym modelem liniowym.
Specyfikacja modelu
Standardowa regresja wieloraka opiera się na założeniu, że wszystkie istotne predyktory wyniku są uwzględnione w modelu regresji. To założenie nazywa się specyfikacją modelu. Mówimy, że model jest określony, gdy wszystkie istotne predyktory są uwzględnione w modelu, a wszystkie nieistotne predyktory są wykluczone z modelu. W warunkach praktycznych rzadko zdarza się, aby badanie było w stanie określić a priori wszystkie istotne predyktory. W tym przypadku modele nie są określone, a oszacowania wag beta cierpią z powodu pominiętego odchylenia zmiennej. Oznacza to, że wagi beta mogą zmieniać się z jednej próbki na drugą, co jest czasami nazywane problemem odbijających się beta. To właśnie ten problem z odbijającymi się betami sprawia, że regresja ważona jednostkami jest użyteczną metodą.
Zobacz też
- Bobko, P., Roth, PL i Buster, MA (2007). „Przydatność wag jednostkowych w tworzeniu ocen złożonych: przegląd literatury, zastosowanie do trafności treści i metaanaliza”. Organizacyjne metody badawcze , tom 10, strony 689-709. doi : 10.1177/1094428106294734
- Bry, BH; McKeon, P.; Pandina, RJ (1982). „Zakres używania narkotyków jako funkcja liczby czynników ryzyka”. Dziennik nienormalnej psychologii . 91 (4): 273–279. doi : 10.1037/0021-843X.91.4.273 . PMID 7130523 .
- Burgess, EW (1928). „Czynniki decydujące o sukcesie lub porażce na zwolnieniu warunkowym”. W AA Bruce (red.), The Working of the Indeterminate Sentence Law and Parole in Illinois (s. 205–249). Springfield, Illinois: Stanowa Rada ds. Zwolnień warunkowych stanu Illinois. Książki Google
- Kohen, Jakub. (1990). „Rzeczy, których się nauczyłem (do tej pory)” . Psycholog amerykański , tom 45, strony 1304-1312. doi : 10.1037/0003-066X.45.12.1304
- Dawes, Robyn M. (1979). „Solidne piękno niewłaściwych modeli liniowych w podejmowaniu decyzji”. Psycholog amerykański , tom 34, strony 571-582. doi : 10.1037/0003-066X.34.7.571 . zarchiwizowany pdf
- Gottfredson, DM i Snyder, HN (lipiec 2005). Matematyka klasyfikacji ryzyka: zmiana danych w ważne instrumenty dla sądów dla nieletnich . Pittsburgh, Penn.: Narodowe Centrum Sprawiedliwości dla Nieletnich. NCJ 209158. Eric.ed.gov pdf
- Kerby, Dave S. (2003). „Analiza CART z regresją ważoną jednostkami w celu przewidywania myśli samobójczych na podstawie cech Wielkiej Piątki”. Osobowość i różnice indywidualne , tom 35, strony 249-261. doi : 10.1016/S0191-8869(02)00174-5
- Schmidt, Frank L. (1971). „Względna skuteczność regresji i wag predyktorów prostych jednostek w stosowanej psychologii różnicowej”. Pomiar edukacyjny i psychologiczny , tom 31, strony 699-714. doi : 10.1177/001316447103100310
- Wainer, H. i Thissen, D. (1976). Trzy kroki w kierunku solidnej regresji. Psychometrika , tom 41 (1), strony 9–34. doi : 10.1007/BF02291695
- Wilks, SS (1938). „Systemy wag dla funkcji liniowych zmiennych skorelowanych, gdy nie ma zmiennej zależnej”. Psychometria . 3 : 23–40. doi : 10.1007/BF02287917 .
Dalsza lektura
- Dana, J. i Dawes, RM (2004). „Wyższość prostych alternatyw dla regresji w przewidywaniach nauk społecznych”. Journal of Educational and Behavioral Statistics , tom 29(3), strony 317-331. doi : 10.3102/10769986029003317
- Dawes, RM i Corrigan, B. (1974). Modele liniowe w podejmowaniu decyzji. Biuletyn psychologiczny , tom 81, strony 95–106. doi : 10.1037/h0037613
- Einhorn, HJ i Hogarth, RM (1975). Schematy ważenia jednostek do podejmowania decyzji. Zachowania organizacyjne i wydajność ludzi , tom 13(2), strony 171-192. doi : 10.1016/0030-5073(75)90044-6
- Hakeem, M. (1948). Ważność metody przewidywania zwolnienia warunkowego Burgessa. American Journal of Sociology , tom 53(5), strony 376-386. JSTOR
- Newman, JR, Seaver, D., Edwards, W. (1976). Schematy wag jednostkowych i różnicowych do podejmowania decyzji: metoda badań i niektóre wstępne wyniki. Los Angeles, Kalifornia: Instytut Badań Nauk Społecznych. zarchiwizowany pdf
- Raju, NS, Bilgic, R., Edwards, JE, Fleer, PF (1997). Przegląd metodologii: Szacowanie trafności populacji i trafności krzyżowej oraz wykorzystanie równych wag w prognozowaniu. Applied Psychological Measurement , tom 21(4), strony 291-305. doi : 10.1177/01466216970214001
- Ree, MJ, Carretta, TR i Earles, JA (1998). „W decyzjach odgórnych zmienne ważące nie mają znaczenia: konsekwencja twierdzenia Wilka”. Organizacyjne metody badawcze , tom 1 (4), strony 407-420. doi : 10.1177/109442819814003
- Wainer, Howard (1976). „Szacowanie współczynników w modelach liniowych: to nie ma znaczenia” (PDF) . Biuletyn psychologiczny . 83 (2): 213. doi : 10.1037/0033-2909.83.2.213 . zarchiwizowany pdf
- Wainer, H. (1978). O wrażliwości regresji i regresorów. Biuletyn Psychologiczny , tom 85(2), strony 267-273. doi : 10.1037/0033-2909.85.2.267
Linki zewnętrzne
- Blog Chisa Stucchio — dlaczego lista za i przeciw jest w 75% tak dobra, jak twój fantazyjny algorytm uczenia maszynowego