Ważność przyrostowa

Trafność przyrostowa to rodzaj trafności , który jest używany do określenia, czy nowa ocena psychometryczna zwiększy zdolność predykcyjną ponad tę zapewnianą przez istniejącą metodę oceny. Innymi słowy, trafność przyrostowa ma na celu odpowiedź, czy nowy test dodaje wiele informacji, których nie można uzyskać prostszymi, już istniejącymi metodami.

Definicja i przykłady

Kiedy ocena jest stosowana w celu przewidzenia wyniku (być może innego wyniku testu lub innego środka behawioralnego), nowy instrument musi wykazać, że jest w stanie zwiększyć naszą wiedzę lub przewidywanie zmiennej wynikowej poza to, co jest już znane na podstawie istniejące instrumenty.

Pozytywnym przykładem może być klinicysta, który stosuje technikę wywiadu, a także specjalny kwestionariusz w celu ustalenia, czy pacjent cierpi na chorobę psychiczną i ma lepsze wyniki w określaniu choroby psychicznej niż klinicysta, który stosuje samą technikę wywiadu. W związku z tym konkretny kwestionariusz zostanie uznany za ważny przyrostowo. Ponieważ kwestionariusz w połączeniu z wywiadem dał dokładniejsze ustalenia i dodał informacje dla klinicysty, kwestionariusz jest przyrostowo ważny.

Testy statystyczne

Trafność przyrostowa jest zwykle oceniana przy użyciu metod regresji wielokrotnej . Model regresji z innymi zmiennymi jest najpierw dopasowywany do danych, a następnie do modelu dodawana jest zmienna centralna. Znacząca zmiana w R-kwadrat (wykorzystanie testu F do określenia istotności) jest interpretowana jako wskazówka, że ​​nowo dodana zmienna oferuje znaczącą dodatkową moc predykcyjną dla zmiennej zależnej w stosunku do zmiennych poprzednio uwzględnionych w modelu regresji. Przypomnijmy, że statystyka R-kwadrat w regresji wielokrotnej odzwierciedla procent wariancji uwzględniony w zmiennej Y przy użyciu wszystkich zmiennych X. Zatem zmiana R-kwadrat będzie odzwierciedlać procent wariancji wyjaśnionej przez zmienną dodaną do modelu. Zmiana R-kwadrat jest bardziej odpowiednia niż zwykłe spojrzenie na surowe korelacje, ponieważ surowe korelacje nie odzwierciedlają nakładania się nowo wprowadzonej miary i istniejących miar.

Przykładem tej metody jest przewidywanie średniej ocen z college'u ( GPA ), gdzie GPA z liceum i wyniki testów wstępnych (np. SAT , ACT ) zwykle stanowią dużą część wariancji w GPA z college'u. Stosowanie testów wstępnych jest poparte dodatkowymi dowodami ważności. Na przykład SAT sprzed 2000 r. korelował 0,34 z GPA pierwszego roku, podczas gdy GPA w szkole średniej korelował 0,36 z GPA pierwszego roku. Mogłoby się wydawać, że obie miary są silnymi predyktorami GPA pierwszego roku, ale w rzeczywistości wyniki GPA i SAT w szkole średniej są również silnie skorelowane, więc musimy sprawdzić, jaką moc predykcyjną uzyskujemy z SAT, biorąc pod uwagę GPA w szkole średniej. Trafność przyrostowa jest wskazywana przez zmianę R-kwadrat, gdy w modelu uwzględniono GPA z liceum. W tym przypadku GPA w szkole średniej odpowiada za 13% wariancji GPA pierwszego roku, a połączenie GPA w szkole średniej i SAT odpowiada za 20% wariancji w GPA pierwszego roku. Dlatego SAT dodaje 7 punktów procentowych do naszej mocy predykcyjnej. Jeśli jest to znaczące i uznane za ważną poprawę, możemy powiedzieć, że SAT ma większą ważność w stosunku do używania samego GPA w szkole średniej do przewidywania GPA pierwszego roku. Każde nowe kryterium lub test przyjęć musi dodać dodatkową moc predykcyjną (przyrostową trafność), aby był użyteczny w przewidywaniu GPA w college'u, gdy GPA w szkole średniej i wyniki testów są już znane.

Zobacz też