Politomiczny model Rascha

Politomiczny model Rascha jest uogólnieniem dychotomicznego modelu Rascha . Jest to pomiaru , który ma potencjalne zastosowanie w każdym kontekście, w którym celem jest zmierzenie cechy lub zdolności poprzez proces, w którym odpowiedzi na pozycje są oceniane za pomocą kolejnych liczb całkowitych . Na przykład model ma zastosowanie do stosowania skal Likerta , skal ocen , oraz elementów oceny wykształcenia, dla których kolejne wyższe wyniki w postaci liczb całkowitych mają wskazywać na rosnący poziom kompetencji lub osiągnięć.

Tło i przegląd

Wielotomowy model Rascha został wyprowadzony przez Andricha (1978), w następstwie wyprowadzeń Rascha (1961) i Andersena (1977), poprzez rozłożenie odpowiednich wyrazów ogólnej postaci modelu Rascha na parametry progowe i dyskryminacyjne . Kiedy model został wyprowadzony, Andrich skupił się na wykorzystaniu skal Likerta w psychometrii , zarówno w celach ilustracyjnych, jak i pomocy w interpretacji modelu.

Model ten jest czasami określany jako model skali ocen , gdy (i) pozycje mają taką samą liczbę progów oraz (ii) z kolei różnica między dowolnym położeniem progowym a średnią z lokalizacji progowych jest równa lub jednakowa we wszystkich pozycjach. Jest to jednak potencjalnie myląca nazwa modelu, ponieważ ma on znacznie bardziej ogólne zastosowanie niż tzw. skale ocen. Model ten jest czasami nazywany modelem częściowego kredytu , zwłaszcza w kontekście edukacyjnym. Model częściowego kredytu (Masters, 1982) ma identyczną formę algebraiczną, ale został wyprowadzony z innego punktu wyjścia w późniejszym czasie i jest interpretowany w nieco inny sposób. Model częściowego uznania dopuszcza również różne progi dla różnych pozycji. Chociaż ta nazwa modelu jest często używana, Andrich (2005) przedstawia szczegółową analizę problemów związanych z elementami podejścia Masters, które odnoszą się konkretnie do typu procesu reagowania, który jest zgodny z modelem, oraz do sytuacji empirycznych, w których szacunki lokalizacji progów są nieuporządkowane. Kwestie te zostały omówione w poniższym opracowaniu modelu.

Model jest ogólnym probabilistycznym modelem pomiarowym, który zapewnia teoretyczną podstawę do wykorzystania kolejnych liczb całkowitych w sposób, który zachowuje charakterystyczną właściwość definiującą modele Rascha: w szczególności całkowite surowe wyniki są wystarczającymi statystykami dla parametrów modeli. Zobacz główny artykuł dotyczący modelu Rascha , aby zapoznać się z opracowaniem tej właściwości. Oprócz zachowania tej właściwości model pozwala na rygorystyczne empiryczne sprawdzenie hipotezy że kategorie odpowiedzi reprezentują rosnące poziomy ukrytego atrybutu lub cechy, a zatem są uporządkowane. Powodem, dla którego model stanowi podstawę do testowania tej hipotezy, jest empiryczna możliwość, że progi nie będą wyświetlać zamierzonego uporządkowania.

W tej bardziej ogólnej postaci modelu Rascha dla danych dychotomicznych, wynik dla określonej pozycji jest definiowany jako liczba progowych lokalizacji ukrytej cechy, które zostały przekroczone przez jednostkę. Nie oznacza to, że proces pomiaru polega na dokonywaniu takich obliczeń w sensie dosłownym; raczej lokalizacje progów na ukrytym kontinuum są zwykle wywnioskowane z macierzy danych odpowiedzi w procesie szacowania, takim jak szacowanie warunkowego maksymalnego prawdopodobieństwa . Ogólnie rzecz biorąc, główną cechą procesu pomiaru jest to, że jednostki są zaklasyfikowane do jednej ze zbioru ciągłych lub przylegających do siebie uporządkowanych kategorii. Format odpowiedzi zastosowany w danym kontekście eksperymentalnym może to osiągnąć na wiele sposobów. Na przykład respondenci mogą wybrać kategorię, która ich zdaniem najlepiej oddaje ich stopień poparcia dla danego stwierdzenia (np. „zdecydowanie się zgadzam”), sędziowie mogą klasyfikować osoby do kategorii na podstawie dobrze zdefiniowanych kryteriów lub osoba może klasyfikować bodziec fizyczny na podstawie na postrzeganym podobieństwie do zestawu bodźców odniesienia.

Politomiczny model Rascha specjalizuje się w modelu danych dychotomicznych, gdy odpowiedzi można podzielić tylko na dwie kategorie. W tym szczególnym przypadku trudność przedmiotu i (pojedynczy) próg są identyczne. Pojęcie progu zostało omówione w następnej sekcji.

Politomiczny Model Rascha

Najpierw niech

będzie całkowitą zmienną losową , gdzie jest maksymalnym wynikiem dla pozycji ja . } zmienna jest zmienną losową, która może przyjmować .

W politomicznym modelu Rascha (Andrich, 1978) prawdopodobieństwo wyniku wynosi X

gdzie jest k- tą progową lokalizacją elementu i na utajonym kontinuum, lokalizacją osoby n na tym samym kontinuum , a wynik dla i . Te równania są takie same jak

gdzie wartość jest wybierana dla wygody czyli: .

Model skali ocen

Podobnie jest z modelem „Skali ocen” Rascha (Andrich, 1978).

gdzie pozycji ja i jest - tą progową lokalizacją skali ocen, która jest wspólna dla wszystkich pozycji δ . m to maksymalny wynik i jest identyczny dla wszystkich pozycji. jest wybrany ze względu na wygodę obliczeniową.

Aplikacja

Zastosowany w danym kontekście empirycznym model można uznać za matematyczną hipotezę, że prawdopodobieństwo danego wyniku jest funkcją probabilistyczną tych parametrów osób i przedmiotów. Wykres przedstawiający zależność między prawdopodobieństwem danej kategorii w funkcji lokalizacji osoby nazywany jest krzywą prawdopodobieństwa kategorii (CPC). Przykład CPC dla pozycji z pięcioma kategoriami, ocenianymi od 0 do 4, pokazano na rysunku 1.

Rysunek 1: Krzywe prawdopodobieństwa kategorii Rascha dla pozycji z pięcioma uporządkowanymi kategoriami

Dany próg dzieli kontinuum na regiony powyżej i poniżej jego lokalizacji. Próg odpowiada miejscu na ukrytym kontinuum, w którym jest równie prawdopodobne, że osoba zostanie zaklasyfikowana do sąsiednich kategorii, a zatem uzyska jeden z dwóch kolejnych wyników. Pierwszy próg pozycji ja , , to miejsce na kontinuum, w którym dana osoba ma takie samo prawdopodobieństwo uzyskania wyniku 0 lub 1, drugi próg to miejsce, w którym dana osoba ma takie samo prawdopodobieństwo uzyskania wyniku 1 i 2 i tak dalej. W przykładzie pokazanym na rysunku 1 lokalizacje progowe to odpowiednio -1,5, -0,5, 0,5 i 1,5.

Respondenci mogą uzyskiwać wyniki na wiele różnych sposobów. Na przykład, gdy stosowane są formaty odpowiedzi Likerta, zdecydowanie nie zgadzam się można przypisać 0, nie zgadzam się 1, zgadzam się 2 i zdecydowanie zgadzam się 3. W kontekście oceniania w psychologii edukacyjnej , kolejno wyższe wyniki całkowite mogą być przyznawane zgodnie z wyraźnymi kryteriami lub opisami charakteryzującymi rosnące poziomy osiągnięć w określonej dziedzinie, takiej jak czytanie ze zrozumieniem. Wspólną i centralną cechą jest to, że jakiś proces musi skutkować klasyfikacją każdej osoby do jednej ze zbioru uporządkowanych kategorii, które łącznie składają się na element oceny.

Opracowanie modelu

Opracowując cechy modelu, Andrich (2005) wyjaśnia, że ​​jego struktura pociąga za sobą równoczesny proces klasyfikacji , który skutkuje pojedynczą jawną odpowiedzią i obejmuje szereg dychotomicznych odpowiedzi ukrytych. Ponadto ukryte odpowiedzi dychotomiczne działają w obrębie struktury Guttmana i związanej z nią przestrzeni odpowiedzi, jak scharakteryzowano poniżej.

Pozwalać

być zbiorem niezależnych dychotomicznych zmiennych losowych. Andrich (1978, 2005) pokazuje, że politomiczny model Rascha wymaga, aby te dychotomiczne odpowiedzi były zgodne z ukrytą podprzestrzenią odpowiedzi Guttmana:

w którym po x jedynekach następuje mx zer. Na przykład w przypadku dwóch progów dopuszczalne wzorce w tej podprzestrzeni odpowiedzi to:

gdzie wynik całkowity x implikowany przez każdy wzorzec (i odwrotnie) jest taki, jak pokazano. Powód, dla którego ta podprzestrzeń jest implikowana przez model, jest następujący. Pozwalać

będzie prawdopodobieństwo, że - . Funkcja ta ma strukturę modelu Rascha dla danych dychotomicznych. Następnie rozważ następujące prawdopodobieństwo warunkowe w przypadku dwóch progów:

Można wykazać, że to prawdopodobieństwo warunkowe jest równe

kolei model Z mianownika tych równań widać, że prawdopodobieństwo w tym przykładzie zależy od wzorców odpowiedzi lub . Jest zatem oczywiste, że ogólnie podprzestrzeń odpowiedzi , jest nieodłączną częścią struktury wielotomowego modelu Rascha To ograniczenie podprzestrzeni jest konieczne do uzasadnienia punktacji odpowiedzi w liczbach całkowitych, tj. takiego, że wynik jest po prostu liczbą przekroczonych uporządkowanych progów. Andrich (1978) wykazał, że do tego uzasadnienia konieczna jest również równa dyskryminacja na każdym z progów.

W wielotomowym modelu Rascha wynik x na danym elemencie oznacza, że ​​​​jednostka jednocześnie przekroczyła x progi poniżej pewnego regionu na kontinuum i nie przekroczyła pozostałych m - x progi powyżej tego regionu. Aby było to możliwe, progi muszą być w swoim naturalnym porządku, jak pokazano na przykładzie na rycinie 1. Nieuporządkowane oszacowania progów wskazują na niepowodzenie w konstruowaniu kontekstu oceny, w którym klasyfikacje reprezentowane przez kolejne wyniki odzwierciedlają rosnące poziomy ukrytego cecha. Rozważmy na przykład sytuację, w której istnieją dwa progi iw której oszacowanie drugiego progu jest niższe na kontinuum niż oszacowanie pierwszego progu. Jeśli lokalizacje są rozumiane dosłownie, zaklasyfikowanie osoby do kategorii 1 oznacza, że ​​​​lokalizacja osoby jednocześnie przekracza drugi próg, ale nie przekracza pierwszego progu. To z kolei implikuje wzorzec odpowiedzi {0,1}, wzorzec, który nie należy do podprzestrzeni wzorców, która jest nieodłączna od struktury modelu, jak opisano powyżej.

Kiedy szacunki progów są nieuporządkowane, nie można ich zatem traktować dosłownie; raczej nieuporządkowanie samo w sobie z natury wskazuje, że klasyfikacje nie spełniają kryteriów, które muszą być logicznie spełnione, aby uzasadnić użycie kolejnych wyników całkowitych jako podstawy pomiaru. Aby podkreślić ten punkt, Andrich (2005) podaje przykład, w którym przyznawane są stopnie niepowodzenia, zaliczenia, zaliczenia i wyróżnienia. Te stopnie lub klasyfikacje mają zwykle reprezentować rosnące poziomy osiągnięć. Rozważmy osobę A, której lokalizacja na ukrytym kontinuum znajduje się na progu między regionami na kontinuum, w których jest największe prawdopodobieństwo przyznania przepustki i zaliczenia. Rozważmy jeszcze inną osobę B, której lokalizacja znajduje się na granicy regionów, w których jest największe prawdopodobieństwo przyznania zaliczenia i wyróżnienia. W przykładzie rozważanym przez Andricha (2005, s. 25) nieuporządkowane progi, rozumiane dosłownie, sugerowałyby, że osoba A (przy progu zaliczenia/zaliczenia) znajduje się wyżej niż osoba B (przy zaliczeniu/wyróżnieniu) próg). Oznacza to, że wzięte dosłownie, nieuporządkowane lokalizacje progów sugerowałyby, że osoba musiałaby wykazać się wyższym poziomem osiągnięć, aby osiągnąć próg zaliczenia/zaliczenia, niż byłby potrzebny do osiągnięcia progu zaliczenia/wyróżnienia. Oczywiście nie zgadza się to z intencją takiego systemu ocen. Uporządkowanie progów wskazywałoby zatem, że sposób przyznawania ocen nie jest zgodny z intencją systemu oceniania. Oznacza to, że nieuporządkowanie wskazywałoby, że hipoteza zawarta w systemie ocen – że stopnie reprezentują uporządkowane klasyfikacje o rosnących wynikach – nie jest poparta strukturą danych empirycznych.

  • Andersen, EB (1977). Wystarczające statystyki i modele cech ukrytych, Psychometrika , 42, 69–81.
  • Andrich, D. (1978). Formuła oceny dla uporządkowanych kategorii odpowiedzi. Psychometria , 43, 561–73.
  • Andrich, D. (2005). Wyjaśnienie modelu Rascha. W Sivakumar Alagumalai, David D Durtis i Njora Hungi (red.) Stosowany pomiar Rascha: księga przykładów . Springer-Kluwer. Rozdział 3, 308–328.
  • Mistrzowie, GN (1982). Model Rascha dla częściowej punktacji kredytowej. Psychometria , 47, 149–174.
  • Rasch, G. (1960/1980). Modele probabilistyczne dla niektórych testów inteligencji i osiągnięć . (Kopenhaga, Duński Instytut Badań Edukacyjnych), wydanie rozszerzone (1980) z przedmową i posłowiem BD Wrighta. Chicago: University of Chicago Press.
  • von Davier, M. & Rost, J. (1995). Politomiczne mieszane modele Rascha . W GH Fischer & IW Molenaar (red.): Modele Rascha - podstawy, najnowsze osiągnięcia i zastosowania. (s. 371-379). Nowy Jork: Springer. https://link.springer.com/chapter/10.1007/978-1-4612-4230-7_20
  • von Davier M. (2014) Modele wielotomowe Rascha. W: Michalos AC (red.) Encyklopedia badań nad jakością życia i dobrostanem. Springera w Dordrechcie. https://doi.org/10.1007/978-94-007-0753-5_2412
  • Wright, BD & Masters, GN (1982). Analiza skali ocen . Chicago: MESA Press. (Dostępne w Instytucie Pomiarów Obiektywnych).

Linki zewnętrzne