Statystyka J Youdena
Statystyka J Youdena (zwana także indeksem Youdena ) to pojedyncza statystyka, która oddaje wydajność dychotomicznego testu diagnostycznego. Poinformowanie jest jego uogólnieniem na przypadek wieloklasowy i szacuje prawdopodobieństwo podjęcia świadomej decyzji.
Definicja
Statystyka J Youdena to
przy czym dwie wielkości po prawej stronie to czułość i specyficzność . Zatem rozwinięta formuła to:
Indeks został zaproponowany przez WJ Youdena w 1950 roku jako sposób podsumowania wykonania testu diagnostycznego, jednak wzór został wcześniej opublikowany w Science przez CSPierce w 1884 roku. Jego wartość waha się od -1 do 1 (włącznie) i ma zero wartość, gdy test diagnostyczny daje taką samą proporcję wyników pozytywnych dla grup z chorobą i bez choroby, czyli test jest bezużyteczny. Wartość 1 wskazuje, że nie ma wyników fałszywie dodatnich ani fałszywie ujemnych, czyli test jest doskonały. Indeks nadaje taką samą wagę wartościom fałszywie dodatnim i fałszywie ujemnym, więc wszystkie testy z tą samą wartością indeksu dają taki sam odsetek wszystkich błędnie sklasyfikowanych wyników. Chociaż z tego równania można uzyskać wartość mniejszą od zera, np. Klasyfikacja daje tylko wyniki fałszywie dodatnie i fałszywie ujemne, wartość mniejsza od zera wskazuje po prostu, że etykiety dodatnie i ujemne zostały zamienione. Po poprawieniu etykiet wynik będzie mieścił się w zakresie od 0 do 1.
Indeks Youdena jest często używany w połączeniu z analizą charakterystyki operacyjnej odbiornika (ROC). Wskaźnik jest zdefiniowany dla wszystkich punktów krzywej ROC, a jego maksymalna wartość może być kryterium wyboru optymalnego punktu odcięcia, gdy test diagnostyczny daje wynik liczbowy, a nie dychotomiczny. Indeks jest reprezentowany graficznie jako wysokość nad linią prawdopodobieństwa i jest również równoważny z polem pod krzywą, na którym znajduje się pojedynczy punkt operacyjny.
Indeks Youdena jest również znany jako deltaP' i uogólnia przypadek dychotomiczny do przypadku wieloklasowego jako poinformowany.
Użycie pojedynczego indeksu „ogólnie nie jest zalecane”, ale poinformowanie lub indeks Youdena to prawdopodobieństwo podjęcia świadomej decyzji (w przeciwieństwie do przypadkowego przypuszczenia) i bierze pod uwagę wszystkie przewidywania.
Niepowiązaną, ale powszechnie używaną kombinacją podstawowych statystyk z wyszukiwania informacji jest F-score , będący (prawdopodobnie ważoną) średnią harmoniczną przypomnienia i precyzji , gdzie przypomnienie = czułość = prawdziwie pozytywny wskaźnik, ale specyficzność i precyzja to zupełnie inne środki. Wynik F, podobnie jak przypomnienie i precyzja, bierze pod uwagę tylko tak zwane przewidywania pozytywne, przy czym przypomnienie to prawdopodobieństwo przewidzenia tylko pozytywnej klasy, precyzja to prawdopodobieństwo, że dodatnia prognoza jest poprawna, a wynik F zrównuje te prawdopodobieństwa pod skuteczne założenie, że pozytywne etykiety i pozytywne prognozy powinny mieć ten sam rozkład i rozpowszechnienie , podobnie jak założenie leżące u podstaw kappa Fleissa . Wskaźniki J, Informedness, Recall, Precision i F-score Youdena są z natury niekierunkowe i mają na celu ocenę dedukcyjna skuteczność predykcji w kierunku zaproponowanym przez regułę, teorię lub klasyfikator. Markedness (deltaP) to J Youdena używane do oceny kierunku odwrotnego lub abdukcyjnego i dobrze pasuje do ludzkiego uczenia się skojarzeń ; zasady i przesądy , gdy modelujemy możliwą przyczynowość ; podczas gdy korelacja i kappa oceniają dwukierunkowo.
Współczynnik korelacji Matthewsa jest średnią geometryczną współczynnika regresji problemu i jego podwójnego , gdzie współczynniki regresji składowych współczynnika korelacji Matthewsa to Markedness (odwrotność J Youdena lub deltaP) i informacyjność (J Youdena lub deltaP'). Statystyki kappa, takie jak kappa Fleissa i kappa Cohena, to metody obliczania wiarygodności między oceniającymi oparte na różnych założeniach dotyczących rozkładów krańcowych lub wcześniejszych i są coraz częściej wykorzystywane jako skorygowane przypadkowo alternatywy dla dokładności w innych kontekstach. Kappa Fleissa , podobnie jak F-score, zakłada, że obie zmienne pochodzą z tego samego rozkładu, a zatem mają tę samą oczekiwaną częstość występowania, podczas gdy kappa Cohena zakłada , że zmienne pochodzą z różnych rozkładów i odnoszą się do modelu oczekiwań , który zakłada, że rozpowszechnienia są niezależny.
Kiedy rzeczywiste rozpowszechnienia dla dwóch dodatnich zmiennych są równe, jak przyjęto w Fleiss kappa i F-score, to znaczy liczba pozytywnych predykcji odpowiada liczbie pozytywnych klas w przypadku dychotomicznym (dwie klasy), różne miary kappa i korelacji załamują się do identyczności z J Youdena, a pamięć, precyzja i F-score są podobnie identyczne z dokładnością .
- ^ a b Youden, WJ (1950). „Indeks oceny testów diagnostycznych” . Rak . 3 : 32–35. doi : 10.1002/1097-0142(1950)3:1<32::aid-cncr2820030106>3.0.co;2-3 . PMID 15405679 .
- ^ Pierce CS (1884). „Liczbowa miara powodzenia prognoz”. nauka . 4 (93): 453–454. doi : 10.1126/science.ns-4.93.453.b .
- Bibliografia _ Perkins, New Jersey; Liu, A.; Bondell, H. (2005). „Optymalny punkt odcięcia i odpowiadający mu indeks Youdena do rozróżniania osób przy użyciu połączonych próbek krwi”. Epidemiologia . 16 (1): 73–81. doi : 10.1097/01.ede.0000147512.81966.ba . PMID 15613948 .
- ^ a b c d e f Powers, David MW (2011). „Ocena: od precyzji, przypomnienia i wyniku F do ROC, informacyjności, zaznaczenia i korelacji”. Dziennik technologii uczenia maszynowego . 2 (1): 37–63. hdl : 2328/27165 .
- ^ b ; Perruchet, P . Peereman, R. (2004). „Wykorzystanie informacji dystrybucyjnych w przetwarzaniu sylab”. J. Neurolingwistyka . 17 (2–3): 97–119. doi : 10.1016/s0911-6044(03)00059-9 .
- ^ Everitt BS (2002) The Cambridge Dictionary of Statistics. KUBEK ISBN 0-521-81099-X
- ^ a b c Uprawnienia, David MW (2012). Problem z Kappa . Konferencja Europejskiego Oddziału Association for Computational Linguistics. s. 345–355. hdl : 2328/27160 .