Statystyka J Youdena

Statystyka J Youdena (zwana także indeksem Youdena ) to pojedyncza statystyka, która oddaje wydajność dychotomicznego testu diagnostycznego. Poinformowanie jest jego uogólnieniem na przypadek wieloklasowy i szacuje prawdopodobieństwo podjęcia świadomej decyzji.

Definicja

Statystyka J Youdena to

przy czym dwie wielkości po prawej stronie to czułość i specyficzność . Zatem rozwinięta formuła to:

Indeks został zaproponowany przez WJ Youdena w 1950 roku jako sposób podsumowania wykonania testu diagnostycznego, jednak wzór został wcześniej opublikowany w Science przez CSPierce w 1884 roku. Jego wartość waha się od -1 do 1 (włącznie) i ma zero wartość, gdy test diagnostyczny daje taką samą proporcję wyników pozytywnych dla grup z chorobą i bez choroby, czyli test jest bezużyteczny. Wartość 1 wskazuje, że nie ma wyników fałszywie dodatnich ani fałszywie ujemnych, czyli test jest doskonały. Indeks nadaje taką samą wagę wartościom fałszywie dodatnim i fałszywie ujemnym, więc wszystkie testy z tą samą wartością indeksu dają taki sam odsetek wszystkich błędnie sklasyfikowanych wyników. Chociaż z tego równania można uzyskać wartość mniejszą od zera, np. Klasyfikacja daje tylko wyniki fałszywie dodatnie i fałszywie ujemne, wartość mniejsza od zera wskazuje po prostu, że etykiety dodatnie i ujemne zostały zamienione. Po poprawieniu etykiet wynik będzie mieścił się w zakresie od 0 do 1.

Przykład krzywej charakterystyki pracy odbiornika. Stałe czerwone: krzywa ROC; Linia przerywana: poziom szansy; Linia pionowa (J) maksymalna wartość indeksu Youdena dla krzywej ROC

Indeks Youdena jest często używany w połączeniu z analizą charakterystyki operacyjnej odbiornika (ROC). Wskaźnik jest zdefiniowany dla wszystkich punktów krzywej ROC, a jego maksymalna wartość może być kryterium wyboru optymalnego punktu odcięcia, gdy test diagnostyczny daje wynik liczbowy, a nie dychotomiczny. Indeks jest reprezentowany graficznie jako wysokość nad linią prawdopodobieństwa i jest również równoważny z polem pod krzywą, na którym znajduje się pojedynczy punkt operacyjny.

Indeks Youdena jest również znany jako deltaP' i uogólnia przypadek dychotomiczny do przypadku wieloklasowego jako poinformowany.

Użycie pojedynczego indeksu „ogólnie nie jest zalecane”, ale poinformowanie lub indeks Youdena to prawdopodobieństwo podjęcia świadomej decyzji (w przeciwieństwie do przypadkowego przypuszczenia) i bierze pod uwagę wszystkie przewidywania.

Niepowiązaną, ale powszechnie używaną kombinacją podstawowych statystyk z wyszukiwania informacji jest F-score , będący (prawdopodobnie ważoną) średnią harmoniczną przypomnienia i precyzji , gdzie przypomnienie = czułość = prawdziwie pozytywny wskaźnik, ale specyficzność i precyzja to zupełnie inne środki. Wynik F, podobnie jak przypomnienie i precyzja, bierze pod uwagę tylko tak zwane przewidywania pozytywne, przy czym przypomnienie to prawdopodobieństwo przewidzenia tylko pozytywnej klasy, precyzja to prawdopodobieństwo, że dodatnia prognoza jest poprawna, a wynik F zrównuje te prawdopodobieństwa pod skuteczne założenie, że pozytywne etykiety i pozytywne prognozy powinny mieć ten sam rozkład i rozpowszechnienie , podobnie jak założenie leżące u podstaw kappa Fleissa . Wskaźniki J, Informedness, Recall, Precision i F-score Youdena są z natury niekierunkowe i mają na celu ocenę dedukcyjna skuteczność predykcji w kierunku zaproponowanym przez regułę, teorię lub klasyfikator. Markedness (deltaP) to J Youdena używane do oceny kierunku odwrotnego lub abdukcyjnego i dobrze pasuje do ludzkiego uczenia się skojarzeń ; zasady i przesądy , gdy modelujemy możliwą przyczynowość ; podczas gdy korelacja i kappa oceniają dwukierunkowo.

Współczynnik korelacji Matthewsa jest średnią geometryczną współczynnika regresji problemu i jego podwójnego , gdzie współczynniki regresji składowych współczynnika korelacji Matthewsa to Markedness (odwrotność J Youdena lub deltaP) i informacyjność (J Youdena lub deltaP'). Statystyki kappa, takie jak kappa Fleissa i kappa Cohena, to metody obliczania wiarygodności między oceniającymi oparte na różnych założeniach dotyczących rozkładów krańcowych lub wcześniejszych i są coraz częściej wykorzystywane jako skorygowane przypadkowo alternatywy dla dokładności w innych kontekstach. Kappa Fleissa , podobnie jak F-score, zakłada, że ​​obie zmienne pochodzą z tego samego rozkładu, a zatem mają tę samą oczekiwaną częstość występowania, podczas gdy kappa Cohena zakłada , że ​​zmienne pochodzą z różnych rozkładów i odnoszą się do modelu oczekiwań , który zakłada, że ​​rozpowszechnienia są niezależny.

Kiedy rzeczywiste rozpowszechnienia dla dwóch dodatnich zmiennych są równe, jak przyjęto w Fleiss kappa i F-score, to znaczy liczba pozytywnych predykcji odpowiada liczbie pozytywnych klas w przypadku dychotomicznym (dwie klasy), różne miary kappa i korelacji załamują się do identyczności z J Youdena, a pamięć, precyzja i F-score są podobnie identyczne z dokładnością .

  1. ^ a b   Youden, WJ (1950). „Indeks oceny testów diagnostycznych” . Rak . 3 : 32–35. doi : 10.1002/1097-0142(1950)3:1<32::aid-cncr2820030106>3.0.co;2-3 . PMID 15405679 .
  2. ^ Pierce CS (1884). „Liczbowa miara powodzenia prognoz”. nauka . 4 (93): 453–454. doi : 10.1126/science.ns-4.93.453.b .
  3. Bibliografia   _ Perkins, New Jersey; Liu, A.; Bondell, H. (2005). „Optymalny punkt odcięcia i odpowiadający mu indeks Youdena do rozróżniania osób przy użyciu połączonych próbek krwi”. Epidemiologia . 16 (1): 73–81. doi : 10.1097/01.ede.0000147512.81966.ba . PMID 15613948 .
  4. ^ a b c d e f Powers, David MW (2011). „Ocena: od precyzji, przypomnienia i wyniku F do ROC, informacyjności, zaznaczenia i korelacji”. Dziennik technologii uczenia maszynowego . 2 (1): 37–63. hdl : 2328/27165 .
  5. ^ b ; Perruchet, P . Peereman, R. (2004). „Wykorzystanie informacji dystrybucyjnych w przetwarzaniu sylab”. J. Neurolingwistyka . 17 (2–3): 97–119. doi : 10.1016/s0911-6044(03)00059-9 .
  6. ^   Everitt BS (2002) The Cambridge Dictionary of Statistics. KUBEK ISBN 0-521-81099-X
  7. ^ a b c Uprawnienia, David MW (2012). Problem z Kappa . Konferencja Europejskiego Oddziału Association for Computational Linguistics. s. 345–355. hdl : 2328/27160 .