Tau Klecka

Tau Kleckiej ( τ ) to statystyka, która służy do sprawdzenia, czy dana analiza klasyfikacyjna poprawia klasyfikację do grup w stosunku do losowego przydziału do różnych rozważanych grup. Maksymalna wartość τ wynosi 1,0, co wskazuje na brak błędów w przewidywaniu. Wartość zero wskazuje na brak poprawy w stosunku do losowego przypisania.

Rozkład τ nie jest obecnie znany i jest używany raczej jako statystyka opisowa niż analityczna.

Uzasadnienie użycia

τ Kleckiej zostało opracowane do użytku z analizą dyskryminacyjną . Surowa dokładność analizy dyskryminacyjnej suma poprawnych predykcji podzielona przez całkowitą liczbę przypadków. Klecka zauważyła, że ​​chociaż odsetek trafnie przewidzianych przypadków jest najbardziej intuicyjną miarą dyskryminacji, wielkość tego odsetka należy oceniać w stosunku do oczekiwanego odsetka poprawnych klasyfikacji dokonanych w drodze losowego przydziału. Proporcjonalne zmniejszenie statystyki błędów ( τ ) można obliczyć, dając standardową miarę poprawy w stosunku do losowego przydziału, niezależnie od liczby grup.

Sformułowanie matematyczne

τ jest zdefiniowane jako [ potrzebne źródło ]

gdzie n corr to liczba prawidłowo sklasyfikowanych przypadków, n i to liczba przypadków w i- tej grupie, N to całkowita liczba przypadków, T to liczba grup, a p i to prawdopodobieństwo przypisania sprawy do tę grupę przypadkowo ( p i = 1 / T ).

Używa

Oprócz zastosowania w analizie dyskryminacyjnej był używany w analizie regresji wielokrotnej , regresji probitowej , regresji logistycznej i analizie obrazu .