Problem klasy referencyjnej

W statystyce problem klasy referencyjnej to problem z podjęciem decyzji, której klasy użyć do obliczenia prawdopodobieństwa mającego zastosowanie do konkretnego przypadku.

Na przykład, aby oszacować prawdopodobieństwo katastrofy statku powietrznego, moglibyśmy odnieść się do częstotliwości katastrof wśród różnych zestawów statków powietrznych: wszystkich statków powietrznych tej marki, samolotów tej firmy w ciągu ostatnich dziesięciu lat itd. W tym przypadku na przykład statek powietrzny, dla którego chcemy obliczyć prawdopodobieństwo katastrofy, należy do wielu różnych klas, w których częstotliwość wypadków jest różna. Nie jest oczywiste, do jakiej klasy należy odnieść się do tego samolotu. Ogólnie rzecz biorąc, każdy przypadek należy do bardzo wielu klas, wśród których częstotliwość występowania interesującego nas atrybutu jest różna. Problem klasy referencyjnej omawia, która klasa jest najbardziej odpowiednia do użycia.

Bardziej formalnie, wiele argumentów w statystyce przybiera formę sylogizmu statystycznego :

  1. proporcja sol
  2. jest
  3. Dlatego szansa, że ​​​​to { jest

nazywana jest „klasą referencyjną”, a „klasą atrybutów” i . Jak wybrać odpowiednią klasę ?

W statystyce bayesowskiej problem pojawia się przy podejmowaniu decyzji o wcześniejszym prawdopodobieństwie danego wyniku (lub rozważając wiele wyników, wcześniejszy rozkład prawdopodobieństwa).

Historia

John Venn stwierdził w 1876 r., Że „każda rzecz lub zdarzenie ma nieokreśloną liczbę obserwowalnych właściwości lub atrybutów i dlatego można je uznać za należące do nieokreślonej liczby różnych klas rzeczy”, co prowadzi do problemów z przypisywaniem prawdopodobieństw do jednej sprawy. Jako przykład podał prawdopodobieństwo, że John Smith, żarłoczny Anglik w wieku pięćdziesięciu lat, dożyje sześćdziesięciu jeden lat.

Nazwę „problem klasy odniesienia” nadał Hans Reichenbach , który napisał: „Jeśli poproszono nas o znalezienie prawdopodobieństwa wystąpienia pojedynczego zdarzenia w przyszłości, musimy najpierw włączyć to zdarzenie do odpowiedniej klasy odniesienia. Pojedyncza rzecz lub zdarzenie może być włączone do wielu klas referencyjnych, z których będą wynikać różne prawdopodobieństwa”.

Omówiono również problem klas referencyjnych w filozofii i naukach przyrodniczych, np. prognozowanie badań klinicznych.

Aplikacje prawne

Stosowanie prawdopodobieństwa bayesowskiego w praktyce polega na ocenie wcześniejszego prawdopodobieństwa , które jest następnie stosowane do funkcji wiarygodności i aktualizowane za pomocą twierdzenia Bayesa . Załóżmy, że chcemy ocenić prawdopodobieństwo winy oskarżonego w sprawie sądowej, w której dostępne są dowody DNA (lub inne probabilistyczne). Najpierw musimy ocenić wcześniejsze prawdopodobieństwo winy oskarżonego. Można powiedzieć, że przestępstwo miało miejsce w mieście liczącym 1 000 000 mieszkańców, z czego 15% spełnia wymagania co do płci, wieku i przybliżonego rysopisu sprawcy. Sugeruje to wcześniejsze prawdopodobieństwo winy wynoszące 1 na 150 000. Moglibyśmy zarzucić sieć szerzej i powiedzieć, że istnieje, powiedzmy, 25% szans, że sprawca pochodzi spoza miasta, ale nadal z tego kraju, i skonstruować inne wstępne oszacowanie. Można powiedzieć, że sprawca mógł pochodzić z dowolnego miejsca na świecie i tak dalej.

Teoretycy prawa omawiali problem klasy odniesienia, szczególnie w odniesieniu do sprawy Shonubi. Charles Shonubi, nigeryjski przemytnik narkotyków, został aresztowany na lotnisku JFK 10 grudnia 1991 roku i skazany za heroinę przywóz. Surowość jego wyroku zależała nie tylko od ilości narkotyków podczas tej podróży, ale także od całkowitej ilości narkotyków, które miał przywieźć przy siedmiu poprzednich okazjach, na których nie został złapany. W pięciu oddzielnych sprawach sądowych debatowano, w jaki sposób należy oszacować tę kwotę. W jednej sprawie, „Shonubi III”, prokuratura przedstawiła dowody statystyczne dotyczące ilości narkotyków znalezionych u nigeryjskich przemytników narkotyków złapanych na lotnisku JFK w okresie między pierwszą a ostatnią podróżą Shonubi. Odbyła się debata na temat tego, czy jest to (lub) poprawna klasa odniesienia do użycia, a jeśli tak, to dlaczego.

Inne zastosowania prawne obejmują wycenę. Na przykład domy mogą być wyceniane na podstawie danych z bazy danych sprzedaży domów „podobnych”. Aby zdecydować, które domy są podobne do danego, trzeba wiedzieć, jakie cechy domu mają znaczenie dla ceny. Liczba łazienek może mieć znaczenie, ale nie kolor oczu właściciela. Argumentowano, że takie problemy klasy referencyjnej można rozwiązać, ustalając, które cechy są istotne: cecha jest istotna dla ceny domu, jeśli współzmienne ceny domu z nim (wpływa na prawdopodobieństwo, że dom ma wyższą lub niższą wartość), a idealną klasą odniesienia dla jednostki jest zbiór wszystkich instancji, które mają z nią wspólne wszystkie istotne cechy.

Zobacz też