Wybierz najlepszą heurystykę
W psychologii heurystyka „ bierz najlepsze” to heurystyka (prosta strategia podejmowania decyzji ), która decyduje między dwiema alternatywami, wybierając na podstawie pierwszej wskazówki, która je dyskryminuje, gdzie wskazówki są uporządkowane według ważności wskazówki (od najwyższej do najniższej) . W pierwotnym sformułowaniu przyjęto, że wskazówki mają wartości binarne (tak lub nie) lub mają nieznaną wartość. Logika heurystyki polega na tym, że opiera ona swój wybór tylko na najlepszej wskazówce (powódce) i ignoruje resztę.
Psychologowie Gerd Gigerenzer i Daniel Goldstein odkryli, że heurystyka zaskakująco dobrze radzi sobie z dokładnymi wnioskami w rzeczywistych środowiskach, takimi jak wnioskowanie, które z dwóch miast jest większe. Od tego czasu heurystyka została zmodyfikowana i zastosowana w dziedzinach takich jak medycyna , sztuczna inteligencja i prognozy polityczne . Wykazano również, że heurystyka może dokładnie modelować, w jaki sposób eksperci, tacy jak celnicy lotniskowi i zawodowi włamywacze, podejmują decyzje. Heurystyka może również przewidywać szczegóły proces poznawczy , taki jak liczba użytych wskazówek i czas reakcji, często lepszy niż złożone modele, które integrują wszystkie dostępne wskazówki; jako taki jest przykładem efektu mniej znaczy więcej .
Podejmowanie decyzji z jednego powodu
Teorie podejmowania decyzji zwykle zakładają, że wszystkie istotne powody (cechy lub wskazówki) są wyszukiwane i włączane do ostatecznej decyzji. Jednak w warunkach niepewności (w przeciwieństwie do ryzyka) zazwyczaj nie wszystkie istotne wskazówki są znane, podobnie jak ich dokładne wagi i korelacje między wskazówkami. W takich sytuacjach poleganie tylko na najlepszej dostępnej wskazówce może być rozsądną alternatywą, która pozwala na szybkie, oszczędne i trafne decyzje. Taka jest logika klasy heurystyk znanych jako „podejmowanie decyzji z jednego powodu”, która obejmuje branie najlepszego. Rozważ cue z wartościami binarnymi (0, 1), gdzie 1 wskazuje wartość cue, która jest powiązana z wyższą wartością kryterium. Zadaniem jest wywnioskować, która z dwóch alternatyw ma wyższą wartość kryterium. Przykładem jest, która z dwóch drużyn NBA wygra mecz, na podstawie wskazówek, takich jak mecz u siebie i kto wygrał ostatni mecz. Heurystyka „bierz najlepsze” obejmuje trzy kroki prowadzące do takiego wnioskowania:
Reguła wyszukiwania : Przejrzyj wskazówki w kolejności ich ważności.
Reguła zatrzymania : Zatrzymaj wyszukiwanie, gdy zostanie znaleziona pierwsza pamięć, w której wartości dwóch alternatyw różnią się.
Reguła decyzyjna : Przewiduj, że alternatywa z wyższą wartością wskazującą ma wyższą wartość zmiennej wynikowej.
Trafność v wskazówki jest określona wzorem v = C/(C+W), gdzie C to liczba poprawnych wniosków, gdy wskazówka dyskryminuje, a W to liczba błędnych wniosków, wszystkie oszacowane na podstawie próbek.
Weź najlepsze do zadania porównawczego
Rozważ zadanie wywnioskowania, który obiekt, A czy B, ma wyższą wartość na podstawie kryterium numerycznego. Jako przykład wyobraź sobie, że ktoś musi ocenić, czy niemieckie miasto Kolonia ma większą populację niż inne niemieckie miasto Stuttgart. Ten osąd lub wnioskowanie musi opierać się na informacjach dostarczonych przez sygnały binarne, takie jak „Czy miasto jest stolicą stanu?”. Z formalnego punktu widzenia zadanie jest kategoryzacją: para (A, B) ma być sklasyfikowana jako X A > X B lub X B > X A (gdzie X oznacza kryterium), w oparciu o informację wskazującą.
Wskazówki są binarne; oznacza to, że przyjmują dwie wartości i mogą być modelowane, na przykład, jako posiadające wartości 0 i 1 (dla „tak” i „nie”). Są one uszeregowane zgodnie z ich ważnością wskazówek , zdefiniowany jako proporcja poprawnych porównań między parami A i B, dla których ma różne wartości, tj. dla których rozróżnia A i B. Bierze-najlepszy analizuje każdą wskazówkę, jedną po drugiej, zgodnie z uszeregowanie według ważności i zatrzymanie pierwszego razu, gdy wskazówka dyskryminuje pozycje i wyciągnięcie wniosku, że pozycja o większej wartości ma również większą wartość w kryterium. Macierz wszystkich obiektów klasy referencyjnej, z której wzięto A i B, oraz wartości cue opisujących te obiekty stanowi tzw. środowisko. Gigerenzer i Goldstein, którzy wprowadzili Take-The-Best (patrz Gerd Gigerenzer i Daniela Goldsteina , DG (1996) ) rozważyli, jako przykład poglądowy, dokładnie pary niemieckich miast. ale tylko te, które mają więcej niż 100 000 mieszkańców. Zadanie porównawcze dla danej pary (A, B) niemieckich miast klasy referencyjnej polegało na ustaleniu, które z nich ma większą populację, na podstawie dziewięciu wskazówek. Wskazówki miały wartość binarną, na przykład, czy miasto jest stolicą stanu lub czy ma drużynę piłkarską w lidze krajowej. Wartości cue mogą być modelowane przez 1 (dla „tak”) i 0 (dla „nie”), tak aby każde miasto mogło być identyfikowane za pomocą jego „profilu cue”, tj. e wektora 1' i 0, uporządkowanych zgodnie z rankingiem wskazówek.
Pytanie brzmiało: Jak można wywnioskować, który z dwóch obiektów, na przykład miasto A z profilem wskazującym (100101010) i miasto B z profilem wskazującym (100010101) , uzyskuje wyższe wyniki w ustalonym kryterium, tj. wielkości populacji? Heurystyka „bierz najlepsze” po prostu porównuje profile leksykograficznie, tak jak porównywane są liczby zapisane w podstawie drugiej: pierwsza wartość cue wynosi 1 dla obu, co oznacza, że pierwsza wskazówka nie rozróżnia A i B. Druga wartość cue wynosi 0 dla obu, ponownie bez dyskryminacji. To samo dzieje się z trzecią wartością wskazującą, podczas gdy czwarta wartość wskazująca wynosi 1 dla A i 0 dla B, co oznacza, że A jest oceniane jako posiadające wyższą wartość w kryterium. Innymi słowy, X A > X B wtedy i tylko wtedy, gdy (100101010) > (100010101) .
Matematycznie oznacza to, że wskazówki znalezione dla porównania pozwalają na quasi- porządkowy izomorfizm między porównywanymi obiektami na podstawie kryterium, w tym przypadku miastami z ich populacjami i odpowiadającymi im wektorami binarnymi. Tutaj „quasi” oznacza, że izomorfizm na ogół nie jest doskonały, ponieważ zestaw wskazówek nie jest doskonały.
Zaskakujące jest to, że ta prosta heurystyka ma świetne wyniki w porównaniu z innymi strategiami. Jedną z oczywistych miar ustalania działania mechanizmu wnioskowania jest odsetek poprawnych osądów. Co więcej, najważniejsze jest nie tylko działanie heurystyki podczas dopasowywania znanych danych, ale także podczas uogólniania znanego zestawu uczącego na nowe elementy.
Czerlinski, Goldstein i Gigerenzer porównali kilka strategii z Take-the-best: prosty model Tallying lub model wagi jednostkowej (zwany także w tej literaturze „Regułą Dawesa”), ważony model liniowy oparty na wskazówkach ważonych ich ważnością (zwany także „Reguła Franklina” w tej literaturze), regresja liniowa i minimalistyczny. Ich wyniki pokazują solidność zasady „bierz najlepsze” w uogólnianiu.
Rozważmy na przykład zadanie wyboru większego miasta z dwóch miast kiedy
- Modele pasują do zbioru danych 83 niemieckich miast
- Modele wybierają większe z pary miast dla wszystkich par miast 83*82/2.
Procent poprawnych wyników wynosił około 74% dla regresji typu „bierz najlepsze”, liniowej masy jednostkowej. Dokładniej, wyniki wyniosły 74,3%, 74,2% i 74,1%, więc regresja wygrała z niewielkim marginesem.
Jednak w artykule uwzględniono również uogólnienie (znane również jako przewidywanie poza próbą).
- Modele są dopasowane do zestawu danych losowo wybranej połowy z 83 niemieckich miast
- Modele wybierają większe z pary miast wylosowanych z *drugiej* połowy miast.
W tym przypadku, gdy użyto 10 000 różnych losowych podziałów, regresja miała średnio 71,9% poprawności, Take-the-the-best 72,2%, a jednostka z liniowym miała 71,4%. W tym przypadku heurystyka „bierz najlepsze” była dokładniejsza niż regresja. Wyniki te zostały przedstawione w.