Dowodowa teoria decyzji

Dowodowa teoria decyzji (EDT) to szkoła myślenia w ramach teorii decyzji , która stwierdza, że ​​kiedy racjonalny agent ma do czynienia ze zbiorem możliwych działań, należy wybrać działanie o najwyższej wartości informacyjnej , to znaczy działanie, które byłoby wskazuje na najlepszy wynik w oczekiwaniu, jeśli otrzyma się „wiadomość”, że została podjęta. Innymi słowy, zaleca „rób to, czego najbardziej chcesz się nauczyć, że będziesz robić”.

EDT kontrastuje z teorią decyzji przyczynowych (CDT), która zaleca podejmowanie działań, które przyczynowo przyniosą najlepszy wynik. Chociaż te dwie teorie są w wielu przypadkach zgodne, dają różne werdykty w pewnych filozoficznych eksperymentach myślowych. Na przykład EDT zaleca zabranie tylko jednego pudełka w paradoksie Newcomba , podczas gdy CDT zaleca zabranie obu pudełek.

Opis formalny

W artykule z 1976 roku Allan Gibbard i William Harper rozróżnili dwa rodzaje maksymalizacji oczekiwanej użyteczności . EDT proponuje maksymalizację oczekiwanej użyteczności działań obliczonych za pomocą prawdopodobieństw warunkowych , a mianowicie

gdzie jest celowość wyniku i jest prawdopodobieństwem warunkowym, pod uwagę, . Kontrastuje to z kontrfaktycznym sformułowaniem oczekiwanej użyteczności stosowanym w przyczynowej teorii decyzji

wyrażenie wskazuje prawdopodobieństwo w sytuacja kontrfaktyczna , w której wykonywana jest czynność ZA P. nie zawsze są równe, te sformułowania oczekiwanej użyteczności nie są równoważne, co prowadzi do różnic w działaniach zalecanych przez EDT i CDT.

Eksperymenty myślowe

Różne teorie decyzyjne są często badane w swoich zaleceniach dotyczących działań w różnych eksperymentach myślowych .

Paradoks Newcomba

W paradoksie Newcomba jest predyktor, gracz i dwa pola oznaczone A i B. Predyktor jest w stanie wiarygodnie przewidzieć wybory gracza — powiedzmy, z 99% dokładnością. Gracz ma wybór między zabraniem tylko pudełka B lub zabraniem obu pudełek A i B. Gracz wie, co następuje:

  • Pudełko A jest przezroczyste i zawsze zawiera widoczne 1000 $.
  • Pudełko B jest nieprzezroczyste, a jego zawartość została już ustawiona przez predyktora:
    • Jeśli predyktor przewidział, że gracz weźmie oba pudełka A i B, to pudełko B nie zawiera niczego.
    • Jeśli predyktor przewidział, że gracz weźmie tylko pudełko B, to pudełko B zawiera 1 000 000 $.

Dokonując wyboru, gracz nie wie, co przewidział wróżbita ani co zawiera pudełko B. Czy gracz powinien wziąć oba pudełka, czy tylko pudełko B?

Teoria decyzji opartych na dowodach zaleca w tym scenariuszu wzięcie tylko pudełka B, ponieważ wzięcie tylko pudełka B jest mocnym dowodem na to, że predyktor przewidział, że gracz weźmie tylko pudełko B, a zatem jest bardzo prawdopodobne, że pudełko B zawiera 1 000 000 $. I odwrotnie, wybranie obu pudełek jest mocnym dowodem na to, że osoba przewidująca wiedziała, że ​​gracz weźmie oba pudełka; dlatego powinniśmy oczekiwać, że pudełko B nie zawiera niczego.

Formalnie oczekiwane narzędzia są

Ponieważ , EDT zaleca wzięcie tylko pudełka B .

Dylemat bliźniaczego więźnia

W tej wariacji na temat eksperymentu myślowego Dylemat więźnia agent musi wybrać, czy chce współpracować, czy zdradzić swojego psychologicznego bliźniaka, którego procesy rozumowania są dokładnie analogiczne do jej własnych.

Aomame i jej psychologiczny bliźniak są umieszczani w oddzielnych pokojach i nie mogą się komunikować. Jeśli obaj współpracują, każdy dostaje 5 $. Jeśli obaj odrzucą, każdy z nich otrzyma 1 $. Jeśli jeden współpracuje, a drugi ma wady, to jeden dostaje 10 dolarów, a drugi 0 dolarów. Zakładając, że Aomame zależy tylko na jej indywidualnej wypłacie, co powinna zrobić?

Teoria decyzji dowodowych zaleca współpracę w tej sytuacji, ponieważ decyzja Aomame o współpracy jest mocnym dowodem na to, że jej psychologiczny bliźniak również będzie współpracować, co oznacza, że ​​jej oczekiwana wypłata to 5 dolarów. Z drugiej strony, jeśli Aomame odpadnie, będzie to mocny dowód, że jej bliźniak również ulegnie, co spowoduje oczekiwaną wypłatę w wysokości 1 dolara. Formalnie oczekiwane narzędzia są

Ponieważ , EDT zaleca współpracę.

Inne argumenty wspierające

Nawet jeśli ktoś przywiązuje mniejszą wagę do dowodowej teorii decyzji, rozsądne może być działanie tak, jakby EDT było prawdziwe. Mianowicie, ponieważ EDT może obejmować działania wielu skorelowanych decydentów, jego stawka może być wyższa niż przyczynowa teoria decyzji, a zatem mieć pierwszeństwo.

Krytyka

David Lewis scharakteryzował teorię decyzji dowodowych jako promującą „irracjonalną politykę zarządzania wiadomościami”. James M. Joyce stwierdził: „Racjonalni agenci wybierają działania na podstawie ich skuteczności przyczynowej , a nie pomyślności; działają, aby przynieść dobre rezultaty, nawet jeśli może to oznaczać złe wieści”.

Oprócz przyczynowej teorii decyzji można zamiast tego wybrać ponadczasową lub funkcjonalną teorię decyzji .

Zobacz też

Linki zewnętrzne