Oczekiwana wartość przykładowych informacji

W teorii decyzji oczekiwana wartość informacji o próbce ( EVSI ) to oczekiwany wzrost użyteczności, jaki decydent mógłby uzyskać dzięki uzyskaniu dostępu do próbki dodatkowych obserwacji przed podjęciem decyzji. Dodatkowe informacje uzyskane z próby mogą pozwolić na podjęcie bardziej świadomej, a przez to lepszej decyzji, skutkującej wzrostem oczekiwanej użyteczności. EVSI próbuje oszacować, jaka byłaby ta poprawa, zanim zobaczy rzeczywiste przykładowe dane; stąd EVSI jest formą tak zwanej analizy przedposterialnej . Wykorzystanie EVSI w teorii decyzji zostało spopularyzowane przez Roberta Schlaifera i Howarda Raiffę w latach 60. XX wieku.

Sformułowanie

Pozwalać

Jest to powszechne (ale nie niezbędne) w scenariuszach EVSI dla , i , co oznacza, że ​​każda obserwacja jest nieobciążonym odczytem czujnika stanu podstawowego czym każdy odczyt czujnika jest niezależny i identycznie rozłożony.

Użyteczność z optymalnej decyzji opartej tylko na a priori, bez dalszych obserwacji, jest dana przez

Gdyby decydent mógł uzyskać dostęp do pojedynczej próbki, optymalna późniejsza użyteczność byłaby

gdzie otrzymuje się z reguły Bayesa : p ( x | z ) {\ Displaystyle p (x | z)}

Ponieważ nie wiedzą, jaka próbka zostałaby faktycznie uzyskana, gdyby taka została uzyskana, muszą uśrednić wszystkie możliwe próbki, aby uzyskać oczekiwaną użyteczność przy danej próbce:

Oczekiwana wartość informacji o próbce jest wtedy definiowana jako

Obliczenie

Rzadko jest wykonalne analityczne przeprowadzenie integracji w przestrzeni możliwych obserwacji w E[U|SI], więc obliczenie EVSI zwykle wymaga symulacji Monte Carlo . Metoda polega na losowej symulacji próbki, wtedy używając do obliczenia tylnej podstawie . Cały ten proces jest następnie powtarzany wielokrotnie, dla aby uzyskać Monte Carlo użyteczności. Są one uśredniane w celu uzyskania oczekiwanej użyteczności dla hipotetycznej próby.

Przykład

Agencja regulacyjna ma zdecydować, czy zatwierdzić nowe leczenie. Przed podjęciem ostatecznej decyzji o zatwierdzeniu / odrzuceniu pytają jaka byłaby wartość przeprowadzenia dalszych badań próbnych na . Na to pytanie odpowiada EVSI.

schemat modelu EVSI

Diagram przedstawia diagram wpływu do obliczania EVSI w tym przykładzie.

Model klasyfikuje wynik dla dowolnego przedmiotu do jednej z pięciu kategorii:

{"Wyleczenie", "Poprawa", "Nieskuteczne", "Łagodny efekt uboczny", "Poważny efekt uboczny"}

Każdemu z tych wyników przypisuje użyteczność równą szacowanej wartości pieniężnej wyniku odpowiadającej pacjentowi.

Stan decyzyjny tym przykładzie jest wektorem pięciu liczb z przedziału od 0 do 1, które sumują się do 1, co daje odsetek przyszłych pacjentów, którzy doświadczą każdego z pięciu możliwych wyników Na przykład stan oznacza przypadek, w którym 5% pacjentów zostaje wyleczonych, 60% poprawia się, 20% uważa leczenie za nieskuteczne, 10% doświadcza łagodnych skutków ubocznych, a 5% doświadcza niebezpiecznych skutków ubocznych.

Wcześniejszy jest kodowany przy użyciu Dirichleta , wymagającego pięciu liczb (które nie sumują się do 1), których względne wartości obejmują oczekiwaną względną proporcję każdego wyniku siłę tego wcześniejszego przekonania. Na diagramie parametry rozkładu Dirichleta zawarte są w zmiennej dirichlet alfa prior , podczas gdy sam rozkład a priori jest zawarty w zmiennej losowej Prior . Wykres gęstości prawdopodobieństwa marginesów pokazano tutaj :

EVSI prior marginals.png

W przypadku zmiennej losowej Dane próbne dane próbne są symulowane jako próbka Monte Carlo z rozkładu wielomianowego . Na przykład, gdy Trial_size=100, każda próbka Monte Carlo Trial_data zawiera wektor, który sumuje się do 100, pokazując liczbę osób w symulowanym badaniu, które doświadczyły każdego z pięciu możliwych wyników. Poniższa tabela wyników przedstawia wyniki pierwszych 8 symulowanych prób:

EVSI trial data.png

Połączenie tych danych próbnych z wcześniejszym Dirichletem wymaga jedynie dodania częstości wyników do wcześniejszych wartości alfa Dirichleta, co skutkuje rozkładem a posteriori Dirichleta dla każdej symulowanej próby. Dla każdego z nich decyzja o zatwierdzeniu jest podejmowana na podstawie tego, czy średnia użyteczność jest dodatnia, a stosując użyteczność zerową, gdy leczenie nie jest zatwierdzone, uzyskuje się użyteczność przed-posteriorową . Powtarzając obliczenia dla zakresu możliwych rozmiarów próby, uzyskuje się EVSI dla każdej możliwej wielkości próby kandydującej, jak pokazano na tym wykresie:

EVSI result.png

Porównanie z powiązanymi środkami

Oczekiwana wartość informacji o próbce (EVSI) to relaksacja metryki wartości doskonałej informacji (EVPI), która koduje wzrost użyteczności, który zostałby uzyskany, gdyby ktoś poznał prawdziwy stan . Zasadniczo EVPI wskazuje na wartość doskonałych informacji, podczas gdy EVSI wskazuje na wartość niektórych ograniczonych i niekompletnych informacji.

Wartość oczekiwana uwzględnienia niepewności (EVIU) porównuje wartość modelowania niepewnych informacji z modelowaniem sytuacji bez uwzględnienia niepewności. Ponieważ wpływ niepewności na obliczone wyniki jest często analizowany za pomocą metody Monte Carlo , EVIU wydaje się być bardzo podobny do wartości przeprowadzania analizy za pomocą próbki Monte Carlo , co bardzo przypomina pojęcie uchwycone za pomocą EVSI. Jednak EVSI i EVIU są dość różne - zauważalna różnica między sposobem, w jaki EVSI wykorzystuje aktualizację bayesowską do włączenia symulowanej próbki.

Zobacz też

Dalsza lektura

  •   Hamburg, Morris; Młody, Peg (1993). „Opracowywanie optymalnych strategii przed pobraniem próbek”. Analiza statystyczna podejmowania decyzji . Fort Worth: Dryden Press. s. 731–766. ISBN 0-03-096914-X .