Optymalne zatrzymanie

W matematyce teoria optymalnego zatrzymania lub wczesnego zatrzymania dotyczy problemu wyboru czasu na podjęcie określonego działania, aby zmaksymalizować oczekiwaną nagrodę lub zminimalizować oczekiwany koszt. Problemy optymalnego zatrzymania można znaleźć w obszarach statystyki , ekonomii i finansów matematycznych (związanych z wyceną opcji amerykańskich ). Kluczowym przykładem optymalnego problemu zatrzymania jest problem sekretarki . Problemy optymalnego zatrzymania można często zapisać w postaci równania Bellmana i dlatego często rozwiązuje się je za pomocą programowania dynamicznego .

Definicja

Przypadek czasu dyskretnego

Problemy z regułą zatrzymywania są powiązane z dwoma obiektami:

  1. Sekwencja zmiennych losowych , jest czymś, co zakłada
  2. Sekwencja funkcji „nagrody”
    losowych w 1

Biorąc pod uwagę te obiekty, problem jest następujący:

  • Obserwujesz sekwencję zmiennych losowych i na każdym kroku przerwać obserwację lub
  • Jeśli przestaniesz obserwować w kroku otrzymasz nagrodę
  • Chcesz wybrać regułę zatrzymania , aby zmaksymalizować oczekiwaną nagrodę (lub równoważnie, zminimalizować oczekiwaną stratę)

Przypadek czasu ciągłego

proces na filtrowanej sol jest dostosowany do filtracji. Optymalnym problemem zatrzymania jest znalezienie czasu zatrzymania , który maksymalizuje oczekiwany zysk

gdzie funkcją . _ Tutaj może przyjąć wartość .

Bardziej specyficzna formuła jest następująca. Rozważamy proces przestrzeni gdzie oznacza miarę prawdopodobieństwa , w której proces stochastyczny rozpoczyna się w . Biorąc pod uwagę funkcje ciągłe i optymalnym problemem zatrzymania jest

Nazywa się to czasem formułą MLS (co oznacza odpowiednio Mayer, Lagrange i supremum).

Metody rozwiązania

Zasadniczo istnieją dwa podejścia do rozwiązywania problemów z optymalnym zatrzymaniem. Gdy podstawowy proces (lub proces wzmocnienia) jest opisany przez jego bezwarunkowe rozkłady skończonych wymiarów , odpowiednią techniką rozwiązania jest podejście martyngałowe, zwane tak, ponieważ wykorzystuje teorię martyngałów , przy czym najważniejszą koncepcją jest obwiednia Snella . W przypadku czasu dyskretnego, jeśli horyzont planowania skończony , problem można również łatwo rozwiązać za pomocą programowania dynamicznego

Kiedy podstawowy proces jest określony przez rodzinę (warunkowych) funkcji przejściowych prowadzących do rodziny prawdopodobieństw przejścia Markowa, często można wykorzystać potężne narzędzia analityczne dostarczane przez teorię procesów Markowa, a podejście to jest określane jako metoda Markowa. Rozwiązanie zwykle uzyskuje się, rozwiązując powiązane problemy swobodnej granicy ( problemy Stefana ).

Wynik dyfuzji skoku

Niech będzie dyfuzją Lévy'ego w podaną przez SDE Y t

gdzie jest ruchem Browna jest L miarą losową Poissona , , × Y istnieje. Niech być zbiorem otwartym (obszar wypłacalności) i

być czasem bankructwa. Optymalny problem zatrzymania to:

Okazuje się, że przy pewnych warunkach regularności zachodzi następujące twierdzenie weryfikacyjne:

Jeśli funkcja spełnia ϕ

  • regionem kontynuacji jest ,
  • na i
  • na gdzie jest nieskończenie małym generatorem (

wtedy dla wszystkich . Co więcej, jeśli

  • na

ϕ dla wszystkich i to optymalny czas zatrzymania.

Warunki te można również zapisać w bardziej zwartej postaci ( nierówność całkowo-wariacyjna ):

  • na

Przykłady

Rzucanie monetą

(Przykład, gdzie zbiega się)

Masz uczciwą monetę i wielokrotnie ją rzucasz. Za każdym razem, zanim zostanie wyrzucony, możesz zatrzymać rzucanie i otrzymać zapłatę (powiedzmy w dolarach) za średnią liczbę zaobserwowanych orłów.

Chcesz zmaksymalizować kwotę, którą otrzymujesz, wybierając regułę zatrzymania. Jeżeli X i (dla i ≥ 1) tworzy ciąg niezależnych zmiennych losowych o identycznym rozkładzie z rozkładem Bernoulliego

i jeśli

sekwencje { to obiekty powiązane z tym problemem.

Sprzedaż domu

(Przykład, gdzie niekoniecznie jest zbieżny)

Masz dom i chcesz go sprzedać. otrzymujesz ofertę swojego domu i płacisz, go reklamować. Jeśli sprzedasz swój dom w dniu n - .

Chcesz zmaksymalizować zarobioną kwotę, wybierając regułę zatrzymania.

W tym przykładzie sekwencja ( to sekwencja ofert dla twojego domu, a sekwencja funkcji nagród to, ile

Problem z sekretarką

(Przykład, gdzie jest skończoną sekwencją)

Obserwujesz sekwencję obiektów, które można uszeregować od najlepszego do najgorszego. Chcesz wybrać regułę zatrzymania, która zmaksymalizuje twoje szanse na wybranie najlepszego obiektu.

Tutaj, jeśli ( n jest jakąś liczbą) to rangi obiektów to szansa, że ​​wybierzesz najlepszy obiekt, jeśli przestaniesz celowo odrzucać obiekty w kroku i, a następnie i to sekwencje związane z tym problemem. Problem ten został rozwiązany na początku lat 60. przez kilka osób. Eleganckie rozwiązanie problemu sekretarki i kilka modyfikacji tego problemu zapewnia nowszy algorytm prawdopodobieństwa optymalnego zatrzymania (algorytm Brussa).

Teoria wyszukiwania

Ekonomiści przestudiowali szereg optymalnych problemów zatrzymania podobnych do „problemu sekretarki” i zazwyczaj nazywają ten typ analizy „teorią poszukiwań”. Teoria wyszukiwania koncentrowała się szczególnie na poszukiwaniu przez pracownika wysoko płatnej pracy lub poszukiwaniu przez konsumenta taniego towaru.

Problem z parkowaniem

Szczególnym przykładem zastosowania teorii poszukiwań jest zadanie optymalnego wyboru miejsca parkingowego przez kierowcę udającego się do opery (teatru, na zakupy itp.). Zbliżając się do celu, kierowca jedzie ulicą, wzdłuż której znajdują się miejsca parkingowe – zazwyczaj tylko niektóre miejsca na parkingu są wolne. Cel jest dobrze widoczny, więc łatwo ocenić odległość od celu. Zadaniem kierowcy jest wybranie wolnego miejsca parkingowego jak najbliżej celu bez zawracania, tak aby odległość z tego miejsca do celu była jak najkrótsza.

Handel opcjami

W obrocie opcjami na rynkach finansowych posiadacz opcji amerykańskiej może skorzystać z prawa do kupna (lub sprzedaży) instrumentu bazowego po z góry określonej cenie w dowolnym momencie przed lub w dniu wygaśnięcia opcji. Dlatego wycena opcji amerykańskich jest zasadniczo problemem optymalnego zatrzymania. klasyczną konfigurację Blacka-Scholesa i niech { \ displaystyle \ i być stopą dywidendy i zmiennością akcji. Cena akcji geometrycznymi ruchami Browna

w ramach środka neutralnego pod względem ryzyka.

Gdy opcja jest wieczna, optymalnym problemem zatrzymania jest

gdzie funkcja wypłaty to dla opcji kupna i dla opcji put. Nierówność wariacyjna jest

dla wszystkich gdzie ćwiczenia . Rozwiązanie znane jest

  • (Nieustanna rozmowa) gdzie i
  • (Perpetual put) gdzie _

Z drugiej strony, gdy data wygaśnięcia jest skończona, problem jest związany z dwuwymiarowym problemem swobodnej granicy bez znanego rozwiązania w postaci zamkniętej. Można jednak zastosować różne metody numeryczne. Zobacz model Blacka-Scholesa #opcje amerykańskie, aby zapoznać się z różnymi metodami wyceny tutaj, a także Fugit , aby uzyskać dyskretne, oparte na drzewie obliczenie optymalnego czasu na wykonanie.

Zobacz też

Cytaty

Źródła