Hamiltonian jest funkcją używaną do rozwiązania problemu optymalnego sterowania układem dynamicznym . Można to rozumieć jako chwilowy przyrost Lagrange'a wyrażenia problemu, który ma być optymalizowany w określonym przedziale czasu. Zainspirowany, ale różniący się od hamiltonianu mechaniki klasycznej , hamiltonian teorii sterowania optymalnego został opracowany przez Lwa Pontryagina jako część jego zasady maksimum . Pontryagin udowodnił, że warunkiem koniecznym rozwiązania problemu sterowania optymalnego jest taki dobór sterowania, aby optymalizować hamiltonian.
Sformułowanie problemu i definicja hamiltonianu
Rozważ układ równań pierwszego rzędu
gdzie a wektor zmiennych sterujących. Po spełnieniu warunków początkowych i steruje są podane rozwiązania równań różniczkowych, zwane a , można znaleźć. Problem optymalnej kontroli polega na wybraniu R ) tak, że maksymalizuje lub minimalizuje pewien celu między czasem początkowym czasem końcowym ( gdzie być nieskończonością ). celem w każdym momencie,
podlega powyższym równaniom ruchu zmiennych stanu. Metoda rozwiązania polega na zdefiniowaniu funkcji pomocniczej znanej jako hamiltonian kontrolny
który łączy funkcję celu i równania stanu podobnie jak Lagrange'a w statycznym problemie optymalizacji, tyle że mnożniki określane zmienne funkcjami czas, a nie stałe.
znalezienie optymalnej funkcji polityki sterowania, nią optymalnej trajektorii , które zgodnie z zasadą maksimum Pontryagina są argumentami maksymalizującymi hamiltonian,
-
u
Warunki konieczne pierwszego rzędu dla maksimum są podane przez
-
maksimum,
-
generuje funkcję przejścia stanu ,
-
generuje
z których te ostatnie są określane jako równania stanu . Razem równania stanu i kosztu opisują hamiltonowski układ dynamiczny (ponownie analogiczny, ale różny od układu hamiltonowskiego w fizyce), którego rozwiązanie obejmuje dwupunktowy problem wartości brzegowych , biorąc pod uwagę, że istnieje początkowy ( różniczkowe dla zmiennych stanu) i czas końcowy ( równania różniczkowe dla zmiennych kosztowych; chyba że określona jest funkcja końcowa, warunki brzegowe to lub dla nieskończonych horyzontów czasowych).
Warunkiem wystarczającym na maksimum jest wklęsłość hamiltonianu ocenianego w rozwiązaniu, tj
gdzie jest optymalną kontrolą i daje optymalną trajektorię dla zmiennej stanu. Alternatywnie, przez wynik uzyskany przez Olviego L. Mangasariana , warunki konieczne są wystarczające, jeśli funkcje fa wklęsłe w i .
Wyprowadzenie z Lagrange'a
Problem optymalizacji z ograniczeniami, taki jak ten podany powyżej, zwykle sugeruje w szczególności wyrażenie Lagrange'a
gdzie porównuje się z Lagrange'a w statycznym problemie optymalizacji, ale powyżej, jest funkcją czasu Aby wyeliminować , ostatni wyraz po prawej stronie można przepisać za pomocą całkowania przez części , tak że
które można z powrotem wstawić do wyrażenia Lagrange'a, aby dać
Aby wyprowadzić warunki pierwszego rzędu dla optimum, załóżmy, że rozwiązanie zostało znalezione, a Lagrangian jest zmaksymalizowany. Wtedy każde _ W szczególności, pochodna jest
Aby to wyrażenie było równe zeru, konieczne są następujące warunki optymalności:
Jeśli zarówno wartość początkowa, i wartość końcowa są ustalone, tj. , brak warunków na i są potrzebne to często bywa, dodatkowy warunek dla uzyskania optymalności Ten ostatni jest nazywany warunkiem poprzeczności dla problemu ustalonego horyzontu.
Można zauważyć, że warunki konieczne są identyczne z podanymi powyżej dla hamiltonianu. Tak więc hamiltonian można rozumieć jako urządzenie do generowania warunków koniecznych pierwszego rzędu.
Hamiltonian w czasie dyskretnym
Gdy problem jest sformułowany w czasie dyskretnym, hamiltonian definiuje się jako:
a równania kosztu są
(Zauważ, że hamiltonian czasu dyskretnego w czasie obejmuje zmienną kosztową w czasie niezbędny, abyśmy różniczkując względem otrzymujemy termin obejmujący po prawej stronie równań stanu. Użycie tutaj niewłaściwej konwencji może prowadzić do błędnych wyników, tj. równania kosztowego, które nie jest równaniem różnicy wstecznej).
Zachowanie się hamiltonianu w czasie
Z zasady maksimum Pontriagina można wyprowadzić specjalne warunki dla hamiltonianu. Kiedy ostateczny czas ustalony, a hamiltonian nie zależy wyraźnie od czasu , a następnie:
lub jeśli czas terminala jest wolny, to:
Ponadto, jeśli czas końcowy dąży do nieskończoności , obowiązuje warunek transwersalności hamiltonianu.
Hamiltonian kontroli w porównaniu z hamiltonianem mechaniki
William Rowan Hamilton zdefiniował hamiltonian do opisu mechaniki systemu. Jest to funkcja trzech zmiennych:
gdzie którego ekstremalizacja określa dynamikę ( zdefiniowanego powyżej), jest zmienną stanu i q \ jest jego pochodną po czasie.
to tak zwany „ pęd sprzężony ”, określony przez
Hamilton następnie sformułował swoje równania, aby opisać dynamikę systemu jako
Hamiltonian teorii sterowania opisuje nie dynamikę systemu, ale warunki ekstremalizacji jakiejś jego funkcji skalarnej (Lagrange'a) w odniesieniu do . Zgodnie z normalną definicją jest to funkcja 4 zmiennych
gdzie jest zmienną stanu i co ekstremalizujemy.
Powiązane warunki dla maksimum to
Definicja ta zgadza się z definicją podaną w artykule Sussmanna i Willemsa. (patrz str. 39, równanie 14). Sussmann i Willems pokazują, jak hamiltonian kontrolny może być użyty w dynamice, np. dla problemu brachistochrony , ale nie wspominają o wcześniejszej pracy Carathéodory'ego nad tym podejściem.
Wartość bieżąca i wartość bieżąca Hamiltonian
W ekonomii funkcja celu w problemach optymalizacji dynamicznej często zależy bezpośrednio od czasu tylko poprzez dyskontowanie wykładnicze , tak że przyjmuje postać
gdzie ) } } . Pozwala to na przedefiniowanie hamiltonianu jako Gdzie
H. zdefiniowane w pierwszej sekcji. Przede wszystkim zmienne kosztowe są ponownie definiowane jako prowadzi do zmodyfikowanych warunków pierwszego rzędu.
-
,
co wynika bezpośrednio z reguły iloczynu . Z ekonomicznego punktu widzenia aktualne ceny ukryte dla dóbr kapitałowych }
Przykład: model Ramseya – Cass – Koopmansa
W ekonomii model Ramseya -Cassa-Koopmansa służy do określenia optymalnego zachowania oszczędnościowego dla gospodarki. Funkcja opieki , _
maksymalizować poprzez wybór optymalnej ścieżki konsumpcji . Funkcja reprezentatywnego agenta _ _ _ _ Czynnik dyskontowanie mi - . Problem maksymalizacji podlega następującemu równaniu różniczkowemu dla kapitałochłonności , opisującemu ewolucję kapitału na efektywnego pracownika w czasie:
gdzie do to okres t konsumpcji, to okres t kapitału na pracownika (z ), to okres t produkcji, to tempo wzrostu populacji, to stopa amortyzacji kapitału, agent dyskontuje przyszłą użyteczność według stawki , gdzie i .
Tutaj zgodnie z powyższym równaniem, zmienną Hamiltonian staje się
Warunki optymalności są
oprócz warunku poprzeczności . Jeśli pozwolimy , to różnicowanie logarytmiczne pierwszego warunku optymalności w odniesieniu do plonów
Wstawienie tego równania do drugiego warunku optymalności daje wyniki
która jest znana jako reguła Keynesa-Ramseya , która określa warunek konsumpcji w każdym okresie, który, jeśli jest przestrzegany, zapewnia maksymalną użyteczność w całym okresie życia.
Dalsza lektura