Hamiltonian (teoria sterowania)

Hamiltonian jest funkcją używaną do rozwiązania problemu optymalnego sterowania układem dynamicznym . Można to rozumieć jako chwilowy przyrost Lagrange'a wyrażenia problemu, który ma być optymalizowany w określonym przedziale czasu. Zainspirowany, ale różniący się od hamiltonianu mechaniki klasycznej , hamiltonian teorii sterowania optymalnego został opracowany przez Lwa Pontryagina jako część jego zasady maksimum . Pontryagin udowodnił, że warunkiem koniecznym rozwiązania problemu sterowania optymalnego jest taki dobór sterowania, aby optymalizować hamiltonian.

Sformułowanie problemu i definicja hamiltonianu

Rozważ układ równań pierwszego rzędu

gdzie a wektor zmiennych sterujących. Po spełnieniu warunków początkowych i steruje są podane rozwiązania równań różniczkowych, zwane a , można znaleźć. Problem optymalnej kontroli polega na wybraniu R ) tak, że maksymalizuje lub minimalizuje pewien celu między czasem początkowym czasem końcowym ( gdzie być nieskończonością ). celem w każdym momencie,

podlega powyższym równaniom ruchu zmiennych stanu. Metoda rozwiązania polega na zdefiniowaniu funkcji pomocniczej znanej jako hamiltonian kontrolny

który łączy funkcję celu i równania stanu podobnie jak Lagrange'a w statycznym problemie optymalizacji, tyle że mnożniki określane zmienne funkcjami czas, a nie stałe.

znalezienie optymalnej funkcji polityki sterowania, nią optymalnej trajektorii , które zgodnie z zasadą maksimum Pontryagina są argumentami maksymalizującymi hamiltonian,

u

Warunki konieczne pierwszego rzędu dla maksimum są podane przez

maksimum,
generuje funkcję przejścia stanu ,
generuje

z których te ostatnie są określane jako równania stanu . Razem równania stanu i kosztu opisują hamiltonowski układ dynamiczny (ponownie analogiczny, ale różny od układu hamiltonowskiego w fizyce), którego rozwiązanie obejmuje dwupunktowy problem wartości brzegowych , biorąc pod uwagę, że istnieje początkowy ( różniczkowe dla zmiennych stanu) i czas końcowy ( równania różniczkowe dla zmiennych kosztowych; chyba że określona jest funkcja końcowa, warunki brzegowe to lub dla nieskończonych horyzontów czasowych).

Warunkiem wystarczającym na maksimum jest wklęsłość hamiltonianu ocenianego w rozwiązaniu, tj

gdzie jest optymalną kontrolą i daje optymalną trajektorię dla zmiennej stanu. Alternatywnie, przez wynik uzyskany przez Olviego L. Mangasariana , warunki konieczne są wystarczające, jeśli funkcje fa wklęsłe w i .

Wyprowadzenie z Lagrange'a

Problem optymalizacji z ograniczeniami, taki jak ten podany powyżej, zwykle sugeruje w szczególności wyrażenie Lagrange'a

gdzie porównuje się z Lagrange'a w statycznym problemie optymalizacji, ale powyżej, jest funkcją czasu Aby wyeliminować , ostatni wyraz po prawej stronie można przepisać za pomocą całkowania przez części , tak że

które można z powrotem wstawić do wyrażenia Lagrange'a, aby dać

Aby wyprowadzić warunki pierwszego rzędu dla optimum, załóżmy, że rozwiązanie zostało znalezione, a Lagrangian jest zmaksymalizowany. Wtedy każde _ W szczególności, pochodna jest

Aby to wyrażenie było równe zeru, konieczne są następujące warunki optymalności:

Jeśli zarówno wartość początkowa, i wartość końcowa są ustalone, tj. , brak warunków na i są potrzebne to często bywa, dodatkowy warunek dla uzyskania optymalności Ten ostatni jest nazywany warunkiem poprzeczności dla problemu ustalonego horyzontu.

Można zauważyć, że warunki konieczne są identyczne z podanymi powyżej dla hamiltonianu. Tak więc hamiltonian można rozumieć jako urządzenie do generowania warunków koniecznych pierwszego rzędu.

Hamiltonian w czasie dyskretnym

Gdy problem jest sformułowany w czasie dyskretnym, hamiltonian definiuje się jako:

a równania kosztu

(Zauważ, że hamiltonian czasu dyskretnego w czasie obejmuje zmienną kosztową w czasie niezbędny, abyśmy różniczkując względem otrzymujemy termin obejmujący po prawej stronie równań stanu. Użycie tutaj niewłaściwej konwencji może prowadzić do błędnych wyników, tj. równania kosztowego, które nie jest równaniem różnicy wstecznej).

Zachowanie się hamiltonianu w czasie

Z zasady maksimum Pontriagina można wyprowadzić specjalne warunki dla hamiltonianu. Kiedy ostateczny czas ustalony, a hamiltonian nie zależy wyraźnie od czasu , a następnie:

lub jeśli czas terminala jest wolny, to:

Ponadto, jeśli czas końcowy dąży do nieskończoności , obowiązuje warunek transwersalności hamiltonianu.

Hamiltonian kontroli w porównaniu z hamiltonianem mechaniki

William Rowan Hamilton zdefiniował hamiltonian do opisu mechaniki systemu. Jest to funkcja trzech zmiennych:

gdzie którego ekstremalizacja określa dynamikę ( zdefiniowanego powyżej), jest zmienną stanu i q \ jest jego pochodną po czasie.

to tak zwany „ pęd sprzężony ”, określony przez

Hamilton następnie sformułował swoje równania, aby opisać dynamikę systemu jako

Hamiltonian teorii sterowania opisuje nie dynamikę systemu, ale warunki ekstremalizacji jakiejś jego funkcji skalarnej (Lagrange'a) w odniesieniu do . Zgodnie z normalną definicją jest to funkcja 4 zmiennych

gdzie jest zmienną stanu i co ekstremalizujemy.

Powiązane warunki dla maksimum to

Definicja ta zgadza się z definicją podaną w artykule Sussmanna i Willemsa. (patrz str. 39, równanie 14). Sussmann i Willems pokazują, jak hamiltonian kontrolny może być użyty w dynamice, np. dla problemu brachistochrony , ale nie wspominają o wcześniejszej pracy Carathéodory'ego nad tym podejściem.

Wartość bieżąca i wartość bieżąca Hamiltonian

W ekonomii funkcja celu w problemach optymalizacji dynamicznej często zależy bezpośrednio od czasu tylko poprzez dyskontowanie wykładnicze , tak że przyjmuje postać

gdzie ) } } . Pozwala to na przedefiniowanie hamiltonianu jako Gdzie

H. zdefiniowane w pierwszej sekcji. Przede wszystkim zmienne kosztowe są ponownie definiowane jako prowadzi do zmodyfikowanych warunków pierwszego rzędu.

,

co wynika bezpośrednio z reguły iloczynu . Z ekonomicznego punktu widzenia aktualne ceny ukryte dla dóbr kapitałowych }

Przykład: model Ramseya – Cass – Koopmansa

W ekonomii model Ramseya -Cassa-Koopmansa służy do określenia optymalnego zachowania oszczędnościowego dla gospodarki. Funkcja opieki , _

maksymalizować poprzez wybór optymalnej ścieżki konsumpcji . Funkcja reprezentatywnego agenta _ _ _ _ Czynnik dyskontowanie mi - . Problem maksymalizacji podlega następującemu równaniu różniczkowemu dla kapitałochłonności , opisującemu ewolucję kapitału na efektywnego pracownika w czasie:

gdzie do to okres t konsumpcji, to okres t kapitału na pracownika (z ), to okres t produkcji, to tempo wzrostu populacji, to stopa amortyzacji kapitału, agent dyskontuje przyszłą użyteczność według stawki , gdzie i .

Tutaj zgodnie z powyższym równaniem, zmienną Hamiltonian staje się

Warunki optymalności są

oprócz warunku poprzeczności . Jeśli pozwolimy , to różnicowanie logarytmiczne pierwszego warunku optymalności w odniesieniu do plonów

Wstawienie tego równania do drugiego warunku optymalności daje wyniki

która jest znana jako reguła Keynesa-Ramseya , która określa warunek konsumpcji w każdym okresie, który, jeśli jest przestrzegany, zapewnia maksymalną użyteczność w całym okresie życia.

Dalsza lektura