Algebraiczne równanie Riccatiego

Algebraiczne równanie Riccatiego jest rodzajem równania nieliniowego, które powstaje w kontekście problemów optymalnego sterowania nieskończonego horyzontu w czasie ciągłym lub dyskretnym .

Typowe równanie algebraiczne Riccatiego jest podobne do jednego z poniższych:

algebraiczne równanie Riccatiego w czasie ciągłym (CARE):

{\ Displaystyle A ^ {T} P + PA-PBR ^ {- 1} B ^ {T} P + Q = 0 \,}

lub algebraiczne równanie Riccatiego w czasie dyskretnym (DARE):

{\ Displaystyle P = A ^ {T} PA- (A ^ {T} PB) (R + B ^ {T} PB) ^ {- 1} (B ^ {T} PA) + Q. \,}

P jest nieznaną macierzą symetryczną n na n , a A , B , Q , R są znanymi macierzami współczynników rzeczywistych .

Chociaż generalnie to równanie może mieć wiele rozwiązań, zwykle określa się, że chcemy otrzymać jedyne rozwiązanie stabilizujące, jeśli takie rozwiązanie istnieje.

Pochodzenie nazwy

Równania te otrzymały nazwę Riccati ze względu na ich związek z równaniem różniczkowym Riccatiego . Rzeczywiście, CARE jest weryfikowane przez niezmienne w czasie rozwiązania powiązanego równania różniczkowego Riccatiego o wartościach macierzowych. Jeśli chodzi o DARE, jest ona weryfikowana przez niezmienne w czasie rozwiązania macierzowego równania różniczkowego Riccatiego (będącego analogiem równania różniczkowego Riccatiego w kontekście czasu dyskretnego LQR).

Kontekst algebraicznego równania Riccatiego w czasie dyskretnym

sterowania optymalnego o nieskończonym horyzoncie zależy nam na wartości jakiejś zmiennej będącej przedmiotem zainteresowania arbitralnie w odległej przyszłości i należy optymalnie wybrać wartość zmiennej sterowanej już teraz, wiedząc, że zawsze będziemy zachowywać się optymalnie w przyszły. Optymalne aktualne wartości zmiennych kontrolnych problemu w dowolnym momencie można znaleźć za pomocą rozwiązania równania Riccatiego i bieżących obserwacji ewoluujących zmiennych stanu. W przypadku wielu zmiennych stanu i wielu zmiennych kontrolnych równanie Riccatiego będzie macierzowym .

Algebraiczne równanie Riccatiego określa rozwiązanie problemu regulatora liniowego-kwadratowego (LQR) o nieskończonym horyzoncie i niezmiennego w czasie problemu liniowego-kwadratowo-gaussowskiego (LQG) o nieskończonym horyzoncie. Są to dwa najbardziej fundamentalne problemy w teorii sterowania .

Typową specyfikacją problemu liniowego sterowania kwadratowego w czasie dyskretnym jest minimalizacja

{\ Displaystyle \ suma _ {t = 1} ^ {T} (y_ {t} ^ {T} Qy_ {t} + u_ {t}^{T}Ru_{t})}

podlega równaniu stanu

{\ Displaystyle y_ {t} = Ay_ {t-1} + Bu_ {t-1},}

gdzie y jest wektorem zmiennych stanu n × 1, u jest wektorem zmiennych sterujących k × 1, A jest macierzą przejścia stanu n × n , B jest macierzą n × k mnożników kontrolnych, Q ( n × n ) jest symetryczną dodatnią macierzą kosztów stanu półokreślonego , a R ( k × k ) jest symetryczną dodatnią macierzą kosztów kontroli określonej.

Indukcję wsteczną w czasie można wykorzystać do uzyskania za każdym razem optymalnego rozwiązania kontrolnego,

{\ Displaystyle u_ {t} ^ {*} = - (B ^ {T} P_ {t }B+R)^{-1}(B^{T}P_{t}A)y_{t-1},}

z symetryczną dodatnią określoną macierzą kosztu wykonania P ewoluującą wstecz w czasie od ${\ Displaystyle P_ {T} = Q}$

{\ Displaystyle P_ {t-1} = Q + A ^ { T}P_{t}AA^{T}P_{t}B(B^{T}P_{t}B+R)^{-1}B^{T}P_{t}A,\,}

które jest znane jako dynamiczne równanie Riccatiego w czasie dyskretnym tego problemu. Charakterystykę stanu stacjonarnego P , istotną dla problemu nieskończonego horyzontu, w którym T dąży do nieskończoności, można znaleźć, powtarzając wielokrotnie równanie dynamiczne, aż do zbieżności; wówczas P charakteryzuje się usunięciem indeksów dolnych czasu z równania dynamicznego.

Rozwiązanie

Zwykle rozwiązujący próbują znaleźć unikalne rozwiązanie stabilizujące, jeśli takie rozwiązanie istnieje. Rozwiązanie jest stabilizujące, jeśli użycie go do sterowania powiązanym systemem LQR powoduje, że system zamkniętej pętli jest stabilny.

Dla CARE kontrola jest

{\ Displaystyle K = R ^ {- 1} B ^ {T} P}

a macierz transferu stanu w pętli zamkniętej to

{\ Displaystyle A-BK = A-BR ^ {- 1} B ^ {T} P}

który jest stabilny wtedy i tylko wtedy, gdy wszystkie jego wartości własne mają ściśle ujemną część rzeczywistą.

Dla DARE kontrola jest

{\ Displaystyle K = (R + B ^ {T} PB) ^ {- 1} B ^ {T} PA}

a macierz transferu stanu w pętli zamkniętej to

{\ Displaystyle A-BK = AB (R + B ^ {T} PB) ^ {- 1} B ^ {T} ROCZNIE}

który jest stabilny wtedy i tylko wtedy, gdy wszystkie jego wartości własne mieszczą się ściśle w okręgu jednostkowym płaszczyzny zespolonej.

Rozwiązanie algebraicznego równania Riccatiego można uzyskać przez faktoryzację macierzy lub iterację równania Riccatiego. Jeden typ iteracji można uzyskać w przypadku czasu dyskretnego za pomocą dynamicznego równania Riccatiego, które pojawia się w problemie skończonego horyzontu: w tym drugim typie problemu każda iteracja wartości macierzy jest istotna dla optymalnego wyboru w każdym okresie, który jest skończoną odległością w czasie od końcowego okresu, a jeśli jest iterowana nieskończenie daleko wstecz w czasie, zbiega się do określonej macierzy, która jest istotna dla optymalnego wyboru nieskończonej długości czasu przed końcowym okresem - to znaczy, kiedy istnieje nieskończony horyzont.

Możliwe jest również znalezienie rozwiązania poprzez znalezienie rozkładu własnego większego systemu. Dla CARE definiujemy macierz Hamiltona

{\ Displaystyle Z = {\ rozpocząć {pmatrix} A&-BR ^ {- 1} B ^ {T} \\ - Q& -A ^ {T }\end{pmacierz}}}

Ponieważ $hamiltonianem$ , jeśli nie ma żadnych wartości własnych na osi urojonej, to dokładnie połowa jego wartości własnych ma ujemną część rzeczywistą. Jeśli oznaczymy $,$ której kolumny tworzą podstawę odpowiedniej podprzestrzeni, w notacji blokowo

{\ Displaystyle {\ rozpocząć {pmatrix} U_ {1,1} \\ U_ {2,1} \ koniec {pmatrix}}}

Następnie

{\ Displaystyle P = U_ {2,1} U_ {1,1} ^ {- 1}}

jest rozwiązaniem równania Riccatiego; $własne$ wartości $_$ _ _

W przypadku DARE, gdy $odwracalna$ , definiujemy macierz symplektyczną

{\ Displaystyle Z ={\begin{pmatrix}A+BR^{-1}B^{T}(A^{-1})^{T}Q&-BR^{-1}B^{T}(A^{- 1})^{T}\\-(A^{-1})^{T}P&(A^{-1})^{T}\end{pmacierz}}}

Ponieważ $symplektyczny$ , jeśli nie ma żadnych wartości własnych na okręgu jednostkowym, to dokładnie połowa jego wartości własnych znajduje się wewnątrz okręgu jednostkowego. Jeśli oznaczymy $,$ której kolumny tworzą podstawę odpowiedniej podprzestrzeni, w notacji blokowo

{\ Displaystyle {\ rozpocząć {pmatrix} U_ {1,1} \\ U_ {2,1} \ koniec {pmatrix}}}

gdzie ${\ Displaystyle U_ {1,1}}$ i ${\ Displaystyle U_ {2,1}}$ wynikają z rozkładu

{\ Displaystyle Z = {\ rozpocząć {pmatrix} U_ {1,1} i U_ {1,2} \\ U_ {2,1} i U_ {2,2} \ koniec {pmatrix}} { \begin{pmatrix}\Lambda _{1,1}&\Lambda _{1,2}\\0&\Lambda _{2,2}\end{pmatrix}}{\begin{pmatrix}U_{1,1 }^{T}&U_{2,1}^{T}\\U_{1,2}^{T}&U_{2,2}^{T}\end{pmacierz}}}

Następnie

{\ Displaystyle P = U_ {2,1} U_ {1,1} ^ {- 1}}

jest rozwiązaniem równania Riccatiego; ponadto wartości własne są ${\ Displaystyle AB (R + B ^ {T} PB) ^ {- 1} B ^ {T} PA}$ $,$ własne które znajdują się wewnątrz okręgu jednostkowego.

Zobacz też

Petera Lancastera; Leiba Rodman (1995), Algebraiczne równania Riccatiego , Oxford University Press , s. 504, ISBN 0-19-853795-6
Alan J. Laub, Metoda Schura do rozwiązywania algebraicznych równań Riccatiego

Linki zewnętrzne