Optymalizacja Lapunowa

Ten artykuł opisuje optymalizację Lapunowa dla układów dynamicznych . Podaje przykład zastosowania do optymalnego sterowania w sieciach kolejkowych .

Wstęp

Optymalizacja Lapunowa odnosi się do wykorzystania funkcji Lapunowa do optymalnego sterowania systemem dynamicznym. Funkcje Lapunowa są szeroko stosowane w teorii sterowania w celu zapewnienia różnych form stabilności systemu. Stan systemu w określonym czasie jest często opisywany za pomocą wektora wielowymiarowego. Funkcja Lapunowa jest nieujemną skalarną miarą tego wielowymiarowego stanu. Zazwyczaj funkcja jest zdefiniowana tak, aby rosła, gdy system zbliża się do niepożądanych stanów. Stabilność systemu osiąga się poprzez podjęcie działań kontrolnych, które powodują, że funkcja Lapunowa dryfuje w kierunku ujemnym w kierunku zera.

Dryf Lapunowa ma kluczowe znaczenie dla badania optymalnej kontroli w sieciach kolejkowych. Typowym celem jest ustabilizowanie wszystkich kolejek sieciowych przy jednoczesnej optymalizacji niektórych celów dotyczących wydajności, takich jak minimalizacja średniego zużycia energii lub maksymalizacja średniej przepustowości. Minimalizowanie dryftu kwadratowej funkcji Lapunowa prowadzi do routingu przeciwciśnienia dla stabilności sieci, zwanego również algorytmem maksymalnej wagi . Dodanie ważonego terminu kary do dryfu Lapunowa i zminimalizowanie sumy prowadzi do algorytmu dryfu plus kary dla stabilności wspólnej sieci i minimalizacji kar. Procedurę dryf plus kara można również wykorzystać do obliczania rozwiązań programów wypukłych i programów liniowych .

Dryf Lapunowa dla sieci kolejkowych

Rozważmy sieć kolejkową, która ewoluuje w czasie dyskretnym ze znormalizowanymi szczelinami czasowymi są i zdefiniuj wektor zaległości w kolejce w czasie przez :

Kwadratowe funkcje Lapunowa

Dla każdego gniazda określ:

Ta funkcja jest skalarną miarą całkowitego zaległości w kolejce w sieci. Nazywa się to kwadratową funkcją Lapunowa w stanie kolejki. Zdefiniuj dryf Lapunowa jako zmianę tej funkcji z jednego gniazda do drugiego:

Ograniczenie dryfu Lapunowa

Załóżmy, że zaległości w kolejce zmieniają się w czasie zgodnie z następującym równaniem:

gdzie i to odpowiednio przyloty i możliwości serwisowe w kolejce za na gnieździe To równanie może być użyte do obliczenia granicy dryfu Lapunowa dla dowolnej szczeliny t:

Przekształcenie tej nierówności, zsumowanie wszystkich podzielenie przez 2 prowadzi do: ja ,

Gdzie:

są ograniczone, tak że istnieje skończona stała , że ​​dla wszystkich i wszystkich możliwych wektorów kolejki the following property holds:

Przyjęcie warunkowych oczekiwań (Równanie 1) prowadzi do następującej granicy warunkowego oczekiwanego dryfu Lapunowa :

Podstawowe twierdzenie o dryfie Lapunowa

W wielu przypadkach sieć można kontrolować tak, aby różnica między przyjazdami a obsługą w każdej kolejce spełniała następującą właściwość dla pewnej liczby rzeczywistej: :

powyższe odnosi się do tego samego epsilon i wektorów ( 2) sprowadza się do warunku dryfu użytego w następującym twierdzeniu Lapunowa o dryfie. Poniższe twierdzenie można postrzegać jako wariację na temat twierdzenia Fostera dla łańcuchów Markowa . Jednak nie wymaga struktury łańcucha Markowa.

Twierdzenie (dryf Lapunowa). Załóżmy, że istnieją stałe takie, że dla wszystkich możliwych wektorów warunkowy the conditional Lyapunov drift satisfies:
dla wszystkie gniazda średni czasowy rozmiar kolejki w sieci spełnia:

Dowód. Biorąc oczekiwania po obu stronach nierówności dryfu i stosując prawo iterowanych oczekiwań, otrzymujemy:

powyższe _

faktu, że przestawienie terminów w powyższym wyrażeniu dowodzi wyniku

Optymalizacja Lapunowa dla sieci kolejkowych

Rozważ tę samą sieć kolejkowania, co w powyższej sekcji. Teraz sieciową w gnieździe Załóżmy, że celem jest ustabilizowanie sieci kolejek przy jednoczesnej minimalizacji średniej czasowej Na przykład, aby ustabilizować sieć przy jednoczesnym zminimalizowaniu średniej mocy w czasie, można zdefiniować jako całkowitą moc pobieraną przez sieć w szczelinie t. maksymalizacji średniej czasu pewnej , zdefiniować Jest to przydatne do maksymalizacji sieci w całym narzędziu, z zastrzeżeniem stabilności.

Aby ustabilizować sieć, jednocześnie minimalizując średni czas kary które zachłannie minimalizują ograniczenie następującego dryf plus kara na każde gniazdo :

gdzie jest zakresie wydajności. Kluczową cechą tego podejścia jest to, że zwykle nie wymaga ono znajomości prawdopodobieństwa losowych zdarzeń sieciowych (takich jak losowe nadejście zadania lub realizacja kanału). Wybór ogranicza się do minimalizacji ograniczenia dryfu w każdym gnieździe, aw przypadku trasowania w sieciach kolejek z wieloma przeskokami ogranicza się do algorytmu przez Tassiulasa i Ephremidesa. Używając zdefiniowanie energii przez sieć na gnieździe do algorytmu plus kara minimalizacji średniej mocy zależnej od stabilność opracowana przez Neely'ego. Używając i używając jako ujemna metryka użyteczności kontroli wstępu prowadzi do algorytmu dryfu plus kary dla wspólnej kontroli przepływu i trasowania sieci, opracowanego przez Neely'ego, Modiano i Li.

W tym kontekście ważne jest uogólnienie twierdzenia o dryfie Lapunowa z poprzedniej sekcji. Dla uproszczenia prezentacji załóżmy, że jest ograniczony od dołu: p ( t ) {\ displaystyle p (t)}

spełnione kara zawsze nieujemna Niech czasu Niech być parametrem używanym do ważenia ważności osiągnięcia celu. Poniższe twierdzenie pokazuje, że jeśli spełniony jest warunek dryfu plus kara, wówczas średnia kara czasowa jest co najwyżej O(1/V) powyżej pożądanego celu, podczas gdy średni rozmiar kolejki wynosi O(V). Parametr można dostroić, aby średnia kara czasowa była tak blisko (lub poniżej) celu, jak to pożądane, z odpowiednim kompromisem w zakresie wielkości

Twierdzenie (optymalizacja Lapunowa). że istnieją stałe takie , że dla wszystkich
wszystkie możliwe wektory plus kara
t the time average penalty and time average queue sizes satisfy:

Dowód. Biorąc pod uwagę oczekiwania obu stron zakładanego dryfu plus kara i korzystając z prawa iterowanych oczekiwań mamy:

Zsumowanie powyższego w pierwszych szczelinach i użycie prawa sum teleskopowych daje:

przez i terminów dowodzi średniej kary w czasie Podobny argument dowodzi, że średni rozmiar kolejki jest ograniczony w czasie.

Powiązane linki

Podstawowe źródła

  • MJ Neely. Stochastic Network Optimization with Application to Communication and Queuing Systems , Morgan & Claypool, 2010.