Optymalizacja sumy kwadratów
Program optymalizacji sumy kwadratów to problem optymalizacyjny z liniową funkcją kosztu i szczególnym rodzajem ograniczeń na zmienne decyzyjne. Więzy te mają taką postać, że gdy zmienne decyzyjne są używane jako współczynniki w pewnych wielomianach , wielomiany te powinny mieć właściwość wielomianu SOS . Podczas ustalania maksymalnego stopnia zaangażowanych wielomianów optymalizacja sumy kwadratów jest również znana jako hierarchia relaksacji Lasserre'a w programowaniu półokreślonym .
Techniki optymalizacji sumy kwadratów zostały zastosowane w różnych dziedzinach, w tym w teorii sterowania (w szczególności do poszukiwania wielomianowych funkcji Lapunowa dla układów dynamicznych opisanych wielomianowymi polami wektorowymi), statystyce, finansach i uczeniu maszynowym.
Kwestia optymalizacji
Problem można wyrazić jako
Tutaj „SOS” reprezentuje klasę wielomianów sumy kwadratów (SOS). Wektor wielomiany część dane do problemu optymalizacyjnego. Ilości są zmiennymi decyzyjnymi Programy SOS można konwertować na programy półokreślone (SDP) przy użyciu dualności programu wielomianu SOS i relaksacji dla optymalizacji wielomianu z ograniczeniami przy użyciu dodatnich i półskończonych macierzy , patrz następna sekcja.
Podwójny problem: ograniczona optymalizacja wielomianowa
Załóżmy, że mamy -zmienny wielomian i załóżmy, że n {\ displaystyle n że chcielibyśmy zminimalizować ten wielomian w podzbiorze . Załóżmy ponadto, że ograniczenia na podzbiorze zakodować za pomocą wielomianowe równości stopnia co najwyżej , każda z postaci gdzie jest wielomianem stopnia co najwyżej . Naturalny, choć ogólnie niewypukły program dla tego problemu optymalizacji jest następujący:
|
|
() |
Ten program jest generalnie niewypukły, ponieważ ograniczenia ( 1 ) nie są wypukłe. Jedna z możliwych relaksacji wypukłych dla tego problemu minimalizacji wykorzystuje programowanie półokreślone w celu zastąpienia macierzy zmiennych pierwszego rzędu półskończoną indeksujemy każdy jednomian rozmiaru co najwyżej multiset co najwyżej indeksów , . Dla każdego takiego jednomianu tworzymy w programie zmienną układamy zmienne tak, aby tworzyły macierz gdzie i kolumny są identyfikowane z multisetami elementów o rozmiarze co najwyżej . Następnie piszemy następujący półokreślony program w zmiennych: :
gdzie ponownie macierzą współczynników wielomianu , który chcemy zminimalizować, a współczynników do wielomianu za kodujący ograniczenie podzbioru .
Trzecie ograniczenie zapewnia, że wartość jednomianu, który pojawia się kilka razy w macierzy, jest równa w całej macierzy i jest dodawane, aby respektować symetrie występujące w postaci kwadratowej .
Dwoistość
Można wziąć podwójność powyższego półokreślonego programu i otrzymać następujący program:
Mamy zmienną ograniczeniu gdzie to macierz ze wszystkimi wpisami zerowymi z wyjątkiem wpisu indeksowanego przez ), zmienną rzeczywistą dla każdego ograniczenia wielomianowego i dla każdej grupy multisetów , mamy podwójną zmienną ograniczenia symetrii . Ograniczenie dodatniej półskończoności zapewnia, że sumą kwadratów wielomianów nad przez charakterystykę dodatnio-półokreślonych macierzy dla półokreślonej napisz dla wektorów . Zatem dla dowolnego }
gdzie zidentyfikowaliśmy wektory stopnia najwyżej . . Daje to dowód sumy kwadratów, że wartość nad .
Powyższe można również rozszerzyć na .
Hierarchia sumy kwadratów
Hierarchia sumy kwadratów (hierarchia SOS), znana również jako hierarchia Lasserre'a, jest hierarchią wypukłych relaksacji o rosnącej mocy i rosnących kosztach obliczeniowych. Dla każdej liczby naturalnej odpowiednia jest znana SOS runda Runda , kiedy odpowiada podstawowemu półokreślonemu lub optymalizacji sumy kwadratów na wielomianach stopnia co . Aby rozszerzyć podstawowy program wypukły na poziomie hierarchii do aby program uwzględniał wielomiany stopnia co najwyżej .
Hierarchia SOS wywodzi swoją nazwę od faktu, że wartość funkcji celu na jest ograniczona dowodem sumy kwadratów przy użyciu wielomianów stopnia co najwyżej przez podwójne (patrz „Dwoistość” powyżej). W konsekwencji każdy dowód sumy kwadratów, który wykorzystuje wielomiany stopnia co najwyżej, do ograniczenia wartości obiektywnej, pozwalając udowodnić gwarancje ścisłości relaksacji.
W połączeniu z twierdzeniem Berga oznacza to dalej, że przy wystarczającej liczbie rund relaksacja staje się dowolnie ciasna w dowolnym ustalonym przedziale. Wynik Berga stwierdza, że każdy nieujemny wielomian rzeczywisty w ograniczonym przedziale można przybliżyć z dokładnością przedziale za pomocą sumy kwadratów rzeczywistych wielomianów o wystarczająco wysokim stopniu, a zatem jeśli jest wielomianową wartością celu jako funkcją punktu , jeśli nierówność dla wszystkich obszarze zainteresowania, to musi istnieć dowód sumy kwadratów tego faktu. Wybierając funkcji celu w możliwym obszarze, mamy wynik
Koszt obliczeniowy
Podczas optymalizowania funkcji w poziom można zapisać jako półokreślony program na zmiennych i można je metodą
Tło sumy kwadratów
wielomian jest sumą kwadratów ( SOS , jeśli istnieją wielomiany takie, że . Na przykład,
Formy można _ _ Podobnie wielomiany stopnia ≤ 2 d można wyrazić jako
Narzędzia programowe
- SOSTOOLS , na licencji GNU GPL . Przewodnik referencyjny jest dostępny pod adresem arXiv:1310.4716 [math.OC] , a prezentacja dotycząca jego elementów wewnętrznych jest dostępna tutaj .
- CDCS-sos , pakiet z CDCS , rozszerzony solwer metody Lagrange'a , do obsługi programów SOS na dużą skalę.
- Rozszerzenie SumOfSquares JuMP dla Julii .
- TSSOS dla Julii, narzędzie do optymalizacji wielomianów oparte na hierarchiach momentu-SOS dostosowanych do rzadkości.
- Dla podwójnego problemu optymalizacji wielomianowej z ograniczeniami, GloptiPoly dla MATLAB/Octave, Ncpol2sdpa dla Pythona i MomentOpt dla Julii.
-
^
Suma kwadratów: teoria i zastosowania: krótki kurs AMS, suma kwadratów: teoria i zastosowania, 14-15 stycznia 2019 r., Baltimore, Maryland . Parrilo, Pablo A.; Thomas, Rekha R. Providence, Rhode Island: Amerykańskie Towarzystwo Matematyczne. 2020. ISBN 978-1-4704-5025-0 . OCLC 1157604983 .
{{ cite book }}
: CS1 maint: other ( link ) - ^ Tan, W., Packard, A., 2004. „ Wyszukiwanie sterowania funkcjami Lapunowa za pomocą programowania sum kwadratów ”. W: Konf. Allertona w sprawie komunikacji, kontroli i informatyki . s. 210–219.
- ^ Tan, W., Topcu, U., Seiler, P., Balas, G., Packard, A., 2008. Osiągalność wspomagana symulacją i analiza wzmocnienia lokalnego dla nieliniowych systemów dynamicznych . W: Proc. Konferencji IEEE w sprawie decyzji i kontroli. s. 4097–4102.
- ^ A. Chakraborty, P. Seiler i G. Balas, „ Podatność kontrolerów lotu F / A-18 na tryb spadającego liścia: analiza nieliniowa ”, AIAA Journal of Guidance, Control and Dynamics, tom. 34 nie. 1 (2011), s. 73–85.
- ^ Berg, chrześcijanin (1987). Landau, Henry J. (red.). „Wielowymiarowy problem momentu i półgrupy” . Materiały z sympozjów z matematyki stosowanej . 37 : 110–124. doi : 10.1090/psapm/037/921086 . ISBN 9780821801147 .
- ^ Lasserre, J. (2007-01-01). „Aproksymacja sumy kwadratów nieujemnych wielomianów” . Przegląd SIAM . 49 (4): 651–669. arXiv : matematyka/0412398 . doi : 10.1137/070693709 . ISSN 0036-1445 .
- ^ Parrilo, P., (2000) Strukturalne programy półokreślone i metody geometrii semialgebraicznej w zakresie odporności i optymalizacji . doktorat praca magisterska, California Institute of Technology.
- ^ Parrilo, P. (2003) „ Relaksy programowania półokreślonego dla problemów półalgebraicznych ”. Programowanie matematyczne Ser. B 96 (2), 293–320.
- ^ Lasserre, J. (2001) „ Globalna optymalizacja z wielomianami i problem momentów ”. SIAM Journal on Optimization , 11 (3), 796{817.