Sztywne równanie

W matematyce sztywne równanie jest równaniem różniczkowym , dla którego pewne numeryczne metody rozwiązywania równania są numerycznie niestabilne , chyba że rozmiar kroku jest bardzo mały. Sformułowanie precyzyjnej definicji sztywności okazało się trudne, ale główną ideą jest to, że równanie zawiera pewne terminy, które mogą prowadzić do szybkich zmian w rozwiązaniu.

Podczas numerycznego całkowania równania różniczkowego można by oczekiwać, że wymagany rozmiar kroku będzie stosunkowo mały w obszarze, w którym krzywa rozwiązania wykazuje duże zróżnicowanie, i będzie stosunkowo duży, gdy krzywa rozwiązania wyprostuje się, zbliżając się do linii o nachyleniu bliskim zeru. W przypadku niektórych problemów tak nie jest. Aby metoda numeryczna dawała niezawodne rozwiązanie układu różniczkowego, czasami wymagana jest niedopuszczalnie mała wielkość kroku w obszarze, w którym krzywa rozwiązania jest bardzo gładka. Zjawisko to znane jest jako sztywność . W niektórych przypadkach mogą istnieć dwa różne problemy z tym samym rozwiązaniem, ale jeden nie jest sztywny, a drugi tak. Zjawisko to nie może zatem być właściwością dokładnego rozwiązania, ponieważ jest ono takie samo dla obu problemów i musi być właściwością samego systemu różniczkowego. Takie układy są więc znane jako układy sztywne .

Motywujący przykład

Jawne metody numeryczne wykazujące niestabilność podczas całkowania sztywnego równania różniczkowego zwyczajnego

Rozważ problem wartości początkowej

 

 

 

 

()

Dokładne rozwiązanie (pokazane na niebiesko) to

 

 

 

 

()

Poszukujemy rozwiązania numerycznego , które wykazuje takie samo zachowanie.

Rysunek (po prawej) ilustruje zagadnienia numeryczne dla różnych integratorów numerycznych zastosowanych w równaniu.

  1. Metoda Eulera z wielkości oscyluje z zakresu wykresu (pokazanego na czerwono)
  2. Metoda Eulera z połową rozmiaru kroku, daje rozwiązanie w granicach wykresu, ale oscyluje wokół zera (
  3. Metodę trapezoidalną (czyli dwuetapową metodę Adamsa-Moultona ) podaje wzór

     

     

     

     

    ()

    gdzie . Zastosowanie tej metody zamiast metody Eulera daje znacznie lepszy wynik (kolor niebieski). Wyniki liczbowe maleją monotonicznie do zera, tak jak robi to rozwiązanie dokładne.

Jednym z najbardziej znanych przykładów sztywnych równań różniczkowych zwyczajnych (ODE) jest układ opisujący reakcję chemiczną Robertsona:

 

 

 

 

()

w krótkim przedziale, na przykład, problemu z Jeśli jednak przedział jest bardzo duży (powiedzmy 10 11 ), wówczas wiele standardowych kodów nie potrafi go poprawnie zintegrować.

Dodatkowymi przykładami są zestawy ODE wynikające z integracji czasowej dużych mechanizmów reakcji chemicznych. Tutaj sztywność wynika ze współistnienia bardzo wolnych i bardzo szybkich reakcji. [ potrzebne źródło ] Aby je rozwiązać, można użyć pakietów oprogramowania KPP i Autochem .

Współczynnik sztywności

Rozważ liniowy stały współczynnik niejednorodny system

 

 

 

 

()

gdzie i jest stałą, diagonalizowalną, macierz z wartościami własnymi (przy założeniu, że różne) i odpowiadające im wektory własne . Ogólne rozwiązanie ( 5 ) ma postać

 

 

 

 

()

gdzie stałymi i szczególną Teraz załóżmy, że

 

 

 

 

()

co oznacza, że ​​każdy z terminów mi jako tak że rozwiązanie zbliża się asymptotycznie asymptotycznie jako ; termin rozpadnie się monotonicznie, jeśli jest rzeczywiste i sinusoidalne, jeśli jest złożony.

Interpretując (jak to często bywa w przypadku problemów fizycznych), { c} _ przejściowym i sol rozwiązanie państwowe . Jeśli jest duży, to odpowiedni termin szybko zanika wraz ze i dlatego jest nazywany szybkim stanem przejściowym ; jeśli mi się powolne przejściowe . Niech być określony przez

 

 

 

 

()

κ przejściowym . Teraz definiujemy współczynnik sztywności jako

 

 

 

 

()

Charakterystyka sztywności

W tej sekcji rozważymy różne aspekty zjawiska sztywności. „Zjawisko” jest prawdopodobnie bardziej odpowiednim słowem niż „właściwość”, ponieważ to drugie sugeruje raczej, że sztywność można zdefiniować za pomocą precyzyjnych terminów matematycznych; okazuje się, że nie jest możliwe zrobienie tego w zadowalający sposób, nawet dla ograniczonej klasy liniowych układów o stałych współczynnikach. Zobaczymy również kilka stwierdzeń jakościowych, które można (i przeważnie robiono) w celu ujęcia pojęcia sztywności i określimy, co jest prawdopodobnie najbardziej satysfakcjonujące z nich jako „definicja” sztywności.

JD Lambert definiuje sztywność w następujący sposób:

Jeżeli metoda numeryczna ze skończonym obszarem absolutnej stabilności , zastosowana do układu o dowolnych warunkach początkowych , jest zmuszona do zastosowania w pewnym przedziale całkowania zbyt małej długości kroku w stosunku do gładkości rozwiązania dokładnego w tym przedziale , to mówimy, że układ jest sztywny w tym przedziale.

Istnieją inne cechy, które są wykazywane przez wiele przykładów sztywnych problemów, ale dla każdego istnieją kontrprzykłady, więc te cechy nie stanowią dobrej definicji sztywności. Niemniej jednak definicje oparte na tych cechach są powszechnie stosowane przez niektórych autorów i stanowią dobrą wskazówkę co do obecności sztywności. Lambert nazywa je raczej „stwierdzeniami” niż definicjami z wyżej wymienionych powodów. Oto kilka z nich:

  1. Liniowy układ o stałych współczynnikach jest sztywny, jeśli wszystkie jego wartości własne mają ujemną część rzeczywistą, a współczynnik sztywności jest duży.
  2. Sztywność występuje, gdy długość kroku ograniczają wymagania dotyczące stabilności, a nie dokładności.
  3. Sztywność występuje, gdy niektóre składniki roztworu rozkładają się znacznie szybciej niż inne.

Etymologia

Pochodzenie terminu „sztywność” nie zostało jednoznacznie ustalone. Według Josepha Oaklanda Hirschfeldera termin „sztywny” jest używany, ponieważ takie układy odpowiadają ścisłemu sprzężeniu między sterownikiem a napędzanymi serwomechanizmami . Według Richarda. L. Burdena i J. Douglasa Fairesa,

Poważne trudności mogą wystąpić, gdy standardowe techniki numeryczne są stosowane do aproksymacji rozwiązania równania różniczkowego , gdy dokładne rozwiązanie zawiera wyrażenia w postaci mi λ jest liczbą zespoloną z ujemną częścią rzeczywistą.

. . .

Problemy związane z szybko rozpadającymi się roztworami przejściowymi występują naturalnie w wielu różnych zastosowaniach, w tym w badaniu systemów sprężyn i tłumienia, analizie systemów sterowania i problemach kinetyki chemicznej . To wszystko są przykłady klasy problemów zwanych sztywnymi (sztywność matematyczna) układami równań różniczkowych, ze względu na ich zastosowanie w analizie ruchu układów sprężystych i masowych o dużych stałych sprężystości ( sztywność fizyczna ) .

Na przykład problem wartości początkowej

 

 

 

 

()

z , , , można zapisać w postaci ( 5 ) z i

 

 

 

 

()

i ma wartości własne . Obie wartości własne mają ujemną część rzeczywistą, a współczynnik sztywności jest

 

 

 

 

()

który jest dość duży. Układ ( 10 ) wtedy Tutaj stała sprężystości jest duża, a stała tłumienia jeszcze większa. (chociaż „duży” nie jest terminem jasno zdefiniowanym, ale im większe są powyższe wielkości, tym wyraźniejszy będzie efekt sztywności.) Dokładnym rozwiązaniem ( 10 ) jest

 

 

 

 

()

Równanie 13 dość podobnie do prostego wykładniczego nawet mi przy małym współczynniku wystarczy, aby obliczenia numeryczne były bardzo wrażliwe na wielkość kroku. Stabilna integracja ( 10 ) wymaga bardzo małego kroku aż do gładkiej części krzywej rozwiązania, co powoduje błąd znacznie mniejszy niż wymagany dla dokładności. Zatem system spełnia również stwierdzenie 2 i definicję Lamberta.

A-stabilność

Zachowanie metod numerycznych na sztywnych problemach można przeanalizować, stosując te metody do równania testowego zastrzeżeniem warunku początkowego with . The solution of this equation is . To rozwiązanie zbliża się do zera Re numeryczna również wykazuje takie zachowanie ( dla ustalonej wielkości kroku), wówczas mówi się, że metoda jest A-stabilna. Metoda numeryczna, która jest L-stabilna (patrz poniżej), ma silniejszą właściwość polegającą na tym, że rozwiązanie zbliża się do zera w jednym kroku, gdy rozmiar kroku dąży do nieskończoności. Metody A-stabilne nie wykazują problemów z niestabilnością, jak opisano w motywującym przykładzie.

Metody Runge-Kutty

Metody Runge-Kutty równania testowego przyjmują postać , oraz przez indukcję . Funkcja jest funkcją . Zatem warunek, że as jest równoważny . To motywuje definicję region absolutnej stabilności (czasami nazywany po prostu regionem stabilności ), który jest zbiorem . Metoda jest A-stabilna, jeśli obszar absolutnej stabilności zawiera zbiór połowa samolot.

Przykład: metody Eulera

Różowy dysk pokazuje region stabilności dla metody Eulera.

Rozważ powyższe metody Eulera. Wyraźna metoda równania _

Stąd z . Obszarem absolutnej stabilności dla tej metody jest zatem . Metoda Eulera nie jest A-stabilna.

Motywujący przykład miał . h z × \ , który znajduje się poza regionem stabilności. Rzeczywiście, wyniki liczbowe nie są zbieżne do zera. Jednak przy wielkości kroku , mamy , który znajduje się tuż w obszarze stabilności, a wyniki liczbowe zbiegają się do zera, choć raczej powoli.

Przykład: metoda trapezowa

Obszar różowy to region stabilności dla metody trapezoidalnej.

Rozważ metodę trapezoidalną

po zastosowaniu do równania testowego jest

Rozwiązywanie dla plonów

Zatem funkcja stabilności jest

a regionem absolutnej stabilności jest

Ten region zawiera lewą półpłaszczyznę, więc metoda trapezoidalna jest A-stabilna. , a zatem rozwiązanie numeryczne zbiega się do zera wtedy i tylko wtedy, gdy Niemniej jednak metoda trapezoidalna nie zachowuje się idealnie: tłumi wszystkie rozkładające się składowe, ale szybko rozkładające się składowe są tłumione tylko bardzo słabo, ponieważ jak . Doprowadziło to do koncepcji L-stabilności : metoda jest L-stabilna, jeśli jest A-stabilna i jak . Metoda trapezoidalna jest A-stabilna, ale nie L-stabilna. Ukryta metoda Eulera jest przykładem metody L-stabilnej.

Teoria ogólna

Funkcja stabilności metody -Kutty ze współczynnikami i

gdzie wektor ze wszystkimi jedynkami Jest to funkcja wymierna (jeden wielomian podzielony przez inny).

Jawne metody Runge-Kutty mają niższą trójkątną współczynników , a zatem ich funkcja stabilności jest wielomianem. Wynika z tego, że jawne metody Runge-Kutty nie mogą być A-stabilne.

Funkcja stabilności niejawnych metod Runge-Kutty jest często analizowana przy użyciu gwiazd porządku. Gwiazda porządku dla metody z funkcją stabilności jako zbiór . Metoda jest A-stabilna wtedy i tylko wtedy, gdy jej funkcja stabilności nie ma biegunów na lewej płaszczyźnie, a jej gwiazda porządku nie zawiera liczb czysto urojonych.

Metody wieloetapowe

Liniowe metody wieloetapowe mają postać

Zastosowane do równania testowego stają się

do czego można uprościć

gdzie . Jest to liniowa zależność powtarzalności . Metoda jest A-stabilna, jeśli wszystkie rozwiązania < . Charakterystyczny wielomian to

danej wartości rozwiązania leżą w jednostce ( koło.

więc zbiorem wszystkich, wszystkie , że zaspokoić . Ponownie, jeśli ten zestaw zawiera lewą półpłaszczyznę, mówi się, że metoda wieloetapowa jest A-stabilna.

Przykład: metoda Adamsa-Bashfortha drugiego rzędu

Region różowy to region stabilności dla metody Adamsa-Bashfortha drugiego rzędu.

Wyznaczmy obszar absolutnej stabilności dla dwuetapowej metody Adamsa-Bashfortha

Charakterystyczny wielomian to

który ma korzenie

tak więc jest regionem absolutnej stabilności

Ten region jest pokazany po prawej stronie. Nie całej lewej półpłaszczyzny (w rzeczywistości obejmuje tylko rzeczywistą oś pomiędzy metoda Adamsa – Bashfortha nie jest A

Teoria ogólna

Jawne metody wieloetapowe nigdy nie mogą być A-stabilne, podobnie jak jawne metody Runge-Kutty. Niejawne metody wieloetapowe mogą być A-stabilne tylko wtedy, gdy ich kolejność wynosi co najwyżej 2. Ten ostatni wynik jest znany jako druga bariera Dahlquista ; ogranicza użyteczność liniowych metod wieloetapowych dla sztywnych równań. Przykładem metody A-stabilnej drugiego rzędu jest wspomniana powyżej reguła trapezów, którą można również uznać za liniową metodę wieloetapową.

Zobacz też

Notatki

  1. ^ Robertson, HH (1966). „Rozwiązanie zestawu równań szybkości reakcji”. Analiza numeryczna: wprowadzenie . Prasa akademicka. s. 178–182.
  2. ^ Lambert (1992 , s. 216–217)
  3. ^ Lambert (1992 , s. 217–220)
  4. Bibliografia _
  5. ^ Ciężar i Faires (1993 , s. 314)
  6. ^ Kreyszig (1972 , s. 62–68)
  7. ^ Ta definicja pochodzi od Dahlquista (1963) .
  8. ^ Definicja L-stabilności pochodzi od Ehle (1969) .
  9. ^ Definicja pochodzi od Wannera, Hairera i Nørsetta (1978) ; patrz także Iserles i Nørsett (1991) .
  10. ^ Zobacz Dahlquista (1963) .

Linki zewnętrzne