Własności geometryczne pierwiastków wielomianowych
W matematyce jednowymiarowy wielomian stopnia n o rzeczywistych lub zespolonych współczynnikach ma n pierwiastków zespolonych , licząc ich krotności . Tworzą multizbiór n punktów na płaszczyźnie zespolonej . Artykuł dotyczy geometrii tych punktów, czyli informacji o ich położeniu na płaszczyźnie zespolonej, jakie można wywnioskować ze stopnia i współczynników wielomianu.
Niektóre z tych właściwości geometrycznych są związane z pojedynczym wielomianem, na przykład górne granice wartości bezwzględnych pierwiastków, które definiują dysk zawierający wszystkie pierwiastki, lub dolne granice odległości między dwoma pierwiastkami. Takie granice są szeroko stosowane w algorytmach znajdowania pierwiastków dla wielomianów, albo do ich dostrajania, albo do obliczania ich złożoności obliczeniowej .
Niektóre inne właściwości są probabilistyczne, na przykład oczekiwana liczba pierwiastków rzeczywistych losowego wielomianu stopnia n o rzeczywistych współczynnikach, która jest mniejsza niż dla n wystarczająco dużych.
W tym artykule rozważany wielomian jest zawsze oznaczony
gdzie są liczbami rzeczywistymi lub zespolonymi i ; zatem n jest stopniem wielomianu.
Ciągła zależność od współczynników
N pierwiastków wielomianu stopnia n zależy w sposób ciągły od współczynników. W przypadku pierwiastków prostych wynika to bezpośrednio z twierdzenia o funkcji uwikłanej . Dotyczy to również wielu pierwiastków, ale dowód wymaga pewnej uwagi.
Niewielka zmiana współczynników może wywołać dramatyczną zmianę pierwiastków, w tym zmianę pierwiastka rzeczywistego na pierwiastek złożony z dość dużą częścią urojoną (patrz wielomian Wilkinsona ). Konsekwencją jest to, że w przypadku klasycznych numerycznych algorytmów wyszukiwania pierwiastków problem aproksymacji pierwiastków przy danych współczynnikach jest źle uwarunkowany dla wielu danych wejściowych.
Koniugacja
Twierdzenie o złożonym pierwiastku sprzężonym stwierdza, że jeśli współczynniki wielomianu są rzeczywiste, to pierwiastki nierzeczywiste występują parami postaci ( a + ib , a – ib ) .
Wynika z tego, że pierwiastki wielomianu o rzeczywistych współczynnikach są lustrzanie symetryczne względem osi rzeczywistej.
Można to rozszerzyć na koniugację algebraiczną : pierwiastki wielomianu o współczynnikach wymiernych są sprzężone (to znaczy niezmienne) pod działaniem grupy Galois wielomianu. Jednak ta symetria rzadko może być interpretowana geometrycznie.
Granice na wszystkich korzeniach
Górne granice wartości bezwzględnych pierwiastków wielomianowych są szeroko stosowane w algorytmach wyszukiwania pierwiastków, albo do ograniczania regionów, w których należy szukać pierwiastków, albo do obliczania złożoności obliczeniowej tych algorytmów.
Podano wiele takich granic, a ostrzejsze zależy generalnie od określonej sekwencji rozważanych współczynników. Większość granic jest większa lub równa jedności, a zatem nie jest ostra dla wielomianu, który ma tylko pierwiastki o wartościach bezwzględnych mniejszych od jedności. Jednak takie wielomiany są bardzo rzadkie, jak pokazano poniżej.
Każda górna granica wartości bezwzględnych pierwiastków zapewnia odpowiednią dolną granicę. rzeczywistości, jeśli jest górną granicą pierwiastków
wtedy 1/ U jest dolną granicą bezwzględnych wartości pierwiastków
ponieważ pierwiastki jednego wielomianu są multiplikatywnymi odwrotnościami pierwiastków drugiego. Dlatego w dalszej części artykułu dolne granice nie będą podawane wprost .
Granice Lagrange'a i Cauchy'ego
Lagrange i Cauchy jako pierwsi podali górne granice wszystkich pierwiastków złożonych. Granica Lagrange'a wynosi
a granica Cauchy'ego to
Granica Lagrange'a jest ostrzejsza (mniejsza) niż granica Cauchy'ego tylko wtedy, gdy 1 jest większe niż suma wszystkich ale największy. Jest to stosunkowo rzadkie w praktyce i wyjaśnia, dlaczego granica Cauchy'ego jest szerzej stosowana niż granica Lagrange'a.
Oba ograniczenia wynikają z twierdzenia Gershgorina o okręgu zastosowanego do macierzy towarzyszącej wielomianu i jego transpozycji . Można je również udowodnić metodami elementarnymi.
Dowód granic Lagrange'a i Cauchy'ego
|
---|
Jeśli z jest pierwiastkiem wielomianu, a | z | ≥ 1 ma Dzielenie przez dostaje się co jest granicą Lagrange'a, gdy istnieje co najmniej jeden pierwiastek o wartości bezwzględnej większej niż 1. W przeciwnym razie 1 jest granicą pierwiastków i nie jest większa niż granica Lagrange'a. Podobnie, dla ograniczenia Cauchy'ego, mamy, jeśli | z | ≥ 1 , Zatem Rozwiązywanie w | z | , otrzymujemy granicę Cauchy'ego, jeśli istnieje pierwiastek o wartości bezwzględnej większej niż 1. W przeciwnym razie granica jest również poprawna, ponieważ granica Cauchy'ego jest większa niż 1. |
Te granice nie są niezmienne przez skalowanie. Oznacza to, że pierwiastki wielomianu p ( sx ) są ilorazem pierwiastka p przez s , a granice podane dla pierwiastków p ( sx ) nie są ilorazem granic p . W ten sposób można uzyskać ostrzejsze granice, minimalizując możliwe skalowania. To daje
I
odpowiednio dla granic Lagrange'a i Cauchy'ego.
Innym ograniczeniem, pierwotnie nadanym przez Lagrange'a, ale przypisanym Zassenhausowi przez Donalda Knutha , jest
Ta granica jest niezmienna przez skalowanie.
Dowód poprzedniej granicy
|
---|
Niech A będzie największym for 0 ≤ i < n. Thus one has dla Jeśli z jest pierwiastkiem z p , jeden ma a więc po podzieleniu przez Jak chcemy udowodnić | z | ≤ 2 A , możemy założyć, że | z | > A (inaczej nie ma czego udowadniać). Zatem co daje wynik, ponieważ |
Lagrange poprawił to ostatnie związane z sumą dwóch największych wartości (prawdopodobnie równych) w sekwencji
Lagrange dostarczył również oprawę [ potrzebne źródło ]
gdzie ty niezerowy współczynnik , gdy wyrazy wielomianów są sortowane według rosnących stopni
Korzystanie z nierówności Höldera
Nierówność Höldera pozwala na rozszerzenie granic Lagrange'a i Cauchy'ego na każdą h -normę . Norma h sekwencji
Jest
dla dowolnej liczby rzeczywistej h ≥ 1 i
Jeśli z 1 ≤ h , k ≤ ∞ i 1 / ∞ = 0 , górna granica wartości bezwzględnych pierwiastków p wynosi
Dla k = 1 i k = ∞ otrzymujemy odpowiednio granice Cauchy'ego i Lagrange'a.
Dla h = k = 2 mamy granicę
Jest to nie tylko ograniczenie wartości bezwzględnych pierwiastków, ale także ograniczenie iloczynu ich wartości bezwzględnych większych niż 1; patrz § Nierówność Landaua poniżej.
Dowód
|
---|
Niech z będzie pierwiastkiem wielomianu Ustawienie musimy udowodnić, że każdy pierwiastek z p spełnia Jeśli nierówność jest prawdziwa; więc można przypuszczać dla pozostałej części dowodu. Zapisz równanie jako Nierówność Höldera implikuje Jeśli k = 1 , to tak Zatem W przypadku 1 < k ≤ ∞ , wzór na sumowanie postępu geometrycznego daje Zatem co upraszcza A więc we wszystkich przypadkach co kończy dowód. |
Inne granice
Podano wiele innych górnych granic wielkości wszystkich pierwiastków.
Fujiwara jest związana
nieznacznie poprawia granicę podaną powyżej, dzieląc ostatni argument maksimum przez dwa.
Granica Kojimy to [ wymagana weryfikacja ]
gdzie ty niezerowy współczynnik , gdy wyrazy wielomianów są sortowane według rosnących stopni Jeśli wszystkie współczynniki są niezerowe, granica Fujiwary jest ostrzejsza, ponieważ każdy element w granicy Fujiwary jest średnią geometryczną pierwszych elementów w granicy Kojimy.
Sun i Hsieh uzyskali kolejną poprawę na granicy Cauchy'ego. Załóżmy, że wielomian jest moniczny z wyrazem ogólnym a i x i . Sun i Hsieh wykazali, że górne granice 1 + d 1 i 1 + d 2 można otrzymać z następujących równań.
d 2 jest dodatnim pierwiastkiem równania sześciennego
Zauważyli również, że d 2 ≤ d 1 .
Nierówność Landaua
Poprzednie granice są górnymi granicami dla każdego korzenia osobno. Nierówność Landaua zapewnia górną granicę wartości bezwzględnych iloczynu pierwiastków, które mają wartość bezwzględną większą niż jeden. Ta nierówność, odkryta w 1905 roku przez Edmunda Landaua , została zapomniana i ponownie odkryta co najmniej trzy razy w XX wieku.
Ta granica iloczynu pierwiastków jest niewiele większa niż najlepsze poprzednie granice każdego pierwiastka z osobna. Niech będzie n pierwiastkami wielomianu p . Jeśli
jest zatem miarą Mahlera p
Co zaskakujące, ta granica iloczynu wartości bezwzględnych większych niż 1 pierwiastków jest niewiele większa niż najlepsze granice jednego pierwiastka podane powyżej dla pojedynczego pierwiastka. Ta granica jest nawet dokładnie równa jednej z granic uzyskanych za pomocą nierówności Höldera .
To ograniczenie jest również przydatne do wiązania współczynników dzielnika wielomianu ze współczynnikami całkowitymi: jeśli
zatem dzielnikiem p
i według wzorów Viety ,
dla ja = 0, ..., m , gdzie jest współczynnikiem dwumianowym . Zatem
I
Dyski zawierające niektóre korzenie
Z twierdzenia Rouchégo
Twierdzenie Rouchégo pozwala na zdefiniowanie dysków o środku w punkcie zerowym i zawierających określoną liczbę pierwiastków. Dokładniej, jeśli istnieje dodatnia liczba rzeczywista R i liczba całkowita 0 ≤ k ≤ n taka, że
wtedy jest dokładnie k pierwiastków, liczonych z krotnością, o wartości bezwzględnej mniejszej niż R .
Dowód
|
---|
Jeśli wtedy Z twierdzenia Rouché wynika to bezpośrednio, że mają samą liczbę pierwiastków o wartościach bezwzględnych liczonych krotnościami Ponieważ ta liczba to k , wynik jest udowodniony. |
Powyższy wynik można zastosować, jeśli wielomian
przyjmuje wartość ujemną dla pewnej dodatniej wartości rzeczywistej x .
W dalszej części sekcji załóżmy, że 0 a ≠ 0 . Jeśli tak nie jest, zero jest pierwiastkiem, a lokalizację innych pierwiastków można zbadać, dzieląc wielomian przez potęgę nieokreśloności, uzyskując wielomian o niezerowym stałym składniku.
Dla k = 0 i k = n reguła znaków Kartezjusza pokazuje , że wielomian ma dokładnie jeden dodatni pierwiastek rzeczywisty. Jeśli i i są tymi , powyższy wynik pokazuje, że wszystkie pierwiastki spełniają R {\ displaystyle
te nierówności dotyczą również te ich współczynników. Są więc ostrzejsze niż wszystkie granice podane w poprzednich sekcjach.
Dla 0 < k < n , reguła znaków Kartezjusza implikuje, że dwa dodatnie pierwiastki rzeczywiste, które nie są wielokrotnością, albo jest nieujemna x . Tak więc powyższy wynik można zastosować tylko w pierwszym przypadku. R powyższy wynik implikuje, że
dla k pierwiastków z p i tyle
dla n – k innych pierwiastków.
Zamiast jawnego obliczania i wystarczy obliczyć wartość takie, że (koniecznie ). Te mają właściwość oddzielania pierwiastków pod względem ich wartości bezwzględnych: jeśli dla h < k zarówno R istnieje, istnieje dokładnie k – h pierwiastków z takich, że
Do obliczeń można fakt, że R { funkcja (jej druga pochodna jest dodatnia). Tak więc i tylko wtedy unikalnym Do obliczenia tego minimum można użyć dowolnej metody optymalizacji lub alternatywnie metody Newtona do obliczenia unikalnego dodatniego zera pochodnej (jest szybko zbieżny, ponieważ pochodna jest funkcją monotoniczną ).
Można zwiększyć liczbę istniejących, operację pierwiastka kwadratowego – Graeffe . Jeśli pierwiastki mają różne wartości bezwzględne, można ostatecznie całkowicie oddzielić pierwiastki pod względem ich wartości bezwzględnych, to znaczy obliczyć n + 1 liczb dodatnich taki, że istnieje dokładnie jeden pierwiastek o wartości bezwzględnej w przedziale otwartym dla k = 1, ..., n .
Z twierdzenia Gershgorina o okręgu
Twierdzenie Gershgorina o okręgu stosuje towarzyszącą macierz wielomianu na podstawie związanej z interpolacją Lagrange'a w celu zdefiniowania dysków wyśrodkowanych w punktach interpolacji, z których każdy zawiera pierwiastek wielomianu; szczegółowe informacje można znaleźć w metodzie Duranda – Kernera § Inkluzja korzenia przez kręgi Gerschgorina .
Jeśli punkty interpolacji znajdują się blisko pierwiastków pierwiastków wielomianu, promienie dysków są małe i jest to kluczowy składnik metody Duranda-Kernera do obliczania pierwiastków wielomianu.
Granice rzeczywistych korzeni
W przypadku wielomianów o rzeczywistych współczynnikach często przydatne jest ograniczenie tylko rzeczywistych pierwiastków. Wystarczy związać pierwiastki dodatnie, gdyż pierwiastki ujemne p ( x ) są pierwiastkami dodatnimi p ( – x ) .
Oczywiście, każde ograniczenie wszystkich pierwiastków stosuje się również do pierwiastków rzeczywistych. Ale w niektórych kontekstach przydatne są ściślejsze granice rzeczywistych korzeni. Na przykład skuteczność metody ułamków ciągłych do izolacji pierwiastków rzeczywistych silnie zależy od szczelności wiązania pierwiastków dodatnich. Doprowadziło to do ustanowienia nowych granic, które są ściślejsze niż ogólne granice wszystkich korzeni. Granice te są na ogół wyrażane nie tylko w wartościach bezwzględnych współczynników, ale także w postaci ich znaków.
Inne ograniczenia dotyczą tylko wielomianów, których wszystkie pierwiastki są liczbami rzeczywistymi (patrz poniżej).
Granice dodatnich pierwiastków rzeczywistych
Aby podać granicę dodatnich pierwiastków, można założyć znaków wszystkich współczynników nie zmienia pierwiastków
Każda górna granica dodatnich pierwiastków
jest również granicą rzeczywistych zer
- .
W rzeczywistości, jeśli B jest takim ograniczeniem, dla wszystkich x > B , jeden ma p ( x ) ≥ q ( x ) > 0 .
Zastosowane do granicy Cauchy'ego daje to górną granicę
dla rzeczywistych pierwiastków wielomianu o rzeczywistych współczynnikach. Jeśli ta granica jest nie większa niż 1 , oznacza to, że wszystkie niezerowe współczynniki mają ten sam znak i że nie ma dodatniego pierwiastka.
Podobnie jest z inną górną granicą dodatnich pierwiastków
Jeśli wszystkie niezerowe współczynniki mają ten sam znak, nie ma dodatniego pierwiastka, a maksimum musi wynosić zero.
Ostatnio opracowano inne ograniczenia, głównie dla metody ułamków ciągłych do izolacji pierwiastków rzeczywistych .
Wielomiany, których wszystkie pierwiastki są rzeczywiste
Jeśli wszystkie pierwiastki wielomianu są rzeczywiste, Laguerre udowodnił następujące dolne i górne granice pierwiastków, używając czegoś, co obecnie nazywa się nierównością Samuelsona .
Niech będzie wielomianem ze wszystkimi pierwiastkami rzeczywistymi. Wtedy jego pierwiastki znajdują się w przedziale z punktami końcowymi
Na przykład pierwiastki wielomianu spełnia
Separacja korzeni
Separacja pierwiastków wielomianu to minimalna odległość między dwoma pierwiastkami, czyli minimum bezwzględnych wartości różnicy dwóch pierwiastków:
Separacja pierwiastków jest podstawowym parametrem złożoności obliczeniowej algorytmów znajdowania pierwiastków dla wielomianów. W rzeczywistości separacja pierwiastków określa precyzję reprezentacji liczb, która jest potrzebna, aby mieć pewność rozróżnienia różnych pierwiastków. Ponadto w przypadku izolacji pierwiastków rzeczywistych umożliwia to ograniczenie liczby podziałów interwałów potrzebnych do wyizolowania wszystkich pierwiastków.
W przypadku wielomianów o współczynnikach rzeczywistych lub zespolonych nie jest możliwe wyrażenie dolnej granicy separacji pierwiastków wyłącznie w kategoriach stopnia i wartości bezwzględnych współczynników, ponieważ niewielka zmiana pojedynczego współczynnika przekształca wielomian z wieloma pierwiastkami w wielomian bezkwadratowy z małą separacją pierwiastków i zasadniczo tymi samymi bezwzględnymi wartościami współczynnika. Jednak uwzględnienie dyskryminatora wielomianu pozwala na dolną granicę.
W przypadku wielomianów bezkwadratowych o współczynnikach całkowitych wyróżnikiem jest liczba całkowita, a zatem ma wartość bezwzględną nie mniejszą niż 1 . Pozwala to na dolne granice separacji korzeni, które są niezależne od dyskryminatora.
Granica separacji Mignotte'a to
gdzie jest wyróżnikiem i
W przypadku wielomianu swobodnego do kwadratu ze współczynnikami całkowitymi oznacza to
gdzie s jest rozmiarem bitowym p , czyli sumą rozmiaru bitowego jego współczynników.
Twierdzenie Gaussa-Lucasa
Twierdzenie Gaussa-Lucasa stwierdza, że wypukła otoczka pierwiastków wielomianu zawiera pierwiastki pochodnej wielomianu .
Czasami przydatnym wnioskiem jest to, że jeśli wszystkie pierwiastki wielomianu mają dodatnią część rzeczywistą, to tak samo pierwiastki wszystkich pochodnych wielomianu.
Powiązanym wynikiem jest nierówność Bernsteina . Stwierdza, że dla wielomianu P stopnia n z pochodną P′ mamy
Rozkład statystyczny korzeni
Jeśli współczynniki a i losowego wielomianu mają niezależny i identyczny rozkład ze średnią równą zero, najbardziej złożone pierwiastki znajdują się na okręgu jednostkowym lub blisko niego. W szczególności pierwiastki rzeczywiste znajdują się najczęściej w pobliżu ±1 , a ponadto ich oczekiwana liczba jest w dużym stopniu mniejsza od logarytmu naturalnego stopnia.
Jeśli współczynniki mają rozkład Gaussa ze średnią zerową i wariancją σ , to średnia gęstość pierwiastków rzeczywistych jest określona wzorem Kac
Gdzie
Gdy współczynniki mają rozkład Gaussa z niezerową średnią i wariancją σ , znany jest podobny, ale bardziej złożony wzór. [ potrzebne źródło ]
Prawdziwe korzenie
Dla dużego n średnia gęstość rzeczywistych pierwiastków w pobliżu x jest asymptotyczna
jeśli i
Wynika z tego, że oczekiwana liczba rzeczywistych pierwiastków wynosi, używając notacji dużego O
gdzie C jest stałą w przybliżeniu równą 0,625 735 8072 .
Innymi słowy, oczekiwana liczba rzeczywistych pierwiastków losowego wielomianu wysokiego stopnia jest mniejsza niż logarytm naturalny stopnia .
Kac, Erdős i inni wykazali, że wyniki te są niewrażliwe na rozkład współczynników, jeśli są one niezależne i mają ten sam rozkład ze średnią zerową. Jeśli jednak wariancja i- tego współczynnika jest równa oczekiwana liczba pierwiastków rzeczywistych wynosi
Geometria wielu korzeni
Wielomian można zapisać w postaci
z różnymi pierwiastkami odpowiednimi krotnościami . Korzeń jest prostym pierwiastkiem , jeśli lub wielokrotnym pierwiastkiem , jeśli . Proste pierwiastki są ciągłe Lipschitza pod względem współczynników, ale pierwiastki wielokrotne nie są. Innymi słowy, pierwiastki proste mają ograniczoną czułość, ale pierwiastki wielokrotne są nieskończenie czułe, jeśli współczynniki są dowolnie zaburzane. W rezultacie większość algorytmów wyszukiwania pierwiastków cierpi na znaczną utratę dokładności wielu pierwiastków w obliczeniach numerycznych.
W 1972 roku William Kahan udowodnił, że istnieje wrodzona stabilność wielu korzeni. Kahan odkrył, że wielomiany o określonym zbiorze wielokrotności tworzą coś, co nazwał rozmaitością pejoratywną, i udowodnił, że pierwiastek wielokrotny jest ciągły Lipschitza , jeśli zaburzenie zachowuje swoją wielość.
Ta geometryczna właściwość wielu pierwiastków jest kluczowa w obliczeniach numerycznych wielu pierwiastków .
Zobacz też
- Reguła znaków Kartezjusza - Związek między liczbą dodatnich pierwiastków wielomianu a znakami jego współczynników
- Twierdzenie Mardena - O zerach pochodnych wielomianów sześciennych
- Tożsamości Newtona – Relacje między sumami mocy a elementarnymi funkcjami symetrycznymi
- Funkcja kwadratowa # Górna granica wielkości pierwiastków
- Izolacja pierwiastków rzeczywistych - Metody lokalizowania pierwiastków rzeczywistych wielomianu
- Znajdowanie pierwiastków wielomianów - Algorytmy znajdowania zer wielomianów
- Wielomian bez kwadratów - wielomian bez powtarzającego się pierwiastka
- Wzory Viety – Powiązanie współczynników i pierwiastków wielomianu
Notatki
- Rahman, QI; Schmeisser, G. (2002). Analityczna teoria wielomianów . Monografie Londyńskiego Towarzystwa Matematycznego. Nowa seria. Tom. 26. Oksford: Oxford University Press . ISBN 0-19-853493-0 . Zbl 1072.30006 .
- Yap, Chee-Keng (2000). Podstawowe problemy algebry algorytmicznej (PDF) . Oxford University Press . ISBN 978-0195125160 . .
Linki zewnętrzne
- Piękno pierwiastków , wizualizacja rozkładu wszystkich pierwiastków wszystkich wielomianów ze współczynnikami stopni i całkowitymi w pewnym zakresie.