Pierwiastek kwadratowy z macierzy

W matematyce pierwiastek kwadratowy z macierzy rozszerza pojęcie pierwiastka kwadratowego z liczb na macierze . Mówimy, że macierz B jest pierwiastkiem kwadratowym z A , jeśli iloczyn macierzowy BB jest równy A .

Niektórzy autorzy używają nazwy pierwiastek kwadratowy lub notacji A 1/2 tylko w konkretnym przypadku, gdy A jest dodatnio półokreślona , do oznaczenia unikalnej macierzy B , która jest dodatnio półokreślona i taka, że ​​BB = B T B = A (dla wartości rzeczywistych macierze, gdzie B T jest transpozycją B ) .

Rzadziej pierwiastek kwadratowy z nazwy B TB = A może być użyty do dowolnego rozkładu na czynniki dodatniej półokreślonej macierzy A jako , jak w rozkładzie Cholesky'ego , nawet jeśli BB ≠ A . To odrębne znaczenie jest omówione w Pozytywnie określona macierz § Dekompozycja .

Przykłady

Ogólnie rzecz biorąc, macierz może mieć kilka pierwiastków kwadratowych. W szczególności, jeśli to b 2

Macierz tożsamości 2 × 2 ma nieskończenie wiele pierwiastków kwadratowych Są one podane przez

Displaystyle

gdzie dowolne liczby (rzeczywiste lub zespolone) takie, że . szczególności jeśli trójką to dodatnich liczb całkowitych takich, 1 jest macierzą pierwiastkową z pierwiastka kwadratowego, symetryczna i ma wpisy wymierne. Zatem

Minus tożsamość ma pierwiastek kwadratowy, na przykład:

którego można użyć do przedstawienia jednostki urojonej i , a zatem wszystkich liczb zespolonych przy użyciu macierzy rzeczywistych 2 × 2, patrz Macierzowa reprezentacja liczb zespolonych .

Podobnie jak w przypadku liczb rzeczywistych , macierz rzeczywista może nie mieć rzeczywistego pierwiastka kwadratowego, ale mieć pierwiastek kwadratowy z wpisami o wartościach zespolonych . Niektóre macierze nie mają pierwiastka kwadratowego. Przykładem jest macierz

Podczas gdy pierwiastek kwadratowy z nieujemnej liczby całkowitej jest albo liczbą całkowitą, albo liczbą niewymierną , w przeciwieństwie do tego macierz liczb całkowitych może mieć pierwiastek kwadratowy, którego wpisy są wymierne, ale niecałkowite, jak w powyższych przykładach.

Pozytywne macierze półokreślone

Symetryczna rzeczywista macierz n × n nazywana jest dodatnią półokreśloną , jeśli dla wszystkich } ^ {n}} (tutaj oznacza transpozycję kolumnowy na wektor wierszowy ). Kwadratowa macierz rzeczywista jest dodatnio półokreślona wtedy i tylko wtedy, gdy dla jakiejś macierzy B . Może być wiele różnych takich macierzy B . Dodatnia półokreślona macierz A może również mieć wiele macierzy B takich, że . Jednak A zawsze ma dokładnie jeden pierwiastek kwadratowy B , który jest dodatnio półokreślony (a zatem symetryczny). W szczególności, ponieważ B musi być symetryczne, , więc te dwa warunki lub są równoważne.

przypadku macierzy o wartościach zespolonych transpozycja sprzężona , a dodatnie macierze półokreślone co oznacza

Twierdzenie Niech A będzie dodatnią półokreśloną macierzą (rzeczywistą lub zespoloną). Wtedy istnieje dokładnie jedna dodatnia półokreślona macierz B taka, że .

Ta unikalna macierz nazywana jest głównym , nieujemnym lub dodatnim pierwiastkiem kwadratowym (ten ostatni w przypadku dodatnio określonych macierzy ).

Główny pierwiastek kwadratowy z rzeczywistej dodatniej półokreślonej macierzy jest rzeczywisty. Główny pierwiastek kwadratowy dodatnio określonej macierzy jest dodatnio określony; bardziej ogólnie, ranga głównego pierwiastka kwadratowego A jest taka sama jak ranga A .

Operacja wyciągnięcia głównego pierwiastka kwadratowego jest ciągła na tym zbiorze macierzy. Właściwości te są konsekwencją holomorficznego rachunku funkcyjnego do macierzy. Istnienie i wyjątkowość głównego pierwiastka kwadratowego można wywnioskować bezpośrednio z postaci normalnej Jordana (patrz poniżej).

Macierze o różnych wartościach własnych

n pierwiastków × n z n różnymi niezerowymi wartościami własnymi ma 2 n kwadratowych. Taka macierz A ma rozkład własny VDV −1 , gdzie V jest macierzą, której kolumny są wektorami własnymi A , a D jest macierzą diagonalną, której elementy diagonalne są odpowiednimi n wartościami własnymi λ i . Zatem pierwiastki kwadratowe z A są dane przez VD 1/2 V -1 , gdzie D 1/2 jest dowolną macierzą pierwiastkową D , która dla różnych wartości własnych musi być diagonalna z elementami diagonalnymi równymi pierwiastkom kwadratowym elementów diagonalnych D ; ponieważ istnieją dwa możliwe wybory dla pierwiastka kwadratowego z każdego elementu przekątnej D , są 2 n wyborów dla macierzy D 1/2 .

Prowadzi to również do dowodu powyższej obserwacji, że dodatnio określona macierz ma dokładnie jeden dodatnio określony pierwiastek kwadratowy: dodatnio określona macierz ma tylko dodatnie wartości własne, a każda z tych wartości własnych ma tylko jeden dodatni pierwiastek kwadratowy; a ponieważ wartości własne macierzy pierwiastkowej są elementami diagonalnymi D 1/2 , aby macierz pierwiastkowa sama w sobie była dodatnio określona, ​​konieczne jest użycie tylko unikalnych dodatnich pierwiastków kwadratowych pierwotnych wartości własnych.

Rozwiązania w formie zamkniętej

Jeśli macierz jest idempotentna , co oznacza jest sama macierz

Macierze diagonalne i trójkątne

Jeśli D jest macierzą o przekątnej n × n re kwadratowych _ Gdzie . Jeśli przekątne elementów D są rzeczywiste i nieujemne, to jest dodatnio półokreślone, a jeśli pierwiastki kwadratowe są wzięte ze znakiem nieujemnym, wynikowa macierz jest głównym pierwiastkiem D . Macierz diagonalna może mieć dodatkowe pierwiastki niediagonalne, jeśli niektóre wpisy na przekątnej są równe, jak ilustruje powyższa macierz tożsamości.

Jeśli U jest macierzą trójkątną że wpisy to ) i najwyżej jeden z jej rozwiązanie równania można znaleźć w następujący Ponieważ równanie powinno być spełnione, niech będzie głównym pierwiastkiem kwadratowym z liczby zespolonej . U gwarantuje to, dla wszystkich i, j (ponieważ wszystkie główne pierwiastki kwadratowe liczb zespolonych leżą na połowie płaszczyzny zespolonej). Z równania

wywnioskujemy, że obliczyć rekurencyjnie dla zwiększając od 1 do n jako:

Jeśli U jest trójkątem górnym może nie istnieć, na przykład . Zauważ, że przekątne wpisy macierzy trójkątnej są dokładnie jej wartościami własnymi (patrz Macierz trójkątna#Właściwości ).

Poprzez diagonalizację

Macierz A n × n jest diagonalizowalna , jeśli istnieje macierz V i macierz diagonalna D taka, że ​​A = VDV −1 . Dzieje się tak wtedy i tylko wtedy, gdy Cn A ma wektory własne , które stanowią bazę dla . W tym przypadku V można wybrać jako macierz z n wektorami własnymi jako kolumnami, a zatem pierwiastek kwadratowy z A wynosi

gdzie S jest dowolnym pierwiastkiem kwadratowym z D . Rzeczywiście,

Na przykład macierz można przekątować jako VDV -1 , gdzie

i re .

D ma główny pierwiastek kwadratowy

,

podając pierwiastek kwadratowy

.

Kiedy A jest symetryczne, diagonalizującą macierz V można przekształcić w macierz ortogonalną , odpowiednio dobierając wektory własne (patrz twierdzenie spektralne ). Wtedy odwrotność V jest po prostu transpozycją, tak że

Przez rozkład Schura

Każda macierz kwadratowa o wartościach niezależnie od diagonalizowalności, ma wzorem gdzie jest górny trójkąt. i jest jednostkowy (co oznacza . Wartości własne _ są dokładnie ukośnymi wpisami ; jeśli co najwyżej jeden z nich wynosi zero, to następny jest pierwiastkiem kwadratowym

gdzie pierwiastek kwadratowy górnej trójkątnej macierzy , jak

Jeśli wartości własne są dodatnimi liczbami rzeczywistymi, więc wybrana przekątna się również z dodatnich liczb rzeczywistych Stąd wartości własne są ​​wynikowa macierz jest pierwiastkiem głównym z .

Przez rozkład Jordana

Podobnie w rozkładu Schura, każdą macierz kwadratową gdzie P , J jest normalny w forma .

Aby zobaczyć, że dowolna zespolona macierz z dodatnimi wartościami własnymi ma pierwiastek kwadratowy z tej samej postaci, wystarczy to sprawdzić dla bloku Jordana. Każdy taki blok ma postać λ( I + N ) gdzie λ > 0 i N nilpotent . Jeśli (1 + z ) 1/2 = 1 + a 1 z + a 2 z 2 + ⋯ jest dwumianowym rozwinięciem pierwiastka kwadratowego (ważne w | z | < 1), to jako formalny szereg potęgowy jego kwadrat jest równy 1 + z . Zastępując N zamiast z , tylko skończenie wiele wyrazów będzie niezerowych, a S = √λ ( I + a 1 N + a 2 N 2 + ⋯) daje pierwiastek kwadratowy z bloku Jordana o wartości własnej √λ .

Wystarczy sprawdzić jednoznaczność bloku Jordana z λ = 1. Skonstruowany powyżej kwadrat ma postać S = I + L , gdzie L jest wielomianem w N bez stałego wyrazu. Każdy inny pierwiastek kwadratowy T z dodatnimi wartościami własnymi ma postać T = I + M z M nilpotent, dojeżdżając z N , a zatem L . Ale wtedy 0 = S 2 T 2 = 2( L - M ) ( ja + ( L + M )/2) . Ponieważ L i M dojeżdżają do pracy, macierz L + M jest nilpotentna, a I + ( L + M )/2 jest odwracalna z odwrotnością określoną przez szereg Neumanna . Stąd L = M .

Jeśli A jest macierzą z dodatnimi wartościami własnymi i minimalnym wielomianem p ( t ) , to rozkład Jordana na uogólnione przestrzenie własne A można wywnioskować z częściowego rozwinięcia ułamka p ( t ) -1 . Odpowiednie rzuty na uogólnione przestrzenie własne są podane przez rzeczywiste wielomiany w A . W każdej przestrzeni własnej A ma postać λ ( I + N ) jak powyżej. Wyrażenie szeregów potęgowych dla pierwiastka kwadratowego w przestrzeni własnej pokazuje, że główny pierwiastek kwadratowy z A ma postać q ( A ), gdzie q ( t ) jest wielomianem o rzeczywistych współczynnikach.

Serie mocy

Przypomnij sobie formalny szereg potęgowy (ponieważ współczynniki szeregu potęgowego są sumowalne). Podłączanie do tego wyrażenia daje

pod warunkiem, że . Na mocy wzoru Gelfanda warunek ten równoważny wymaganiu, aby widmo było zawarte w dysku . Ta metoda definiowania lub obliczania w przypadku, . W takim przypadku mamy dlatego wyrażenie A , który ponadto okazuje się być unikalnym dodatnim półokreślonym pierwiastkiem. Ta metoda pozostaje aktualna do definiowania pierwiastków kwadratowych operatorów na nieskończenie wymiarowych przestrzeniach Banacha lub Hilberta lub niektórych elementach algebr (C*) Banacha.

Rozwiązania iteracyjne

Przez iterację Denmana-Beaversa

Innym sposobem znalezienia pierwiastka kwadratowego z macierzy A n × n jest iteracja pierwiastka kwadratowego Denmana – Beaversa.

00 Niech Y = A i Z = I , gdzie I jest macierzą identyczności n × n . Iteracja jest zdefiniowana przez

Ponieważ wykorzystuje to parę sekwencji odwrotności macierzy, których późniejsze elementy zmieniają się stosunkowo niewiele, tylko pierwsze elementy mają wysoki koszt obliczeniowy, ponieważ resztę można obliczyć z wcześniejszych elementów za pomocą zaledwie kilku przebiegów wariantu metody Newtona do obliczania odwrotności ,

W ten sposób dla późniejszych wartości k można by ustawić i a następnie użyj dla jakiegoś małego być może tylko 1) i podobnie dla

zbieżny, macierz zbiega się kwadratowo do pierwiastka kwadratowego ZA 1/2 , podczas gdy zbiega się do swojej odwrotności, A −1/2 .

metodą babilońską

0 Jeszcze inną metodę iteracyjną uzyskuje się, biorąc dobrze znaną formułę metody babilońskiej do obliczania pierwiastka kwadratowego z liczby rzeczywistej i stosując ją do macierzy. Niech X = I , gdzie I jest macierzą tożsamości . Iteracja jest zdefiniowana przez

jest zbieżny, macierz zbiega się kwadratowo do pierwiastka ZA 1/2 W porównaniu z iteracją Denmana-Beaversa zaletą metody babilońskiej jest to, że tylko jedna macierz jest odwrotna należy obliczyć dla każdego kroku iteracji. Z drugiej strony, ponieważ iteracja Denmana-Beaversa wykorzystuje parę sekwencji odwrotnych macierzy, których późniejsze elementy zmieniają się stosunkowo niewiele, tylko pierwsze elementy mają wysoki koszt obliczeniowy, ponieważ resztę można obliczyć z wcześniejszych elementów za pomocą zaledwie kilku przebiegów a wariant metody Newtona do obliczania odwrotności (patrz iteracja Denmana – Beaversa powyżej); oczywiście to samo podejście można zastosować, aby uzyskać pojedynczą sekwencję odwrotności potrzebną w metodzie babilońskiej. Jednak w przeciwieństwie do iteracji Denmana-Beaversa, metoda babilońska jest liczbowo niestabilna i istnieje większe prawdopodobieństwo, że nie osiągnie zbieżności.

Metoda babilońska wynika z metody Newtona równania i przy użyciu dla wszystkich

Pierwiastki kwadratowe operatorów dodatnich

W algebrze liniowej i teorii operatorów , biorąc pod uwagę ograniczony dodatni operator półokreślony (operator nieujemny) T na zespolonej przestrzeni Hilberta, B jest pierwiastkiem kwadratowym z T , jeśli T = B* B , gdzie B* oznacza sprzężenie hermitowskie z B . [ potrzebne źródło ] Zgodnie z twierdzeniem spektralnym , ciągły rachunek funkcjonalny można zastosować w celu uzyskania operatora T1 /2 takiego, że T1 /2 samo w sobie jest dodatnie i ( T1 /2 ) 2 = T. Operator T 1/2 jest unikalnym nieujemnym pierwiastkiem kwadratowym z T . [ potrzebne źródło ]

Ograniczony operator nieujemny na zespolonej przestrzeni Hilberta jest z definicji samosprzężony. Więc T = ( T 1/2 )* T 1/2 . I odwrotnie, trywialnie prawdą jest, że każdy operator postaci B* B jest nieujemny. Dlatego operator T jest nieujemny wtedy i tylko wtedy, gdy T = B* B dla pewnego B (równoważnie T = CC* dla pewnego C ).

Faktoryzacja Cholesky'ego stanowi kolejny szczególny przykład pierwiastka kwadratowego, którego nie należy mylić z unikalnym nieujemnym pierwiastkiem kwadratowym.

Jednolita swoboda pierwiastków kwadratowych

Jeśli T jest operatorem nieujemnym na skończonej przestrzeni Hilberta, to wszystkie pierwiastki kwadratowe z T są powiązane przez przekształcenia jednostkowe. Dokładniej, jeśli T = A*A = B*B , to istnieje takie unitarne U , że A = UB .

Rzeczywiście, weźmy B = T 1/2 kwadratowy z jako jedyny nieujemny pierwiastek T . Jeśli T jest ściśle dodatnie, to B jest odwracalne, więc U = AB −1 jest jednostkowe:

Jeśli T jest nieujemne, ale nie jest ściśle dodatnie, to nie można zdefiniować odwrotności B , ale można zdefiniować pseudoodwrotność B + Moore'a-Penrose'a. W takim przypadku operator B + A jest izometrią częściową , to znaczy operatorem unitarnym z zakresu T do samego siebie. Można to następnie rozszerzyć na operatora unitarnego U na całej przestrzeni, ustawiając go na równą tożsamości na jądrze T . Mówiąc bardziej ogólnie, jest to prawdą w nieskończenie wymiarowej przestrzeni Hilberta, jeśli dodatkowo T ma zamknięty zakres . Ogólnie, jeśli A , B zamkniętymi i gęsto zdefiniowanymi operatorami na przestrzeni Hilberta H , a A* A = B* B , to A = UB , gdzie U jest izometrią częściową.

Niektóre aplikacje

Pierwiastki kwadratowe i jednostkowa swoboda pierwiastków kwadratowych mają zastosowanie w analizie funkcjonalnej i algebrze liniowej.

Rozkład polarny

Jeśli A jest operatorem odwracalnym w skończenie wymiarowej przestrzeni Hilberta, to istnieje unikalny operator unitarny U i operator dodatni P taki, że

to jest polarny rozkład A . Operator dodatni P jest unikalnym dodatnim pierwiastkiem kwadratowym operatora dodatniego A A , a U jest zdefiniowane przez U = AP −1 .

Jeśli A nie jest odwracalne, to nadal ma skład biegunowy, w którym P jest zdefiniowane w ten sam sposób (i jest unikalne). Operator unitarny U nie jest unikalny. Raczej możliwe jest wyznaczenie „naturalnego” operatora unitarnego w następujący sposób: AP + jest operatorem unitarnym z zakresu A do samego siebie, który można rozszerzyć o tożsamość na jądrze A . Otrzymany operator unitarny U daje następnie polarny rozkład A .

Operatory Krausa

Według wyniku Choi, mapa liniowa

jest całkowicie dodatnia wtedy i tylko wtedy, gdy ma postać

gdzie k nm . Niech { E pq } ⊂ C n × n będzie n 2 elementarnymi jednostkami macierzowymi. Pozytywna matryca

nazywana jest macierzą Choi Φ. Operatory Krausa odpowiadają, niekoniecznie kwadratowemu, pierwiastkowi kwadratowemu M Φ : Dla dowolnego pierwiastka kwadratowego B z M Φ można otrzymać rodzinę operatorów Kraus VI przez cofnięcie operacji Vec dla każdej kolumny b i z B . Zatem wszystkie zbiory operatorów Krausa są powiązane częściowymi izometriami.

Zespoły mieszane

W fizyce kwantowej macierz gęstości dla układu kwantowego na poziomie n jest macierzą zespoloną n × n ρ , która jest dodatnio półokreślona ze śladem 1. Jeśli ρ można wyrazić jako

gdzie i Σ p ja = 1, zbiór

mówi się, że jest zespołem opisującym stan mieszany ρ . Uwaga { v i } nie musi być ortogonalna. Różne zespoły opisujące stan ρ są powiązane operatorami unitarnymi poprzez pierwiastki kwadratowe z ρ . Załóżmy na przykład

Warunek śladu 1 oznacza

Pozwalać

a v i będzie znormalizowanym a i . Widzimy to

daje stan mieszany ρ .

Zobacz też

Notatki