Równanie Diraca

W fizyce cząstek elementarnych równanie Diraca jest relatywistycznym równaniem falowym wyprowadzonym przez brytyjskiego fizyka Paula Diraca w 1928 r. W swojej wolnej postaci lub z uwzględnieniem 1/2 oddziaływań elektromagnetycznych o spinie opisuje ono wszystkie cząstki o masie , zwane „cząstkami Diraca”, takie jak elektrony i kwarki , dla których parzystość jest symetrią . Jest zgodna zarówno z zasadami mechaniki kwantowej , jak iz teorią szczególnej teorii względności i była pierwszą teorią, która w pełni uwzględniała szczególną teorię względności w kontekście mechaniki kwantowej. Zostało to potwierdzone przez uwzględnienie dokładnej struktury widma wodoru w całkowicie rygorystyczny sposób.

Równanie implikowało również istnienie nowej formy materii, antymaterii , wcześniej niepodejrzewanej i nieobserwowanej, co zostało potwierdzone eksperymentalnie kilka lat później. Dało to również teoretyczne uzasadnienie wprowadzenia kilku składowych funkcji falowych do fenomenologicznej teorii spinu Pauliego . Funkcje falowe w teorii Diraca to wektory czterech liczb zespolonych (znanych jako bispinory ), z których dwie przypominają funkcję falową Pauliego w granicy nierelatywistycznej, w przeciwieństwie do równania Schrödingera , które opisywało funkcje falowe tylko jednej wartości zespolonej. Co więcej, w granicy masy zerowej równanie Diraca sprowadza się do równania Weyla .

Chociaż Dirac początkowo nie w pełni docenił znaczenie swoich wyników, pociągnięte za sobą wyjaśnienie spinu jako konsekwencji połączenia mechaniki kwantowej i teorii względności – i ostatecznego odkrycia pozytonu – reprezentuje jeden z wielkich triumfów fizyki teoretycznej . Osiągnięcie to zostało opisane jako w pełni równe pracom Newtona , Maxwella i Einsteina przed nim. 1/2 równanie W kontekście kwantowej teorii pola Diraca jest reinterpretowane w celu opisania pól kwantowych odpowiadających cząstkom o spinie .

Równanie Diraca pojawia się na podłodze Opactwa Westminsterskiego na tablicy upamiętniającej życie Paula Diraca, która została odsłonięta 13 listopada 1995 r.

Sformułowanie matematyczne

W swoim nowoczesnym sformułowaniu dla teorii pola, równanie Diraca jest zapisywane jako pole spinorowe Diraca wartości w złożonej przestrzeni wektorowej opisanej konkretnie jako do , zdefiniowana na płaskiej czasoprzestrzeni ( przestrzeń Minkowskiego ) . wyrażenie zawiera również macierze gamma i parametr interpretowany , a także inne stałe fizyczne.

Pod względem pola równanie Diraca jest wtedy równe

Równanie Diraca

iw jednostkach naturalnych , z notacją ukośną Feynmana ,

Równanie Diraca (jednostki naturalne)

Macierze gamma to zestaw czterech złożonych macierzy elementy ), które spełniają definiujące relacje antykomutacyjne :

gdzie jest elementem metrycznym Minkowskiego, a indeksy 3. Te macierze może być zrealizowane jawnie w ramach wyboru reprezentacji. Dwa powszechne wybory to reprezentacja Diraca
gdzie macierze Pauliego i reprezentacja chiralna: takie same, ale

Notacja z ukośnikiem jest zwartą notacją dla

gdzie czterowektorowy operator . Sumowanie po indeksie .

Sprzężenie Diraca i równanie sprzężone

Sprzężenie Diraca pola spinorowego jest zdefiniowane jako

Korzystając z właściwości macierzy gamma (która wynika bezpośrednio z właściwości hermiczności ), że
można wyprowadzić sprzężone równanie Diraca, biorąc koniugat hermitowski równania Diraca i mnożąc po prawej stronie przez: :
pochodna cząstkowa prawej

Równanie Kleina-Gordona

Zastosowanie do równania Diraca daje

Oznacza to, że każdy składnik spinorowego pola Diraca spełnia równanie Kleina – Gordona .

Prąd zachowany

Zachowany nurt teorii to

Dowód zachowania z równania Diraca

Dodanie Diraca i sprzężonych równań Diraca daje

więc zgodnie z regułą Leibniza,

Noether dla globalnej celu wyprowadzenia zachowanego prądu

Dowód zachowania z twierdzenia Noether

Przypomnij sobie Lagrange'a

Pod _
stwierdzamy, że Lagrange'a jest niezmiennikiem.

Teraz, biorąc pod uwagę, że parametr wariacji jest nieskończenie mały, pracujemy na pierwszym rzędzie w i ignorujemy warunki. Z poprzedniej dyskusji od razu widzimy wyraźną zmienność Lagrange'a spowodowaną zanikaniem, czyli pod zmiennością,

gdzie .

W ramach twierdzenia Noether znajdujemy ukrytą zmienność Lagrange'a spowodowaną zmiennością pól. Jeśli równanie ruchu dla jest spełnione, to

 

 

 

 

()

w Lagrange'a nie ma cząstkowych . jest nieskończenie małą odmianą

Oceniamy
Równanie ( * ) staje się
i skończyliśmy.

Rozwiązania

Ponieważ operator Diraca działa na 4-krotkach funkcji całkowalnych z kwadratem , jego rozwiązania powinny należeć do tej samej przestrzeni Hilberta . Fakt, że energie rozwiązań nie mają dolnej granicy, jest nieoczekiwany.

Rozwiązania płaskie

Rozwiązaniami fali płaskiej są rozwiązania wynikające z ansatz

gdzie _

W tym ansatz równanie Diraca staje się równaniem dla: :

Po wybraniu reprezentacji macierzy gamma kwestią rozwiązania układu równań liniowych. Wolną od reprezentacji właściwością macierzy gamma jest to, że przestrzeń rozwiązań jest dwuwymiarowa (patrz tutaj ).

w chiralnej reprezentacji dla przestrzeń rozwiązania jest parametryzowana przez wektor , z

gdzie hermitowskiej .

Te rozwiązania fali płaskiej stanowią punkt wyjścia dla kwantyzacji kanonicznej.

Sformułowanie Lagrange'a

Zarówno równanie Diraca, jak i równanie Adjoint Diraca można uzyskać z (zmiennego) działania o określonej gęstości Lagrange'a, która jest określona wzorem:

Jeśli zmieni się to w odniesieniu do, sprzężone równanie Diraca. W , jeśli zmieni się to w odniesieniu do, równanie Diraca.

W jednostkach naturalnych i z notacją z ukośnikiem akcja jest wtedy

Akcja Diraca

zachowany prąd odpowiadający globalnej przez Noether twierdzenie dla teorii pola. Pomiar tej teorii pola poprzez zmianę symetrii na lokalną, zależną od punktu czasoprzestrzennego daje symetrię cechowania (naprawdę redundancję cechowania). Powstała teoria to elektrodynamika kwantowa lub QED. Poniżej znajduje się bardziej szczegółowa dyskusja.

Niezmienniczość Lorentza

grupy Lorentza ściśle , komponent połączony z tożsamością.

spinora Diraca postrzeganego konkretnie jako przyjmującego wartości w transformacja w ramach transformacji Lorentza przez a macierz zespolona . Istnieją pewne subtelności w definiowaniu odpowiedniego a także

Większość zabiegów odbywa się na poziomie algebry Liego . Bardziej szczegółowe leczenie można znaleźć tutaj . Grupa Lorentza macierzy na generowana przez zestaw sześciu macierzy z komponentami

Kiedy oba wskaźniki są prostu „standardowa podstawa” macierzy

Spełniają one relacje komutacji algebry Lorentza

W artykule na temat algebry Diraca stwierdzono również, że generatory spinowe
spełniają relacje komutacji algebry Lorentza.

Transformację Lorentza zapisać

gdzie składniki są w .

Odpowiednia transformacja w przestrzeni spinowej to

Jest to nadużycie notacji, ale standardowej. Powodem jest to, jest dobrze zdefiniowaną funkcją ponieważ istnieją dwa różne zestawy komponentów (aż do równoważności), które dają to samo, ale różne . W praktyce wybieramy jeden z następnie względem

W przypadku transformacji Lorentza równanie Diraca

staje się
Pozostałość dowodu niezmienniczości Lorentza

Mnożąc obie strony od lewej przez i zwracając zmienną fikcyjną do daje S - 1 [ Λ ]

Pokażemy niezmienniczość, jeśli
lub równoważnie
Najłatwiej to pokazać na poziomie algebry. Zakładając, że transformacje są sparametryzowane przez nieskończenie małe składowe , to w pierwszej kolejności w , po lewej stronie otrzymujemy
natomiast po prawej stronie dostajemy
Jest to standardowe ćwiczenie do oceny komutatora po lewej stronie. Pisanie kończy dowód

Z niezmienniczością Lorentza związany jest zachowany prąd Noether, a raczej tensor zachowanych prądów Noether . Podobnie, ponieważ równanie , istnieje tensor zachowanych prądów Noether , który można zidentyfikować jako tensor energii naprężenia w Prąd Lorentza można zapisać w kategoriach tensora energii naprężenia oprócz tensora reprezentujący wewnętrzny moment pędu.

Rozwój historyczny i dalsze szczegóły matematyczne

teorii mechaniki kwantowej, w której zamiast tego jest interpretowane jako funkcja falowa .

Równanie Diraca w postaci pierwotnie zaproponowanej przez Diraca to:

gdzie ψ ( x , t ) jest funkcją falową dla elektronu o masie spoczynkowej m o współrzędnych czasoprzestrzennych x , t . P operator 1 , p 2 , p 3 to składowe pędu , rozumianego jako pędu w równaniu Schrödingera . Również c to prędkość światła , a ħ to zredukowana stała Plancka . Te podstawowe stałe fizyczne odzwierciedlają odpowiednio szczególną teorię względności i mechanikę kwantową.

Celem Diraca w rzuceniu tego równania było wyjaśnienie zachowania relatywistycznie poruszającego się elektronu, a tym samym umożliwienie traktowania atomu w sposób zgodny z teorią względności. Miał dość skromną nadzieję, że wprowadzone w ten sposób poprawki mogą mieć wpływ na problem widm atomowych .

Do tego czasu próby uzgodnienia starej kwantowej teorii atomu z teorią względności, które opierały się na dyskretyzacji momentu pędu elektronu zmagazynowanego na możliwie niekołowej orbicie jądra atomowego , nie powiodły się – a nowa Mechanika kwantowa Heisenberga , Pauliego , Jordana , Schrödingera i samego Diraca nie rozwinęła się wystarczająco, aby rozwiązać ten problem. Chociaż pierwotne intencje Diraca zostały spełnione, jego równanie miało znacznie głębsze implikacje dla struktury materii i wprowadziło nowe matematyczne klasy obiektów, które są obecnie podstawowymi elementami fizyki fundamentalnej.

Nowymi elementami w tym równaniu są cztery macierze 4 × 4 α 1 , α 2 , α 3 i β oraz czteroskładnikowa funkcja falowa ψ . W ψ są cztery składowe , ponieważ jego ocena w dowolnym punkcie przestrzeni konfiguracyjnej jest bispinorem . Jest interpretowany jako superpozycja elektronu ze spinem , elektronu ze spinem, pozytonu ze spinem i pozytonu ze spinem.

macierze 4 × 4 α k : i β hermitowskie i mimowolne

i wszyscy wzajemnie przeciwdziałają :

Te macierze i postać funkcji falowej mają głębokie znaczenie matematyczne. Struktura algebraiczna reprezentowana przez macierze gamma została stworzona około 50 lat wcześniej przez angielskiego matematyka WK Clifforda . Z kolei idee Clifforda wyłoniły się z prac niemieckiego matematyka Hermanna Grassmanna z połowy XIX wieku w jego Lineare Ausdehnungslehre ( Teoria rozszerzeń liniowych ). Ten ostatni był uważany za prawie niezrozumiały przez większość jemu współczesnych. Pojawienie się czegoś tak pozornie abstrakcyjnego, w tak późnym czasie iw tak bezpośredni sposób fizyczny, jest jednym z najbardziej niezwykłych rozdziałów w historii fizyki. [ potrzebne źródło ]

równania różniczkowe cząstkowe pierwszego rzędu dla czterech wielkości składających się na funkcję falową. Równanie można zapisać dokładniej w jednostkach Plancka jako:

co wyjaśnia, że ​​jest to zestaw czterech równań różniczkowych cząstkowych z czterema nieznanymi funkcjami.

Uczynienie równania Schrödingera relatywistycznym

Równanie Diraca jest powierzchownie podobne do równania Schrödingera dla masywnej cząstki swobodnej :

Lewa strona reprezentuje kwadrat operatora pędu podzielony przez podwójną masę, która jest nierelatywistyczną energią kinetyczną. Ponieważ teoria względności traktuje przestrzeń i czas jako całość, relatywistyczne uogólnienie tego równania wymaga, aby pochodne przestrzeni i czasu były wprowadzane symetrycznie, tak jak ma to miejsce w równaniach Maxwella, które rządzą zachowaniem światła — równania muszą być różniczkowo tego samego rzędu w przestrzeni i czas. W teorii względności pęd i energie są częściami przestrzennymi i czasowymi wektora czasoprzestrzennego, czteropędu i są powiązane relatywistycznie niezmienną relacją

co mówi, że długość tego czterowektora jest proporcjonalna do masy spoczynkowej m . Podstawienie operatorów równoważników energii i pędu z teorii Schrödingera daje równanie Kleina-Gordona opisujące propagację fal, skonstruowane z relatywistycznie niezmiennych obiektów,

gdzie funkcja falowa ϕ jest skalarem relatywistycznym: liczbą zespoloną, która ma tę samą wartość liczbową we wszystkich układach odniesienia. Pochodne przestrzeni i czasu wchodzą do drugiego rzędu. Ma to wymowne konsekwencje dla interpretacji równania. Ponieważ równanie jest drugiego rzędu pochodnej po czasie, aby rozwiązać określone problemy, należy określić wartości początkowe zarówno samej funkcji falowej, jak i jej pierwszej pochodnej po czasie. Ponieważ oba można określić mniej lub bardziej arbitralnie, funkcja falowa nie może zachować swojej dawnej roli określania gęstości prawdopodobieństwa znalezienia elektronu w danym stanie ruchu. W teorii Schrödingera gęstość prawdopodobieństwa jest wyrażona dodatnio określonym wyrażeniem
i ta gęstość jest konwekcyjna zgodnie z wektorem prądu prawdopodobieństwa
z zachowaniem prawdopodobieństwa prądu i gęstości wynikającego z równania ciągłości:

Fakt, że gęstość jest dodatnio określona i konwekcyjna zgodnie z tym równaniem ciągłości, oznacza, że ​​można scałkować gęstość w pewnej dziedzinie i ustawić sumę na 1, a warunek ten zostanie zachowany przez prawo zachowania . Właściwa teoria relatywistyczna z prądem gęstości prawdopodobieństwa również musi mieć tę cechę. Aby utrzymać pojęcie gęstości konwekcyjnej, należy uogólnić wyrażenie Schrödingera dotyczące gęstości i prądu, tak aby pochodne przestrzeni i czasu ponownie wchodziły symetrycznie w stosunku do skalarnej funkcji falowej. Wyrażenie Schrödingera można zachować dla prądu, ale gęstość prawdopodobieństwa należy zastąpić symetrycznie utworzonym wyrażeniem [ potrzebne dalsze wyjaśnienia ]

który teraz staje się czwartą składową wektora czasoprzestrzennego, a całe prawdopodobieństwo 4-prądowej gęstości ma relatywistycznie kowariantne wyrażenie

Równanie ciągłości jest jak poprzednio. Wszystko jest teraz zgodne z teorią względności, ale wyrażenie na gęstość nie jest już dodatnio określone; początkowe wartości zarówno ψ, jak i t ψ mogą być dowolnie wybierane, a gęstość może w ten sposób stać się ujemna, co jest niemożliwe dla uzasadnionej gęstości prawdopodobieństwa. Zatem nie można uzyskać prostego uogólnienia równania Schrödingera przy naiwnym założeniu, że funkcja falowa jest skalarem relatywistycznym, a równanie, które spełnia, jest drugiego rzędu w czasie.

Chociaż nie jest to udane relatywistyczne uogólnienie równania Schrödingera, równanie to zostało wskrzeszone w kontekście kwantowej teorii pola , gdzie jest znane jako równanie Kleina-Gordona i opisuje pole cząstek bez spinu (np. mezon pi lub bozon Higgsa ) . Historycznie rzecz biorąc, sam Schrödinger doszedł do tego równania przed tym, które nosi jego imię, ale wkrótce je odrzucił. W kontekście kwantowej teorii pola przyjmuje się, że nieokreślona gęstość odpowiada gęstości ładunku , która może być dodatnia lub ujemna, a nie gęstości prawdopodobieństwa.

Zamach Diraca

Dirac pomyślał więc o wypróbowaniu równania, które było pierwszego rzędu zarówno w przestrzeni, jak iw czasie. Można na przykład formalnie (tj. przez nadużycie notacji ) przyjąć relatywistyczne wyrażenie na energię

zastąp p jego odpowiednikiem operatora, rozwiń pierwiastek kwadratowy w nieskończonej serii operatorów pochodnych, skonfiguruj problem z wartością własną, a następnie formalnie rozwiąż równanie za pomocą iteracji. Większość fizyków nie wierzyła w taki proces, nawet jeśli byłby on technicznie możliwy.

Jak głosi historia, Dirac wpatrywał się w kominek w Cambridge, rozważając ten problem, kiedy wpadł na pomysł wyciągnięcia pierwiastka kwadratowego z operatora falowego w następujący sposób:

Po wymnożeniu prawej strony widać, że aby wszystkie wyrażenia krzyżowe, takie jak x y , zniknęły, należy założyć, że

z

mechaniki macierzowej Heisenberga , od razu zrozumiał, że te warunki mogą być spełnione, jeśli A , B , C i D macierzami , co implikuje, że funkcja falowa ma wiele składowych . To natychmiast wyjaśniło pojawienie się dwuskładnikowych funkcji falowych w fenomenologicznej teorii spinu Pauliego , coś, co do tej pory było uważane za tajemnicze, nawet dla samego Pauliego. Jednak potrzeba co najmniej 4 × 4, aby skonfigurować system o wymaganych właściwościach - więc funkcja falowa miała cztery składowe, a nie dwa, jak w teorii Pauliego, lub jeden, jak w samej teorii Schrödingera. Czteroskładnikowa funkcja falowa reprezentuje nową klasę obiektów matematycznych w teoriach fizycznych, która pojawia się tutaj po raz pierwszy.

Biorąc pod uwagę rozkład na czynniki w odniesieniu do tych macierzy, można teraz natychmiast zapisać równanie

z do ustalenia. Ponowne zastosowanie operatora macierzowego po obu stronach daje wyniki

Przyjęcie pokazuje wszystkie składowe funkcji falowej spełniają energia-pęd Zatem poszukiwane równanie, które jest pierwszego rzędu zarówno w przestrzeni, jak iw czasie, jest

Ustawienie

a ponieważ Diraca jest

Forma kowariantna i niezmienniczość relatywistyczna

Aby zademonstrować relatywistyczną niezmienniczość równania, korzystne jest przedstawienie go w postaci, w której pochodne przestrzenne i czasowe pojawiają się na równych prawach. Nowe macierze są wprowadzane w następujący sposób:

a równanie przyjmuje postać (pamiętając definicję kowariantnych składowych 4-gradientu , a zwłaszcza, że 0 ​​∂ = 1 / c t )
Równanie Diraca

gdzie istnieje dorozumiane sumowanie wartości dwukrotnie powtórzonego indeksu μ = 0, 1, 2, 3 , a μ to gradient 4. W praktyce macierze gamma często zapisuje się w postaci podmacierzy 2 × 2 wziętych z macierzy Pauliego i macierzy tożsamości 2 × 2 . Wyraźnie jest to standardowa reprezentacja

Cały system podsumowano za pomocą metryki Minkowskiego dotyczącej czasoprzestrzeni w postaci

gdzie wyrażenie nawiasowe
oznacza antykomutator . Są to definiujące relacje algebry Clifforda w czterowymiarowej przestrzeni pseudoortogonalnej z sygnaturą metryczną (+ − − −) . Specyficzna algebra Clifforda zastosowana w równaniu Diraca jest dziś znana jako algebra Diraca . Chociaż Dirac nie uznał tego za takie w czasie formułowania równania, z perspektywy czasu wprowadzenie tej algebry geometrycznej stanowi ogromny krok naprzód w rozwoju teorii kwantowej.

Równanie Diraca można teraz interpretować jako równanie wartości własnej , w którym masa spoczynkowa jest proporcjonalna do wartości własnej operatora 4-pędowego , przy czym stałą proporcjonalności jest prędkość światła:

za ( , zgodnie z notacją ukośną Feynmana, równanie Diraca przyjmuje postać:

W praktyce fizycy często używają takich jednostek miary, że ħ = c = 1 , znanych jako jednostki naturalne . Równanie przyjmuje wtedy prostą postać

Równanie Diraca (jednostki naturalne)

Podstawowe twierdzenie mówi, że jeśli dane są dwa różne zestawy macierzy, które spełniają relacje Clifforda , to są one połączone ze sobą transformacją podobieństwa :

Jeśli dodatkowo wszystkie macierze są unitarne , tak jak zbiór Diraca, to samo S jest unitarne ;

Transformacja U jest jednoznaczna aż do mnożnika o wartości bezwzględnej 1. Wyobraźmy sobie teraz, że transformacja Lorentza została przeprowadzona na współrzędnych przestrzennych i czasowych oraz na operatorach pochodnych, które tworzą wektor kowariantny. Aby operator γ μ μ pozostał niezmienny, gammy muszą przekształcać się między sobą jako wektor kontrawariantny w odniesieniu do ich indeksu czasoprzestrzennego. Te nowe gammy same spełnią relacje Clifforda ze względu na ortogonalność transformacji Lorentza. Zgodnie z fundamentalnym twierdzeniem nowy zbiór można zastąpić starym zbiorem podlegającym jednostkowej transformacji. W nowym układzie, pamiętając, że masa spoczynkowa jest skalarem relatywistycznym, równanie Diraca przyjmie postać

Jeśli przekształcony spinor jest zdefiniowany jako

następnie przekształcone równanie Diraca jest tworzone w sposób demonstrujący oczywistą relatywistyczną niezmienniczość :

Tak więc ustalenie jakiejkolwiek jednolitej reprezentacji gamma jest ostateczne, pod warunkiem, że spinor zostanie przekształcony zgodnie z jednostkową transformacją, która odpowiada danej transformacji Lorentza.

Różne reprezentacje zastosowanych macierzy Diraca zwrócą uwagę na poszczególne aspekty fizycznej zawartości funkcji falowej Diraca. Przedstawiona tutaj reprezentacja jest znana jako standardowa - w niej dwie górne składowe funkcji falowej przechodzą do funkcji fali spinorowej Pauliego 2 w granicy niskich energii i małych prędkości w porównaniu ze światłem.

Powyższe rozważania ujawniają pochodzenie gamma w geometrii , nawiązując do pierwotnej motywacji Grassmanna; reprezentują stałą podstawę wektorów jednostkowych w czasoprzestrzeni. Podobnie produkty gamma, takie jak γ μ γ ν , reprezentują zorientowane elementy powierzchniowe i tak dalej. Mając to na uwadze, można znaleźć postać elementu objętości jednostkowej w czasoprzestrzeni pod względem gamma w następujący sposób. Z definicji jest

Aby to było niezmiennikiem, symbol epsilon musi być tensorem , a więc musi zawierać współczynnik g , gdzie g jest wyznacznikiem tensora metrycznego . Ponieważ to jest ujemne, ten czynnik jest urojony . Zatem

Macierz ta otrzymuje specjalny symbol γ 5 , ze względu na jej znaczenie przy rozważaniu niewłaściwych transformacji czasoprzestrzeni, czyli takich, które zmieniają orientację wektorów bazowych. W reprezentacji standardowej tak jest

Ta macierz okaże się również przeciwdziałać komutacji z pozostałymi czterema macierzami Diraca:

Zajmuje wiodącą rolę, gdy pojawiają się kwestie parzystości , ponieważ element objętości jako ukierunkowana wielkość zmienia znak pod wpływem odbicia czasoprzestrzennego. Wzięcie dodatniego pierwiastka kwadratowego z powyższego równa się zatem wybraniu konwencji ręczności w czasoprzestrzeni.

Porównanie z pokrewnymi teoriami

Teoria Pauliego

spinu półcałkowitego sięga eksperymentalnie wyników eksperymentu Sterna-Gerlacha . Wiązka atomów jest przepuszczana przez silne niejednorodne pole magnetyczne , które następnie rozdziela się na N części w zależności od wewnętrznego momentu pędu atomów. Stwierdzono, że w przypadku srebra wiązka została podzielona na dwie części; stan podstawowy nie mógłby zatem być liczbą całkowitą , ponieważ nawet gdyby wewnętrzny moment pędu atomów był tak mały, jak to możliwe, 1, wiązka zostałaby podzielona na trzy części, odpowiadające atomom o L z = −1, 0, +1 . Wniosek jest taki, że atomy srebra mają wypadkowy wewnętrzny moment pędu równy 1 2 . Pauli stworzył teorię, która wyjaśniła to rozszczepienie, wprowadzając dwuskładnikową funkcję falową i odpowiadający jej składnik korygujący do hamiltonianu , reprezentujący półklasyczne sprzężenie tej funkcji falowej z przyłożonym polem magnetycznym, tak jak w jednostkach SI : (Uwaga że pogrubione znaki oznaczają wektory euklidesowe w 3 wymiarach , podczas gdy czterowektor Minkowskiego A μ można zdefiniować jako .)

Tutaj A i składowe czteropotencjału elektromagnetycznego w ich standardowych jednostkach SI, a trzy sigma to Pauliego . Po wyrównywaniu pierwszego członu znajduje się szczątkowe oddziaływanie z polem magnetycznym, wraz ze zwykłym klasycznym hamiltonianem naładowanej cząstki oddziałującej z przyłożonym polem w jednostkach SI :

Ten hamiltonian jest teraz macierzą 2 × 2 , więc oparte na nim równanie Schrödingera musi wykorzystywać dwuskładnikową funkcję falową. Po wprowadzeniu zewnętrznego czterowektorowego potencjału elektromagnetycznego do równania Diraca w podobny sposób, znany jako minimalne sprzężenie , przyjmuje on postać:

Drugie zastosowanie operatora Diraca odtworzy teraz termin Pauliego dokładnie tak, jak poprzednio, ponieważ przestrzenne macierze Diraca pomnożone przez i mają takie same właściwości podniesienia do kwadratu i komutacji jak macierze Pauliego. Co więcej, wartość stosunku żyromagnetycznego elektronu, stojąca przed nowym wyrazem Pauliego, jest wyjaśniona od podstaw. Było to główne osiągnięcie równania Diraca i dało fizykom wielką wiarę w jego ogólną poprawność. Jest jednak więcej. Teorię Pauliego można postrzegać jako dolną granicę energii teorii Diraca w następujący sposób. Najpierw równanie jest zapisywane w postaci sprzężonych równań dla 2-spinorów z przywróconymi jednostkami SI:

Więc

Zakładając, że pole jest słabe, a ruch elektronu nierelatywistyczny, całkowita energia elektronu jest w przybliżeniu równa jego energii spoczynkowej , a pęd przechodzi do wartości klasycznej,

i tak można zapisać drugie równanie

który jest rzędu v / c - więc przy typowych energiach i prędkościach dolne składowe spinora Diraca w standardowej reprezentacji są znacznie stłumione w porównaniu z górnymi składowymi. Podstawienie tego wyrażenia do pierwszego równania daje po pewnym przegrupowaniu

Operator po lewej reprezentuje energię cząstki pomniejszoną o jej energię spoczynkową, która jest po prostu energią klasyczną, więc można odzyskać teorię Pauliego po zidentyfikowaniu jego 2-spinora z górnymi składowymi spinora Diraca w przybliżeniu nierelatywistycznym. Dalsze przybliżenie daje równanie Schrödingera jako granicę teorii Pauliego. Zatem równanie Schrödingera można postrzegać jako dalekie od relatywizmu przybliżenie równania Diraca, gdy można pominąć spin i pracować tylko przy niskich energiach i prędkościach. Było to również wielkim triumfem nowego równania, ponieważ wyśledziło tajemnicze i , które się w nim pojawia, oraz konieczność złożonej funkcji falowej, z powrotem do geometrii czasoprzestrzeni poprzez algebrę Diraca. Podkreśla również, dlaczego równanie Schrödingera, choć powierzchownie w postaci równania dyfuzji , w rzeczywistości przedstawia propagację fal.

Należy mocno podkreślić, że ten podział spinora Diraca na składowe duże i małe zależy wyraźnie od przybliżenia niskoenergetycznego. Cały spinor Diraca reprezentuje nieredukowalną całość, a składniki pominięte tutaj, aby dojść do teorii Pauliego, wniosą nowe zjawiska w reżimie relatywistycznym – antymaterię oraz ideę tworzenia i anihilacji cząstek.

Teoria Weyla

W przypadku bezmasowym sprowadza się do równania Weyla , które opisuje relatywistyczne bezmasowe cząstki o spinie 1 / 2

Teoria uzyskuje :

Interpretacja fizyczna

Identyfikacja obserwabli

Krytyczne fizyczne pytanie w teorii kwantowej brzmi: jakie są fizycznie obserwowalne wielkości określone przez teorię? Zgodnie z postulatami mechaniki kwantowej, takie wielkości są definiowane przez operatory hermitowskie , które działają w przestrzeni Hilberta możliwych stanów układu. Wartości własne tych operatorów są zatem możliwymi wynikami pomiaru odpowiedniej wielkości fizycznej. W teorii Schrödingera najprostszym takim obiektem jest całkowity hamiltonian, który reprezentuje całkowitą energię układu. Aby utrzymać tę interpretację po przejściu do teorii Diraca, należy przyjąć, że jest hamiltonian

gdzie, jak zawsze, istnieje domniemane sumowanie po dwukrotnie powtórzonym indeksie k = 1, 2, 3 . Wygląda to obiecująco, ponieważ można sprawdzić energię spoczynkową cząstki, aw przypadku A = 0 energię ładunku umieszczonego w potencjale elektrycznym cqA 0 . A co z terminem obejmującym potencjał wektorowy? W elektrodynamice klasycznej energia ładunku poruszającego się w przyłożonym potencjale wynosi

Tak więc hamiltonian Diraca różni się zasadniczo od swojego klasycznego odpowiednika i należy bardzo uważać, aby poprawnie zidentyfikować to, co jest obserwowalne w tej teorii. Wiele pozornie paradoksalnych zachowań implikowanych przez równanie Diraca sprowadza się do błędnej identyfikacji tych obserwabli. [ potrzebne źródło ]

Teoria dziury

Ujemne rozwiązania E równania są problematyczne, ponieważ założono, że cząstka ma energię dodatnią. Z matematycznego punktu widzenia wydaje się jednak, że nie ma powodu, abyśmy odrzucali rozwiązania o ujemnej energii. Ponieważ istnieją, nie można ich po prostu zignorować, ponieważ po uwzględnieniu interakcji między elektronem a polem elektromagnetycznym każdy elektron umieszczony w stanie własnym o dodatniej energii rozpadłby się na stany własne o energii ujemnej o kolejno niższej energii. Rzeczywiste elektrony oczywiście nie zachowują się w ten sposób, inaczej zniknęłyby emitując energię w postaci fotonów .

Aby poradzić sobie z tym problemem, Dirac przedstawił hipotezę, znaną jako teoria dziur , że próżnia jest wielociałowym stanem kwantowym, w którym zajęte są wszystkie stany własne elektronów o ujemnej energii. Ten opis próżni jako „morza” elektronów nazywa się morzem Diraca . Ponieważ zasada wykluczenia Pauliego zabrania elektronom zajmowania tego samego stanu, każdy dodatkowy elektron byłby zmuszony zajmować stan własny o dodatniej energii, a elektrony o dodatniej energii nie mogłyby rozpadać się na stany własne o ujemnej energii.

Jeśli elektronowi nie wolno jednocześnie zajmować stanów własnych o energii dodatniej i ujemnej, wówczas cecha znana jako Zitterbewegung , która powstaje w wyniku interferencji stanów o energii dodatniej i ujemnej, musiałaby być uważana za niefizyczną prognozę zależna od czasu teoria Diraca. Wniosek ten można wywnioskować z wyjaśnienia teorii dziur podanego w poprzednim akapicie. Ostatnie wyniki zostały opublikowane w Nature [R. Gerritsma, G. Kirchmair, F. Zaehringer, E. Solano, R. Blatt i C. Roos, Nature 463, 68-71 (2010)], w którym symulowano funkcję Zitterbewegung w eksperymencie z uwięzionym jonem. Eksperyment ten wpływa na interpretację dziury, jeśli wywnioskujemy, że eksperyment fizyko-laboratoryjny nie jest jedynie sprawdzeniem poprawności matematycznej rozwiązania równania Diraca, ale pomiarem rzeczywistego efektu, którego wykrywalność w fizyce elektronów jest wciąż poza zasięgiem.

Dirac dalej rozumował, że jeśli stany własne o ujemnej energii są niecałkowicie wypełnione, każdy niezajęty stan własny - zwany dziurą - zachowywałby się jak dodatnio naładowana cząstka. Dziura ma dodatnią energię, ponieważ energia jest potrzebna do wytworzenia pary cząstka-dziura z próżni. Jak wspomniano powyżej, Dirac początkowo myślał, że dziura może być protonem, ale Hermann Weyl zwrócił uwagę, że dziura powinna zachowywać się tak, jakby miała taką samą masę jak elektron, podczas gdy proton jest ponad 1800 razy cięższy. Dziura została ostatecznie zidentyfikowana jako pozyton , odkryty eksperymentalnie przez Carla Andersona w 1932 roku.

Opisanie „próżni” za pomocą nieskończonego morza elektronów o ujemnej energii nie jest całkowicie satysfakcjonujące. Nieskończenie ujemny wkład z morza elektronów o ujemnej energii musi zostać zniesiony przez nieskończoną dodatnią „nagą” energię, a udział w gęstości ładunku i prądzie pochodzącym z morza elektronów o ujemnej energii jest dokładnie zniesiony przez nieskończoną dodatnią „ jellium ” tak, że wypadkowa gęstość ładunku elektrycznego próżni wynosi zero. W kwantowej teorii pola transformacja Bogoliubowa na operatorach kreacji i anihilacji (przekształcenie zajętego stanu elektronu o ujemnej energii w niezajęty stan pozytonu o dodatniej energii i niezajętego stanu elektronu o ujemnej energii w zajęty stan pozytonu o dodatniej energii) pozwala nam ominąć formalizm morski Diraca, chociaż formalnie jest z nim równoważny.

w niektórych zastosowaniach fizyki materii skondensowanej podstawowe koncepcje „teorii dziur” są ważne. Morze elektronów przewodzących w przewodniku elektrycznym , zwane morzem Fermiego , zawiera elektrony o energiach dochodzących do potencjału chemicznego układu. Niewypełniony stan w morzu Fermiego zachowuje się jak dodatnio naładowany elektron, chociaż jest określany raczej jako „dziura” niż „pozyton”. Ujemny ładunek morza Fermiego jest równoważony przez dodatnio naładowaną sieć jonową materiału.

W kwantowej teorii pola

W kwantowych teoriach pola, takich jak elektrodynamika kwantowa , pole Diraca podlega procesowi drugiej kwantyzacji , który rozwiązuje niektóre paradoksalne cechy równania.

Dalsze omówienie kowariancji Lorentza równania Diraca

Równanie Diraca jest kowariantem Lorentza . Wyartykułowanie tego pomaga wyjaśnić nie tylko równanie Diraca, ale także Majorany i spinor Elko, które chociaż są blisko spokrewnione, mają subtelne i ważne różnice.

Zrozumienie kowariancji Lorentza jest uproszczone, pamiętając o geometrycznym charakterze procesu. Niech w rozmaitości czasoprzestrzennej . Jego położenie można wyrazić w wielu układach współrzędnych . W literaturze fizyki są one zapisywane jako i przy założeniu, że zarówno jak i ten sam punkt , ale w różnych lokalnych układach odniesienia ( układ odniesienia na małym rozszerzonym skrawku czasoprzestrzeni). Można sobie wyobrazić, ma nad sobą włókno o różnych układach współrzędnych. W kategoriach geometrycznych mówi się, że czasoprzestrzeń można scharakteryzować jako wiązkę włókien , a konkretnie wiązkę ramek . Różnica między dwoma punktami tym kombinacją obrotów i Lorentza . Wybór układu współrzędnych to (lokalny) przekrój przez tę wiązkę.

Z wiązką ramek połączona jest druga wiązka, wiązka spinorowa . Przekrój przez wiązkę spinorową to po prostu pole cząstek (w tym przypadku spinor Diraca). Różne punkty we włóknie spinorowym odpowiadają temu samemu obiektowi fizycznemu (fermionowi), ale wyrażonemu w różnych układach Lorentza. Oczywiście wiązka ramek i wiązka spinorów muszą być ze sobą powiązane w spójny sposób, aby uzyskać spójne wyniki; formalnie mówi się, że wiązka spinorowa jest wiązką powiązaną ; jest on powiązany z wiązką główną , którą w tym przypadku jest wiązka ramek. Różnice między punktami na światłowodzie odpowiadają symetrii układu. Wiązka spinorów ma dwa różne generatory swoich symetrii: całkowity moment pędu i wewnętrzny moment pędu . Oba odpowiadają transformacjom Lorentza, ale na różne sposoby.

Prezentacja tutaj jest następująca po prezentacji Itzyksona i Zubera. Jest prawie identyczny z Bjorkenem i Drellem. Podobne wyprowadzenie w ogólnych warunkach relatywistycznych można znaleźć u Weinberga. Tutaj ustalamy, że nasza czasoprzestrzeń jest płaska, to znaczy, że nasza czasoprzestrzeń jest przestrzenią Minkowskiego.

W ramach transformacji Lorentza spinor Diraca do przekształcenia jako

Można pokazać, że wyraźne wyrażenie dla jest podane przez
gdzie parametryzuje transformację Lorentza, a sześć macierzy 4 × 4 spełniających:

Tę macierz można interpretować jako wewnętrzny moment pędu pola Diraca. To, że zasługuje na taką interpretację, wynika z przeciwstawienia go generatorowi przekształceń Lorentza , mającym postać

Można to interpretować jako całkowity moment pędu . Działa na pole spinorowe jako
Zauważ, że ma liczby pierwszej: powyższe uzyskuje się przez przekształcenie, na a następnie powrót do pierwotnego układu współrzędnych .

Geometryczna interpretacja powyższego jest taka, że ​​pole ramki jest afiniczne i nie ma preferowanego pochodzenia. Generator punktu generuje ruch z jednego punktu : ruch od przy czym zarówno jak i nadal odpowiadają temu samemu punktowi czasoprzestrzeni Te być może tępe uwagi można wyjaśnić za pomocą jawnej algebry.

Niech będzie transformacją Lorentza. Równanie Diraca jest

Jeśli równanie Diraca ma być kowariantne, to powinno mieć dokładnie taką samą postać we wszystkich układach Lorentza:
Oba spinory powinny transformacją, która nie zmienia żadnych fizycznych obserwowalnych elementów ( prąd, masa itp. ) Transformacja powinna obejmować tylko zmianę układu współrzędnych. Można pokazać, że taka transformacja jest macierzą unitarną 4×4 . Można zatem przypuszczać, że relację między tymi dwiema ramkami można zapisać jako
Wstawiając to do przekształconego równania, otrzymujemy wynik
Współrzędne powiązane transformacją Lorentza spełniają:
Oryginalne równanie Diraca jest następnie przywracane, jeśli
Wyraźne wyrażenie dla (równe wyrażeniu podanemu powyżej) można uzyskać, rozważając transformację Lorentza nieskończenie małej rotacji w pobliżu transformacji tożsamości:
gdzie jest tensorem metrycznym : gdy . Po podłączeniu i ssaniu uzyskuje się
) formą dla i daje relację . Aby uzyskać ponowne oznakowanie afiniczne, napisz

Po odpowiedniej otrzymujemy generator symetrii zarówno „generatorami przekształceń Lorentza”, jak i subtelne rozróżnienie: pierwsze odpowiada ponownemu oznakowaniu punktów na wiązce ramek afinicznych , co wymusza translację wzdłuż włókna spinora na wiązce spinowej , podczas gdy drugie odpowiada translacji wzdłuż włókna wiązki spinowej (branej jako ruch wzdłuż wiązki ramek, a także ruch spinowej.) Weinberg zapewnia argumenty przemawiające za fizyczną interpretacją ich jako całkowitego i wewnętrznego momentu pędu.

Inne preparaty

Równanie Diraca można sformułować na wiele innych sposobów.

Zakrzywiona czasoprzestrzeń

W tym artykule opracowano równanie Diraca w płaskiej czasoprzestrzeni zgodnie ze szczególną teorią względności. Możliwe jest sformułowanie równania Diraca w zakrzywionej czasoprzestrzeni .

Algebra przestrzeni fizycznej

W tym artykule opracowano równanie Diraca przy użyciu czterech wektorów i operatorów Schrödingera. Równanie Diraca w algebrze przestrzeni fizycznej wykorzystuje algebrę Clifforda na liczbach rzeczywistych, rodzaj algebry geometrycznej.

Symetria U(1).

W tej sekcji używane są jednostki naturalne. Stała sprzężenia jest umownie oznaczona jako parametr można również postrzegać jako modelujący ładunek elektronu.

Symetria wektora

Równanie i działanie Diraca dopuszcza , w której pola przekształcają jako

Jest to globalna symetria, znana jako symetria wektorowa (w przeciwieństwie do symetrii ( osiowa : patrz poniżej). Zgodnie z twierdzeniem Noether istnieje odpowiedni zachowany prąd: zostało to wspomniane wcześniej jako

Pomiar symetrii

Jeśli „promujemy” globalną symetrię, sparametryzowaną przez stałą do symetrii lokalnej, sparametryzowanej przez funkcję lub równoważnie mi równanie Diraca nie jest już niezmienne: istnieje pochodna resztkowa .

Poprawka przebiega jak w elektrodynamice skalarnej : pochodna cząstkowa jest promowana do pochodnej kowariantnej

Pochodna kowariantna zależy od pola, na którym działa. Nowo wprowadzony , ale można go również postrzegać jako pole miernika. lub połączenie .

Prawo transformacji w ramach przekształceń cechowania dla zwykłe

ale można go również wyprowadzić, prosząc, aby pochodne kowariantne przekształciły się pod wpływem transformacji cechowania jako
Następnie uzyskujemy działanie Diraca niezmienne względem cechowania, promując pochodną cząstkową do kowariantnej:
Ostatnim krokiem potrzebnym do zapisania Lagrange'a niezmiennego z cechowaniem jest dodanie terminu Lagrange'a Maxwella,
Połączenie tego daje
Akcja QED

Rozszerzenie pochodnej kowariantnej pozwala na zapisanie działania w drugiej użytecznej postaci:

Symetria osiowa

Bezmasowe fermiony Diraca czyli pola spełniające równanie Diraca z drugi, równoważny symetria.

Najłatwiej można to zobaczyć, zapisując czteroskładnikowy fermion Diraca jako parę dwuskładnikowych pól wektorowych,

i przyjęcie chiralnej reprezentacji macierzy gamma, tak że można zapisać
gdzie ma składniki i ma składniki .

Akcja Diraca przybiera wtedy formę

Oznacza to, że rozprzęga się w teorię dwóch spinorów Weyla lub fermionów Weyla.

Wcześniejsza symetria wektorów jest nadal obracają identycznie Ta forma działania sprawia, że ​​​​drugi nierównoważny manifest symetrii:

Można to również wyrazić na poziomie fermionu Diraca jako
gdzie jest mapą wykładniczą dla macierzy.

To nie jedyna jest Każda wektorowej i osiowej jest

Klasycznie symetria osiowa dopuszcza dobrze sformułowaną teorię cechowania. Ale na poziomie kwantowym istnieje anomalia , to znaczy przeszkoda w pomiarze.

Rozszerzenie symetrii kolorów

Możemy rozszerzyć tę dyskusję od symetrii abelowej nieabelowej w cechowania grupie kolorów dla teorii.

Dla konkretności ustalamy specjalną unitarną grupę macierzy działającą na .

Przed tą sekcją można było postrzegać jako pole spinorowe w przestrzeni Minkowskiego, innymi słowy funkcję a jego składniki w są oznaczone indeksami spinowymi, konwencjonalnymi indeksami greckimi wzięte z początku alfabetu .

Promując teorię do teorii cechowania, nieformalnie uzyskuje część przekształcającą się jak , a te są oznaczone indeksami kolorów, konwencjonalnie indeksami łacińskimi . W sumie ma składniki, podane w indeksach przez . „Spinor” określa jedynie sposób, w jaki pole zmienia się pod wpływem transformacji czasoprzestrzeni.

Formalnie funkcją

Pomiar przebiega podobnie do , z Pod transformacją cechowania pola spinorowe przekształcają się Jak

miernika o wartościach połączenie przekształca się jako
i zdefiniowane pochodne kowariantne
przekształcić jako

Zapisywanie działania niezmiennego z cechowaniem przebiega dokładnie tak, jak w Maxwella Lagrange'em Yanga - Millsa

gdzie siła lub krzywizna pola Yanga-Millsa jest tutaj zdefiniowana jako
i _

Akcja jest wtedy

Akcja QCD

Aplikacje fizyczne

przypadku zastosowań fizycznych przypadek opisuje sektor kwarków modelu standardowego modeluje silne Kwarki są modelowane jako spinory Diraca; pole cechowania jest gluonowym . Przypadek opisuje część . Leptony, takie jak elektrony i neutrina, są spinorami Diraca; pole miernika to .

Uogólnienia

wyrażenie można uogólnić na dowolną grupę Liego i ρ sol , gdzie część koloru jest wyceniana w . displaystyle Formalnie pole Diraca jest funkcją

Następnie przekształca się pod transformacją miernika jako ψ {\ Displaystyle \ psi}

a pochodna kowariantna jest zdefiniowana
gdzie tutaj postrzegamy jako reprezentację algebry Liego algebry Liego z .

Teorię tę można uogólnić na zakrzywioną czasoprzestrzeń, ale istnieją subtelności, które pojawiają się w teorii cechowania na ogólnej czasoprzestrzeni (lub bardziej ogólnie na rozmaitości), które w płaskiej czasoprzestrzeni można zignorować. Jest to ostatecznie spowodowane kurczliwością płaskiej nam zobaczyć pole cechowania i przekształcenia cechowania na

Zobacz też

Cytaty

Wybrane artykuły

Podręczniki

Linki zewnętrzne