Niezbędna matryca

W wizji komputerowej macierzą jest macierz , która łączy punkty w stereo , że kamery spełniają model kamery otworkowej

Funkcjonować

Dokładniej, jeśli jednorodnymi znormalizowanymi współrzędnymi obrazu odpowiednio na obrazie 1 i 2, to \

jeśli odpowiadają temu samemu punktowi

Powyższa relacja definiująca macierz esencjalną została opublikowana w 1981 roku przez H. Christophera Longueta-Higginsa , wprowadzając tę ​​koncepcję do społeczności zajmującej się wizją komputerową. Książka Richarda Hartleya i Andrew Zissermana donosi, że analogiczna matryca pojawiła się w fotogrametrii na długo przedtem. Artykuł Longueta-Higginsa zawiera algorytm szacowania obrazu, a także algorytm określania względnego położenia i orientacji dwóch kamer, biorąc pod uwagę, że jest znany. Na koniec pokazuje, w jaki sposób można określić współrzędne 3D punktów obrazu za pomocą podstawowej macierzy.

Używać

macierz można postrzegać prekursor macierzy podstawowej Obie macierze mogą być używane do ustalania ograniczeń między pasującymi punktami obrazu, ale podstawowa macierz może być używana tylko w odniesieniu do skalibrowanych kamer, ponieważ wewnętrzne parametry kamery (macierze i K {\ displaystyle \ mathbf {K}} ) musi być znany, aby osiągnąć normalizację. Jeśli jednak kamery są skalibrowane, podstawowa macierz może być użyteczna do określenia zarówno względnego położenia i orientacji między kamerami, jak i położenia 3D odpowiednich punktów obrazu. Podstawowa macierz jest powiązana z podstawową macierzą za pomocą

Wyprowadzenie i definicja

To wyprowadzenie jest zgodne z artykułem Longueta-Higginsa.

Dwie znormalizowane kamery wyświetlają świat 3D na odpowiednich płaszczyznach obrazu. Niech współrzędne 3D punktu P. będą i kamery. Ponieważ kamery są znormalizowane, odpowiednie współrzędne obrazu są

i

Jednorodna reprezentacja dwóch współrzędnych obrazu jest następnie dana przez

i

co również można zapisać bardziej zwięźle jako

i

gdzie jednorodnymi reprezentacjami współrzędnych obrazu 2D i } i ale w dwóch różnych układach

Inną konsekwencją znormalizowanych kamer jest to, że ich odpowiednie układy współrzędnych są powiązane za pomocą translacji i obrotu. Oznacza to, że dwa zestawy współrzędnych 3D są powiązane jako

gdzie jest trójwymiarowym _

Podstawowa macierz jest wtedy definiowana jako:

gdzie macierzową reprezentacją iloczynu krzyżowego } } Uwaga: Tutaj przekształcenie przekształci punkty w 2.

Dla definicji interesują nas tylko orientacje znormalizowanych współrzędnych obrazu (Zobacz też: ) . W związku z tym nie potrzebujemy komponentu translacyjnego podczas zastępowania współrzędnych obrazu w podstawowym równaniu. Aby zobaczyć, że ta definicja ograniczenie dotyczące odpowiednich współrzędnych obrazu, pomnóż lewej i prawej strony przez współrzędne 3D punktu P dwóch różnych współrzędnych systemy:


  1. Wstaw powyższe relacje między i a definicją mi w kategoriach i .
  2. ponieważ jest macierzą rotacji.
  3. Własności reprezentacji macierzowej iloczynu krzyżowego .

Na koniec można założyć, że oba i x razie nie są widoczne w obu aparatach. To daje

czyli ograniczenie, które definiuje podstawowa macierz między odpowiednimi punktami obrazu.

Nieruchomości

Nie każda dowolna dla niektórych kamer stereo Aby zobaczyć tę uwagę, należy zauważyć, że jest ona zdefiniowana jako iloczyn macierzowy jednej macierzy rotacji i jednej macierzy skośno-symetrycznej , obie . Macierz skośno-symetryczna musi mieć dwie wartości osobliwe , które są równe, i jedną, która jest zerowa. Mnożenie macierzy rotacji nie zmienia wartości osobliwych, co oznacza, że ​​również macierz esencjalna ma dwie wartości osobliwe, które są równe, i jedną, która jest równa zeru. Opisane tutaj właściwości są czasami określane jako wewnętrzne ograniczenia podstawowej macierzy.

Jeśli podstawowa macierz przez niezerowy skalar, wynikiem jest ponownie podstawowa macierz, która definiuje dokładnie to samo ograniczenie, . Oznacza to, że można postrzegać jako element przestrzeni rzutowej to znaczy dwie takie macierze są uważane za równoważne, jeśli jedna jest niezerowym skalarnym pomnożeniem drugiej Jest to odpowiednia pozycja, na przykład, jeśli szacowana na podstawie danych obrazu Jednak możliwe jest również przyjęcie stanowiska, że ​​jest zdefiniowany jako

gdzie , a następnie ma dobrze zdefiniowany "skalowanie". To zależy od aplikacji, która pozycja jest bardziej odpowiednia.

Ograniczenia można również wyrazić jako

I

Tutaj ostatnie równanie jest ograniczeniem macierzowym, które można postrzegać jako 9 ograniczeń, po jednym dla każdego elementu macierzy. Więzy te są często używane do określania podstawowej macierzy na podstawie pięciu odpowiednich par punktów.

Podstawowa matryca ma pięć lub sześć stopni swobody, w zależności od tego, czy jest postrzegana jako element rzutowy. Macierz rotacji translacji mają trzy stopnie swobody, w sumie sześć Jeśli jednak esencjalna macierz jest traktowana jako element rzutowy, należy odjąć jeden stopień swobody związany z mnożeniem przez skalar, pozostawiając w sumie pięć stopni swobody.

Oszacowanie

Mając zestaw odpowiednich punktów obrazu, można oszacować podstawową macierz, która spełnia definiujące ograniczenie epipolarne dla wszystkich punktów w zestawie. Jeśli jednak punkty obrazu podlegają szumowi, co jest częstym przypadkiem w każdej praktycznej sytuacji, nie jest możliwe znalezienie istotnej macierzy, która dokładnie spełnia wszystkie ograniczenia.

W zależności od tego, jak mierzony jest błąd związany z każdym ograniczeniem, możliwe jest wyznaczenie lub oszacowanie istotnej macierzy, która optymalnie spełnia ograniczenia dla danego zestawu odpowiednich punktów obrazu. Najprostszym podejściem jest utworzenie najmniejszych kwadratów , powszechnie znanego jako algorytm ośmiopunktowy .

Ekstrakcja rotacji i translacji

Biorąc pod uwagę, że podstawowa macierz została określona dla pary kamer stereo - na przykład przy użyciu powyższej metody szacowania - informacje te można wykorzystać do określenia również obrotu i translacji (do skalowania) między układami współrzędnych dwóch kamer. W tych wyprowadzeniach a nie mający dobrze określoną skalę.

Znalezienie jednego rozwiązania

Poniższa metoda określania się wykonaniu , Hartleya i Zissermana . Możliwe jest również określenie i SVD, na przykład zgodnie z artykułem Longueta

Daje SVD z

gdzie \ macierzami ortogonalnymi U przekątna macierz z

Wpisy ukośne są wartościami osobliwymi , które zgodnie z wewnętrznymi ograniczeniami podstawowej macierzy muszą składać się z dwóch identycznych i jednego zera wartość. Definiować

z

i zrób następujący ansatz

Ponieważ może nie spełniać całkowicie ograniczeń w przypadku danych ze świata rzeczywistego (np. Obrazy z kamery)

z

może pomóc.

Dowód

Po pierwsze, te wyrażenia dla i spełniają równanie definiujące podstawową macierz R {\ displaystyle \ mathbf {R}

Po drugie, należy pokazać, że to reprezentacją iloczynu krzyżowego dla pewnego . Od

jest tak, że skośno-symetryczny, tj. . Dotyczy to również naszego , ponieważ

Zgodnie z ogólnymi właściwościami reprezentacji macierzowej iloczynu krzyżowego zatem, że musi być operatorem iloczynu krzyżowego dokładnie jednego wektora .

Po trzecie, należy również wykazać, że powyższe wyrażenie dla rotacji. Jest to iloczyn trzech macierzy, z których wszystkie są ortogonalne, co oznacza , że ​​również jest ortogonalna lub . Aby być właściwą macierzą rotacji, musi również spełniać . Ponieważ w tym przypadku znaku, konieczne.

Znalezienie wszystkich rozwiązań

Jak dotąd ustalono jedno możliwe rozwiązanie dla i R {\ displaystyle \ mathbf { Nie jest to jednak jedyne możliwe rozwiązanie i może nawet nie być rozwiązaniem prawidłowym z praktycznego punktu widzenia. pierwsze, ponieważ skalowanie , skalowanie jest również . Od tego czasu w przestrzeni zerowej

Jednak dla późniejszej analizy rozwiązań dokładne skalowanie tak ważne, jak jego „znak”, tj. W jakim kierunku wskazuje. Niech będzie wektorem znormalizowanym w przestrzeni zerowej . Jest więc tak, że zarówno jak i są poprawnymi wektorami translacji względnymi . Możliwa również zmiana w i W powyżej. Dla wektora translacji powoduje to jedynie zmianę znaku, co zostało już opisane jako możliwość. Z drugiej strony w przypadku rotacji spowoduje to inną transformację, przynajmniej w ogólnym przypadku.

Podsumowując, biorąc pod uwagę, istnieją dwa przeciwne kierunki, które są możliwe dla które są zgodne z tą podstawową matrycą. W sumie daje to cztery klasy rozwiązań dla obrotu i translacji między dwoma układami współrzędnych kamery. Ponadto istnieje również nieznane skalowanie kierunku tłumaczenia

Okazuje się jednak, że tylko jedna z czterech klas rozwiązań może być zrealizowana w praktyce. Biorąc pod uwagę parę odpowiednich współrzędnych obrazu, trzy rozwiązania zawsze utworzą punkt 3D, który znajduje się za co najmniej jedną z dwóch kamer i dlatego nie można go zobaczyć. Tylko jedna z czterech klas będzie konsekwentnie tworzyć punkty 3D, które znajdują się przed obiema kamerami. To musi być zatem prawidłowe rozwiązanie. Nadal jednak ma nieokreślone dodatnie skalowanie związane ze składową translacji.

określenie i ​​spełniają podstawowej macierzy . Jeśli tak nie jest, co na przykład zwykle ma miejsce, jeśli oszacowano na podstawie rzeczywistych (i zaszumionych) danych obrazu, należy założyć, że w przybliżeniu spełnia on wewnętrzne . Wektor wektor liczby pojedynczej wartości osobliwej

Punkty 3D z odpowiednich punktów obrazu

obliczania, współrzędne i , jeśli znana jest podstawowa macierz i określono odpowiednie transformacje rotacji i translacji.

Zobacz też

Skrzynki narzędziowe

Linki zewnętrzne