Uogólniony tensor struktury
Wykrywanie cech Wykrywanie |
---|
krawędzi |
Wykrywanie narożników |
Wykrywanie kropel |
Detekcja grzbietu |
Transformata Hougha |
Tensor struktury |
Wykrywanie niezmiennych cech afinicznych |
Opis funkcji |
Skaluj przestrzeń |
W analizie obrazu uogólniony tensor struktury (GST) jest rozszerzeniem tensora struktury kartezjańskiej na współrzędne krzywoliniowe . Jest używany głównie do wykrywania i przedstawiania parametrów „kierunku” krzywych, tak jak tensor struktury kartezjańskiej wykrywa i reprezentuje kierunek we współrzędnych kartezjańskich. Najlepiej zbadano rodziny krzywych generowane przez pary funkcji lokalnie ortogonalnych.
Jest to powszechnie znana metoda w zastosowaniach przetwarzania obrazu i wideo, w tym widzenia komputerowego, takich jak identyfikacja biometryczna za pomocą odcisków palców oraz badania skrawków tkanek ludzkich.
GST w bazach 2D i lokalnie ortogonalnych
Niech termin obraz reprezentuje funkcję gdzie , y), \ eta ( zmiennymi rzeczywistymi a i wartościach rzeczywistych GST reprezentuje kierunek, w którym obraz może podlegać nieskończenie małemu tłumaczeniu z minimalnym ( całkowitym błędem najmniejszych kwadratów), wzdłuż „linii” spełniających następujące warunki:
1. „Linie” to zwykłe linie w podstawie współrzędnych krzywoliniowych
które są krzywymi we współrzędnych kartezjańskich, jak przedstawiono w powyższym równaniu. Błąd jest mierzony w a minimalność błędu odnosi się tym samym do L2 .
ξ tworzą parę harmoniczną , tj .
tym takie współrzędne krzywoliniowe lokalnie ortogonalne
Następnie GST składa się z
gdzie są błędami (nieskończenie małej) translacji w najlepszym kierunku (oznaczonym kątem ) i najgorszy kierunek (oznaczony przez ). funkcja zostanie przeprowadzone wykrywanie, którą można pominąć lub jeśli to pełny obraz (a nie lokalny). Macierz jest macierzą . Korzystając z reguły łańcucha , można wykazać, że powyższa integracja może być zaimplementowana jako sploty do tensora struktury zwykłej, gdy rzeczywiste i urojone części analitycznej , ,
gdzie . Przykłady funkcji analitycznych obejmują , a także jednomiany sol , gdzie jest dowolną dodatnią lub ujemną liczbą całkowitą. Jednomiany są również określane jako funkcje harmoniczne w wizji komputerowej i przetwarzaniu obrazu.
tensor struktury kartezjańskiej jest szczególnym przypadkiem GST, gdzie i , tj. Funkcja harmoniczna to po prostu . Tak więc, wybierając funkcję harmoniczną można wykryć wszystkie krzywe, które są liniowymi kombinacjami jej części rzeczywistych i urojonych, za pomocą zwojów tylko na (prostokątnych) siatkach obrazu, nawet jeśli sol {\ displaystyle g są niekartezjańskie. Ponadto obliczenia splotu można wykonać za pomocą złożonych filtrów zastosowanych do złożonej wersji tensora struktury. W związku z tym implementacje GST były często wykonywane przy użyciu złożonej wersji tensora struktury, zamiast przy użyciu tensora (1,1).
Złożona wersja GST
Ponieważ istnieje złożona wersja zwykłego tensora struktury , istnieje również złożona wersja GST
który jest identyczny ze swoim kuzynem, z tą różnicą, że filtrem złożonym Należy przypomnieć, że zwykły tensor struktury prawdziwym filtrem, zwykle definiowanym przez próbkowany i przeskalowany Gaussa w celu wyznaczenia sąsiedztwa, znanego również jako skala zewnętrzna Ta prostota jest powodem, dla którego implementacje GST wykorzystywały głównie powyższą złożoną wersję. Dla rodzin krzywych zdefiniowanych przez funkcje analityczne , można pokazać, że funkcja określająca sąsiedztwo ma wartości zespolone,
- ,
tak zwana pochodna symetrii Gaussa. W ten sposób orientacyjna zmiana poszukiwanego wzorca jest bezpośrednio włączona do funkcji definiującej sąsiedztwo, a wykrywanie następuje w przestrzeni (zwykłego) tensora struktury.
Podstawowa koncepcja jej wykorzystania w przetwarzaniu obrazu i wizji komputerowej
wykrywanie na jest możliwe dzięki przetwarzaniu obrazu dla pary , . Złożone sploty (lub odpowiadające im operacje macierzowe) i punktowe odwzorowania nieliniowe są podstawowymi elementami obliczeniowymi implementacji GST. Następnie uzyskuje się całkowite oszacowanie błędu najmniejszych kwadratów na poziomie wraz z dwoma błędami i . Analogicznie do tensora struktury kartezjańskiej oszacowany kąt jest reprezentowany w postaci podwójnego kąta, tj. i może być użyty jako cecha kształtu, podczas gdy samodzielnie lub w połączeniu z może być używany jako miara jakości (pewność, pewność) do oszacowania kąta.
Spirale logarytmiczne, w tym okręgi, można na przykład wykryć za pomocą (złożonych) splotów i odwzorowań nieliniowych. Spirale mogą być w obrazach szarych (wycenionych) lub w obrazie binarnym , tzn. położenie elementów brzegowych danych wzorów, takich jak kontury okręgów lub spirali, nie może być znane ani inaczej oznaczone.
Uogólniony tensor struktury może być używany jako alternatywa dla transformacji Hougha w przetwarzaniu obrazu i wizji komputerowej do wykrywania wzorców, których lokalne orientacje można modelować, na przykład punkty połączeń. Główne różnice obejmują:
- Dozwolone jest głosowanie negatywne i złożone;
- Za pomocą jednego szablonu można wykryć wiele wzorów należących do tej samej rodziny;
- Binaryzacja obrazu nie jest wymagana.
Interpretacja fizyczna i matematyczna
Współrzędne krzywoliniowe GST mogą wyjaśnić procesy fizyczne zastosowane do obrazów. Dobrze znana para procesów polega na obracaniu i powiększaniu. Są one związane z transformacją współrzędnych i .
Jeśli obraz , które można wytłumaczyć tylko za pomocą . jego izokrzywe składają się z okręgów , gdzie jest dowolną różniczkowalną funkcją o wartościach rzeczywistych zdefiniowaną na 1D, obraz jest niezmienny względem obrotów (wokół początku).
Operacja powiększania (obejmująca oddalanie) jest modelowana w podobny sposób. Jeśli obraz ma izokrzywe, które wyglądają jak „gwiazda” lub szprychy rowerowe, tj. funkcja 1D następnie obraz niezmienny względem skalowania (w pochodzeniu).
W połączeniu,
jest niezmienne dla określonej wielkości obrotu połączonej ze skalowaniem, gdzie wielkość jest precyzyjna przez parametr .
tensor struktury kartezjańskiej jest również reprezentacją translacji . Tutaj proces fizyczny polega na zwykłym przesunięciu określonej ilości wzdłuż w połączeniu z przesunięciem wzdłuż , {
gdzie kwota jest określona przez parametr . Najwyraźniej tutaj reprezentuje kierunek
Ogólnie rzecz biorąc, oszacowany reprezentuje kierunek (we wzdłuż którego nieskończenie małe tłumaczenia pozostawiają obraz niezmienny, w praktyce Z każdą parą bazową współrzędnych krzywoliniowych istnieje zatem para nieskończenie małych translatorów, których liniowa kombinacja jest operatorem różniczkowym . Te ostatnie są związane z algebrą Liego .
Różnorodny
„Obraz” w kontekście GST może oznaczać zarówno zwykły obraz, jak i jego sąsiedztwo (obraz lokalny), w zależności od kontekstu. Na przykład zdjęcie jest obrazem, podobnie jak każde jego otoczenie.
Zobacz też
- Tensor struktury
- Transformacja Hougha
- Napinacz
- Gaussa
- Wykrywanie narożników
- Wykrywanie krawędzi
- Afiniczna adaptacja kształtu
- Kierunkowa pochodna
- Operator różniczkowy
- Algebra kłamstw