Uogólniony tensor struktury

W analizie obrazu uogólniony tensor struktury (GST) jest rozszerzeniem tensora struktury kartezjańskiej na współrzędne krzywoliniowe . Jest używany głównie do wykrywania i przedstawiania parametrów „kierunku” krzywych, tak jak tensor struktury kartezjańskiej wykrywa i reprezentuje kierunek we współrzędnych kartezjańskich. Najlepiej zbadano rodziny krzywych generowane przez pary funkcji lokalnie ortogonalnych.

Jest to powszechnie znana metoda w zastosowaniach przetwarzania obrazu i wideo, w tym widzenia komputerowego, takich jak identyfikacja biometryczna za pomocą odcisków palców oraz badania skrawków tkanek ludzkich.

GST w bazach 2D i lokalnie ortogonalnych

Niech termin obraz reprezentuje funkcję gdzie , y), \ eta ( zmiennymi rzeczywistymi a i wartościach rzeczywistych GST reprezentuje kierunek, w którym obraz może podlegać nieskończenie małemu tłumaczeniu z minimalnym ( całkowitym błędem najmniejszych kwadratów), wzdłuż „linii” spełniających następujące warunki:

1. „Linie” to zwykłe linie w podstawie współrzędnych krzywoliniowych

które są krzywymi we współrzędnych kartezjańskich, jak przedstawiono w powyższym równaniu. Błąd jest mierzony w a minimalność błędu odnosi się tym samym do L2 .

ξ tworzą parę harmoniczną , tj .

tym takie współrzędne krzywoliniowe lokalnie ortogonalne

Następnie GST składa się z

gdzie są błędami (nieskończenie małej) translacji w najlepszym kierunku (oznaczonym kątem ) i najgorszy kierunek (oznaczony przez ). funkcja zostanie przeprowadzone wykrywanie, którą można pominąć lub jeśli to pełny obraz (a nie lokalny). Macierz jest macierzą . Korzystając z reguły łańcucha , można wykazać, że powyższa integracja może być zaimplementowana jako sploty do tensora struktury zwykłej, gdy rzeczywiste i urojone części analitycznej , ,

gdzie . Przykłady funkcji analitycznych obejmują , a także jednomiany sol , gdzie jest dowolną dodatnią lub ujemną liczbą całkowitą. Jednomiany są również określane jako funkcje harmoniczne w wizji komputerowej i przetwarzaniu obrazu.

tensor struktury kartezjańskiej jest szczególnym przypadkiem GST, gdzie i , tj. Funkcja harmoniczna to po prostu . Tak więc, wybierając funkcję harmoniczną można wykryć wszystkie krzywe, które są liniowymi kombinacjami jej części rzeczywistych i urojonych, za pomocą zwojów tylko na (prostokątnych) siatkach obrazu, nawet jeśli sol {\ displaystyle g są niekartezjańskie. Ponadto obliczenia splotu można wykonać za pomocą złożonych filtrów zastosowanych do złożonej wersji tensora struktury. W związku z tym implementacje GST były często wykonywane przy użyciu złożonej wersji tensora struktury, zamiast przy użyciu tensora (1,1).

Złożona wersja GST

Ponieważ istnieje złożona wersja zwykłego tensora struktury , istnieje również złożona wersja GST

który jest identyczny ze swoim kuzynem, z tą różnicą, że filtrem złożonym Należy przypomnieć, że zwykły tensor struktury prawdziwym filtrem, zwykle definiowanym przez próbkowany i przeskalowany Gaussa w celu wyznaczenia sąsiedztwa, znanego również jako skala zewnętrzna Ta prostota jest powodem, dla którego implementacje GST wykorzystywały głównie powyższą złożoną wersję. Dla rodzin krzywych zdefiniowanych przez funkcje analityczne , można pokazać, że funkcja określająca sąsiedztwo ma wartości zespolone,

,

tak zwana pochodna symetrii Gaussa. W ten sposób orientacyjna zmiana poszukiwanego wzorca jest bezpośrednio włączona do funkcji definiującej sąsiedztwo, a wykrywanie następuje w przestrzeni (zwykłego) tensora struktury.

Podstawowa koncepcja jej wykorzystania w przetwarzaniu obrazu i wizji komputerowej

wykrywanie na jest możliwe dzięki przetwarzaniu obrazu dla pary , . Złożone sploty (lub odpowiadające im operacje macierzowe) i punktowe odwzorowania nieliniowe są podstawowymi elementami obliczeniowymi implementacji GST. Następnie uzyskuje się całkowite oszacowanie błędu najmniejszych kwadratów na poziomie wraz z dwoma błędami i . Analogicznie do tensora struktury kartezjańskiej oszacowany kąt jest reprezentowany w postaci podwójnego kąta, tj. i może być użyty jako cecha kształtu, podczas gdy samodzielnie lub w połączeniu z może być używany jako miara jakości (pewność, pewność) do oszacowania kąta.

Spirale logarytmiczne, w tym okręgi, można na przykład wykryć za pomocą (złożonych) splotów i odwzorowań nieliniowych. Spirale mogą być w obrazach szarych (wycenionych) lub w obrazie binarnym , tzn. położenie elementów brzegowych danych wzorów, takich jak kontury okręgów lub spirali, nie może być znane ani inaczej oznaczone.

Uogólniony tensor struktury może być używany jako alternatywa dla transformacji Hougha w przetwarzaniu obrazu i wizji komputerowej do wykrywania wzorców, których lokalne orientacje można modelować, na przykład punkty połączeń. Główne różnice obejmują:

  • Dozwolone jest głosowanie negatywne i złożone;
  • Za pomocą jednego szablonu można wykryć wiele wzorów należących do tej samej rodziny;
  • Binaryzacja obrazu nie jest wymagana.

Interpretacja fizyczna i matematyczna

Współrzędne krzywoliniowe GST mogą wyjaśnić procesy fizyczne zastosowane do obrazów. Dobrze znana para procesów polega na obracaniu i powiększaniu. Są one związane z transformacją współrzędnych i .

Jeśli obraz , które można wytłumaczyć tylko za pomocą . jego izokrzywe składają się z okręgów , gdzie jest dowolną różniczkowalną funkcją o wartościach rzeczywistych zdefiniowaną na 1D, obraz jest niezmienny względem obrotów (wokół początku).

Operacja powiększania (obejmująca oddalanie) jest modelowana w podobny sposób. Jeśli obraz ma izokrzywe, które wyglądają jak „gwiazda” lub szprychy rowerowe, tj. funkcja 1D następnie obraz niezmienny względem skalowania (w pochodzeniu).

W połączeniu,

jest niezmienne dla określonej wielkości obrotu połączonej ze skalowaniem, gdzie wielkość jest precyzyjna przez parametr .

tensor struktury kartezjańskiej jest również reprezentacją translacji . Tutaj proces fizyczny polega na zwykłym przesunięciu określonej ilości wzdłuż w połączeniu z przesunięciem wzdłuż , {

gdzie kwota jest określona przez parametr . Najwyraźniej tutaj reprezentuje kierunek

Ogólnie rzecz biorąc, oszacowany reprezentuje kierunek (we wzdłuż którego nieskończenie małe tłumaczenia pozostawiają obraz niezmienny, w praktyce Z każdą parą bazową współrzędnych krzywoliniowych istnieje zatem para nieskończenie małych translatorów, których liniowa kombinacja jest operatorem różniczkowym . Te ostatnie są związane z algebrą Liego .

Różnorodny

„Obraz” w kontekście GST może oznaczać zarówno zwykły obraz, jak i jego sąsiedztwo (obraz lokalny), w zależności od kontekstu. Na przykład zdjęcie jest obrazem, podobnie jak każde jego otoczenie.

Zobacz też