Wykrywanie grzbietu

W przetwarzaniu obrazu wykrywanie grzbietów to próba zlokalizowania grzbietów na obrazie za pomocą oprogramowania , zdefiniowanych jako krzywe, których punkty są lokalnymi maksimami funkcji, podobnymi do grzbietów geograficznych .

Dla funkcji N zmiennych jej grzbiety są zbiorem krzywych, których punkty są lokalnymi maksimami w N - 1 wymiarach. Pod tym względem pojęcie punktów grzbietowych rozszerza koncepcję maksimum lokalnego . Odpowiednio pojęcie dolin dla funkcji można zdefiniować, zastępując warunek lokalnego maksimum warunkiem lokalnego minimum . Połączenie zestawów grzbietowych i dolinowych wraz z powiązanym zbiorem punktów zwanym zbiorem łączników , tworzą połączony zestaw krzywych, które dzielą, przecinają lub spotykają się w punktach krytycznych funkcji. Ta suma zbiorów nazywana jest względnym zbiorem krytycznym funkcji .

Zestawy grzbietów, zestawy dolin i względne zbiory krytyczne reprezentują ważne informacje geometryczne właściwe dla funkcji. W pewnym sensie zapewniają zwartą reprezentację ważnych cech funkcji, ale zakres, w jakim można je wykorzystać do określenia globalnych cech funkcji, pozostaje kwestią otwartą. Główną motywacją do stworzenia grzbietów i dolin jest analiza obrazu i wizja komputerowa , a celem jest uchwycenie wnętrza wydłużonych obiektów w domenie obrazu. Reprezentacje związane z grzbietem pod względem segmentacji obrazu wykorzystano zlewnie . Podejmowano również próby uchwycenia kształtów obiektów za pomocą reprezentacji graficznych, które odzwierciedlają grzbiety, doliny i punkty krytyczne w domenie obrazu. Takie reprezentacje mogą jednak być bardzo wrażliwe na szum, jeśli są obliczane tylko w jednej skali. Ponieważ obliczenia teoretyczne w przestrzeni skali obejmują splot z jądrem Gaussa (wygładzającym), spodziewano się, że wykorzystanie wieloskalowych grzbietów, dolin i punktów krytycznych w kontekście teorii przestrzeni skali powinno pozwolić na bardziej solidną reprezentację obiektów ( lub kształty) na obrazku.

Pod tym względem grzbiety i doliny można postrzegać jako uzupełnienie naturalnych punktów orientacyjnych lub lokalnych punktów ekstremalnych. Przy odpowiednio zdefiniowanych koncepcjach, grzbiety i doliny w krajobrazie intensywnym (lub w innej reprezentacji wywodzącej się z krajobrazu intensywnego) mogą tworzyć niezmienny w skali szkielet organizujący ograniczenia przestrzenne lokalnego wyglądu, z wieloma jakościowymi podobieństwami do sposobu, w jaki środkowa część Bluma transformacja osi zapewnia szkielet kształtu dla obrazów binarnych . W typowych zastosowaniach deskryptory grzbietów i dolin są często używane do wykrywania dróg na zdjęciach lotniczych oraz do wykrywania naczyń krwionośnych na obrazach siatkówki lub trójwymiarowych obrazach rezonansu magnetycznego .

Różniczkowa definicja geometryczna grzbietów i dolin w ustalonej skali na obrazie dwuwymiarowym

Niech oznacza funkcję dwuwymiarową i niech będzie reprezentacją w przestrzeni skali fa otrzymane przez splot z funkcją Gaussa

.

niech i oznaczają wartości macierzy Hessego

w przestrzeni skali z transformacją współrzędnych (obrótem) zastosowaną do lokalnych operatorów pochodnych kierunkowych,

gdzie p i q są współrzędnymi obróconego układu współrzędnych.

Można wykazać, że pochodna mieszana współrzędnych wynosi zero, jeśli tak wybierzemy

, .

Następnie formalną różniczkową geometryczną definicję grzbietów w ustalonej skali wyrazić jako zbiór punktów spełniających

Odpowiednio doliny w skali zbiorem punktów

W układzie współrzędnych z równoległym do gradientu obrazu za

Gdzie

można wykazać, że tę definicję grzbietu i doliny można zamiast tego równoważnie zapisać jako

Gdzie

a znak określa polaryzację; dla grzbietów i dla dolin.

Obliczanie grzbietów o zmiennej skali na podstawie obrazów dwuwymiarowych

Głównym problemem związanym z przedstawioną powyżej definicją grzbietu o stałej skali jest to, że może ona być bardzo wrażliwa na wybór poziomu skali. Eksperymenty pokazują, że parametr skali jądra wstępnego wygładzania Gaussa musi być starannie dostrojony do szerokości struktury grzbietu w domenie obrazu, aby detektor grzbietu wytworzył połączoną krzywą odzwierciedlającą leżące pod spodem struktury obrazu. Aby poradzić sobie z tym problemem w przypadku braku wcześniejszych informacji, pojęcie grzbietów w przestrzeni skali wprowadzono, który traktuje parametr skali jako nieodłączną właściwość definicji grzbietu i pozwala na zmianę poziomów skali wzdłuż grzbietu w przestrzeni skali. Co więcej, koncepcja grzbietu w przestrzeni skali umożliwia również automatyczne dostrojenie parametru skali do szerokości struktur grzbietowych w domenie obrazu, w rzeczywistości w wyniku dobrze podanej definicji. W literaturze zaproponowano wiele różnych podejść bazujących na tej koncepcji.

Niech oznacza miarę wytrzymałości grzbietu (określoną poniżej). Następnie dla obrazu dwuwymiarowego grzbiet w przestrzeni skali jest zbiorem spełniających punktów

gdzie jest w reprezentacji w przestrzeni skali . Podobnie dolina w przestrzeni skali to zbiór punktów, które spełniają

Bezpośrednią konsekwencją tej definicji jest to, że w przypadku obrazu dwuwymiarowego koncepcja grzbietów przestrzeni skali wykreśla zbiór jednowymiarowych krzywych w trójwymiarowej przestrzeni skali, gdzie parametr skali może zmieniać się wzdłuż skali -grzbiet kosmiczny (lub dolina łuskowa). Deskryptor grzbietu w dziedzinie obrazu będzie wówczas rzutem tej trójwymiarowej krzywej na dwuwymiarową płaszczyznę obrazu, gdzie informacje o skali atrybutów w każdym punkcie grzbietu mogą zostać wykorzystane jako naturalne oszacowanie szerokości struktury grzbietu w domena obrazu w sąsiedztwie tego punktu.

W literaturze zaproponowano różne miary wytrzymałości grzbietu. Kiedy Lindeberg (1996, 1998) ukuł termin grzbiet w przestrzeni skali, wziął pod uwagę trzy miary wytrzymałości grzbietu:

  • Główna główna krzywizna
.
w postaci znormalizowanych pochodnych z
  • Kwadrat różnicy wartości kwadratowej
  • Kwadrat znormalizowanej wartości własnej

Pojęcie algorytmów detektora grzbietów i dolin. Wymagając, aby w przypadku jednowymiarowego grzbietu Gaussa osadzonego w dwóch (lub trzech wymiarach) skala wykrywania była równa szerokości struktury grzbietu mierzonej w jednostkach długości (wymóg dopasowania rozmiaru filtra detekcyjnego że należy wybrać . Z tych trzech miar wytrzymałości grzbietu, pierwsza jednostka takich jak wykrywanie i wydobycie dróg. jednostka została wykorzystana w takich zastosowaniach, jak ulepszanie odcisków czasie i rozpoznawanie gestów , a także modelowanie lokalnych statystyk obrazu w celu wykrywania i śledzenia ludzi na obrazach i wideo.

grzbietów, które wykorzystują znormalizowane pochodne z . Rozwiń te podejścia bardziej szczegółowo. przy wykrywaniu grzbietów będzie dwukrotnie większa niż w przypadku , co skutkuje większymi zniekształceniami kształtu i mniejszą zdolnością do uchwycenia grzbietów i dolin z pobliskimi zakłócającymi strukturami obrazu w domenie obrazu.

Historia

Pojęcie grzbietów i dolin w obrazach cyfrowych zostało wprowadzone przez Haralicka w 1983 r. i Crowleya w odniesieniu do różnic w piramidach Gaussa w 1984 r. Pizer i jego współpracownicy szeroko badali zastosowanie deskryptorów grzbietów do analizy obrazów medycznych, co doprowadziło do ich koncepcji powtórzeń M. Lindeberg polepszył także wykrywanie grzbietów, wprowadzając -znormalizowane pochodne i grzbiety w przestrzeni skali zdefiniowane na podstawie lokalnej maksymalizacji odpowiednio znormalizowanej głównej krzywizny macierzy Hessego (lub innych miar wytrzymałości grzbietu) ponad przestrzenią i ponad skalą. Pojęcia te zostały później rozwinięte w zastosowaniu do ekstrakcji dróg przez Stegera i in. oraz segmentację naczyń krwionośnych przeprowadzoną przez Frangi i in. a także do wykrywania struktur krzywoliniowych i rurowych przez Sato i in. oraz Krissian i in. Przeglądu kilku klasycznych definicji grzbietów w ustalonej skali, łącznie z relacjami między nimi, przeprowadzili Koenderink i van Doorn. Przegląd technik ekstrakcji naczyń przedstawili Kirbas i Quek.

Definicja grzbietów i dolin w wymiarach N

W najszerszym znaczeniu pojęcie grzbietu uogólnia ideę lokalnego maksimum funkcji o wartościach rzeczywistych. Punkt w dziedzinie funkcji jest lokalnym maksimum funkcji, jeśli istnieje odległość właściwością, że jeśli mieści się w obrębie jednostki , następnie . Powszechnie wiadomo, że punkty krytyczne, których maksima lokalne są tylko jednym typem, są izolowanymi punktami w dziedzinie funkcji we wszystkich sytuacjach z wyjątkiem najbardziej nietypowych (tj. przypadków nieogólnych).

warunku, że mathbf w całym sąsiedztwie aby to się trzymało podzbiór wymiarowy. Prawdopodobnie to rozluźnienie pozwala, aby zbiór punktów spełniających kryteria, który nazwiemy grzbietem, miał jeden stopień swobody, przynajmniej w przypadku ogólnym. Oznacza to, że zbiór punktów grzbietowych utworzy jednowymiarowe miejsce lub krzywą grzbietową. Należy zauważyć, że powyższe można zmodyfikować, aby uogólnić pomysł na lokalne minima i uzyskać coś, co można nazwać jednowymiarowymi krzywymi doliny.

Poniższa definicja grzbietu jest zgodna z książką Eberly'ego i może być postrzegana jako uogólnienie niektórych z wyżej wymienionych definicji grzbietów. Niech i _ Niech . Niech będzie gradientem w i niech będzie macierz Hesja z w . Niech uporządkowanymi własnymi i jednostkowym wektorem własnym w przestrzeni własnej dla . (W tym celu należy założyć, że wszystkie wartości własne są różne.)

Punkt jest punktem na 1-wymiarowym grzbiecie, jeśli spełnione są następujące warunki:

  1. i
  2. dla .

koncepcję, że tej konkretnej ma lokalne maksimum

naturalny sposób uogólnia się na k -wymiarowy w następujący sposób: punkt jest punktem na k -wymiarowym grzbiecie, jeśli spełnione następujące warunki :

  1. i
  2. dla .

Pod wieloma względami definicje te w naturalny sposób uogólniają definicję maksimum lokalnego funkcji. Właściwości maksymalnych grzbietów wypukłych zostały oparte na solidnych podstawach matematycznych przez Damona i Millera. Ich właściwości w rodzinach jednoparametrowych ustalił Keller.

Maksymalny grzbiet skali

Poniższą definicję wywodzi się od Fritscha, który interesował się wydobywaniem informacji geometrycznych o figurach z dwuwymiarowych obrazów w skali szarości. Fritsch przefiltrował swój obraz za pomocą filtra „medialności”, który dostarczył mu informacji analogicznych do danych „odległych od granicy” w przestrzeni skali. Grzbiety tego obrazu, rzutowane na obraz oryginalny, miały być analogiczne do szkieletu kształtu ( np . środkowej osi Bluma ) obrazu pierwotnego.

Poniżej znajduje się definicja maksymalnego grzbietu skali funkcji trzech zmiennych, z których jedna jest parametrem „skali”. Jedną rzeczą, którą chcemy, aby była prawdziwa w tej definicji, jest to, że jeśli jest punktem na tym grzbiecie, to wartość funkcji w tym punkcie wynosi maksimum w wymiarze skali. Niech będzie gładką funkcją różniczkowalną na . displaystyle jest punktem na grzbiecie maksymalnej skali wtedy i tylko wtedy, gdy

  1. i i
  2. i .

Zależności pomiędzy wykrywaniem krawędzi a wykrywaniem grzbietów

Celem wykrywania grzbietów jest zwykle uchwycenie głównej osi symetrii wydłużonego obiektu, [ potrzebne źródło ] , podczas gdy celem wykrywania krawędzi jest zwykle uchwycenie granicy obiektu. Jednakże w niektórych publikacjach na temat wykrywania krawędzi błędnie [ potrzebne źródło ] włącza pojęcie grzbietów do pojęcia krawędzi, co dezorientuje sytuację.

Pod względem definicji istnieje ścisłe powiązanie pomiędzy detektorami krawędzi i detektorami grzbietów. Przy sformułowaniu niemaksimum podanym przez Canny'ego utrzymuje się, że krawędzie definiuje się jako punkty, w których wielkość gradientu przyjmuje lokalne maksimum w kierunku gradientu. Kierując się różniczkowym geometrycznym sposobem wyrażania tej definicji, możemy w wyżej wymienionym układzie współrzędnych stwierdzić, że wielkość gradientu reprezentacji w przestrzeni skali, która jest równa ( pochodna kierunkowa pierwszego rzędu w -kierunek pochodną kierunkową pierwszego rzędu w

podczas gdy pochodna kierunkowa drugiego rzędu w być ujemna, tj.

.

Zapisane jako wyraźne wyrażenie w kategoriach lokalnych pochodnych cząstkowych , to , ... definicję krawędzi można wyrazić jako krzywe przecinające zero niezmiennika różniczkowego

które spełniają warunek znaku na następującym niezmienniku różniczkowym

więcej informacji można znaleźć w artykule na temat wykrywania krawędzi ). Warto zauważyć, że krawędzie uzyskane w ten sposób są grzbietami wielkości gradientu.

Zobacz też

  1. ^ ab Damon, J.   (marzec 1999). „Właściwości grzbietów i rdzeni w obrazach dwuwymiarowych”. J Wizja obrazowania matematycznego . 10 (2): 163–174. doi : 10.1023/A:1008379107611 . S2CID 10121282 .
  2. ^ a b Miller, J. zbiory krytyczne w obrazu. Doktorat Rozprawa. Uniwersytet Karoliny Północnej. 1998.
  3. ^   T. Lindeberga (2009). „Przestrzeń skali” . W Benjamin Wah (red.). Encyklopedia informatyki i inżynierii . Tom. IV. Johna Wileya i synów. s. 2495–2504. doi : 10.1002/9780470050118.ecse609 . ISBN 978-0470050118 .
  4. ^ Lindeberg, T. (1994). „Teoria przestrzeni skali: podstawowe narzędzie do analizy konstrukcji w różnych skalach” . Dziennik statystyki stosowanej . 21 (2): 224–270. doi : 10.1080/757582976 .
  5. ^   Lindeberg, T. (1998). „Wykrywanie krawędzi i wykrywanie grzbietów z automatycznym wyborem skali” . International Journal of Computer Vision . 30 (2): 117–154. doi : 10.1023/A:1008097225773 . S2CID 35328443 . Wcześniejsza wersja zaprezentowana na konferencji IEEE na temat rozpoznawania wzorców i widzenia komputerowego, CVPR'96, San Francisco, Kalifornia, strony 465–470, czerwiec 1996
  6. ^   Almansa, A., Lindeberg, T. (2000). „Wzmocnienie odcisków palców poprzez adaptację kształtu operatorów przestrzeni skali z automatycznym wyborem skali” . Transakcje IEEE dotyczące przetwarzania obrazu . 9 (12): 2027–42. Kod Biblioteki : 2000ITIP....9.2027L . doi : 10.1109/83.887971 . PMID 18262941 . {{ cite journal }} : CS1 maint: wiele nazw: lista autorów ( link )
  7. ^ L. Bretzner, I. Laptev i T. Lindeberg: Rozpoznawanie gestów dłoni przy użyciu wieloskalowych cech kolorów, modeli hierarchicznych i filtrowania cząstek, Proc. Konferencja IEEE na temat twarzy i gestów 2002, Waszyngton, 423–428.
  8. ^   Sidenbladh, H., Czarny, M. (2003). „Nauka statystyk osób na zdjęciach i wideo” (PDF) . International Journal of Computer Vision . 54 (1–2): 183–209. doi : 10.1023/a:1023765619733 . S2CID 1255196 . {{ cite journal }} : CS1 maint: wiele nazw: lista autorów ( link )
  9. ^ J. Furst i J. Miller, „ Grzbiet maksymalnej skali: uwzględnienie skali w definicji grzbietu ”, Teoria przestrzeni skali w wizji komputerowej: Proceedings of the First International Conference on, Scale Space '97, s. 93–104. Notatki z wykładów Springera z informatyki, tom. 1682.
  10. ^ Haralick, R. (kwiecień 1983). „Grzbiety i doliny na obrazach cyfrowych”. Widzenie komputerowe, grafika i przetwarzanie obrazu . 22 (10): 28–38. doi : 10.1016/0734-189X(83)90094-4 .
  11. ^     Crowley, JL, Parker, AC (marzec 1984). „Reprezentacja kształtu oparta na szczytach i grzbietach różnicy transformacji dolnoprzepustowej” (PDF) . IEEE Trans Pattern Anal Mach Intell . 6 (2): 156–170. CiteSeerX 10.1.1.161.3102 . doi : 10.1109/TPAMI.1984.4767500 . PMID 21869180 . S2CID 14348919 . {{ cite journal }} : CS1 maint: wiele nazw: lista autorów ( link )
  12. ^     Crowley, JL, Sanderson, A. (styczeń 1987). „Reprezentacja w wielu rozdzielczościach i probabilistyczne dopasowanie dwuwymiarowego kształtu w skali szarości” (PDF) . IEEE Trans Pattern Anal Mach Intell . 9 (1): 113–121. CiteSeerX 10.1.1.1015.9294 . doi : 10.1109/TPAMI.1987.4767876 . PMID 21869381 . S2CID 14999508 . {{ cite journal }} : CS1 maint: wiele nazw: lista autorów ( link )
  13. ^ Gauch, JM, Pizer, SM (czerwiec 1993). „Analiza wielorozdzielcza grzbietów i dolin na obrazach w skali szarości”. IEEE Trans Pattern Anal Mach Intell . 15 (6): 635–646. doi : 10.1109/34.216734 . {{ cite journal }} : CS1 maint: wiele nazw: lista autorów ( link )
  14. ^   Eberly D.; Gardner R.; Morse B.; Pizer S.; Scharlach C. (grudzień 1994). „Grzbiety do analizy obrazu”. Journal of Mathematical Imaging and Vision . 4 (4): 353–373. doi : 10.1007/BF01262402 . S2CID 9940964 .
  15. ^    Pizer, Stephen M., Eberly, David, Fritsch, Daniel S. (styczeń 1998). „Niezmienna w powiększeniu wizja kształtu figury: matematyka rdzeni”. Widzenie komputerowe i rozumienie obrazu . 69 (1): 55–71. CiteSeerX 10.1.1.38.3116 . doi : 10.1006/cviu.1997.0563 . S2CID 676717 . {{ cite journal }} : CS1 maint: wiele nazw: lista autorów ( link )
  16. ^ S. Pizer, S. Joshi, T. Fletcher, M. Styner, G. Tracton, J. Chen (2001) „Segmentacja obiektów jednofigurowych przez deformowalne M-reps”, materiały z 4. Międzynarodowej Konferencji Obrazu Medycznego Obliczenia i interwencja wspomagana komputerowo, notatki z wykładów Springera z informatyki; Tom. 2208, s. 862–871
  17. ^   Steger C. (1998). „Bezstronny detektor struktur krzywoliniowych”. IEEE Trans Pattern Anal Mach Intell . 20 (2): 113–125. CiteSeerX 10.1.1.42.2266 . doi : 10.1109/34.659930 .
  18. ^   Łaptiew I.; Mayera H.; Lindeberg T.; Eckstein W.; Steger C.; Baumgartner A. (2000). „Automatyczne wyodrębnianie dróg ze zdjęć lotniczych w oparciu o przestrzeń skali i węże” (PDF) . Widzenie maszynowe i zastosowania . 12 (1): 23–31. doi : 10.1007/s001380050121 . S2CID 2561801 .
  19. ^     Frangi AF, Niessen WJ, Hoogeveen RM, van Walsum T, Viergever MA (październik 1999). „Ocena ilościowa oparta na modelu trójwymiarowych obrazów angiograficznych rezonansu magnetycznego”. Obrazowanie transmedyczne IEEE . 18 (10): 946–56. CiteSeerX 10.1.1.502.5994 . doi : 10.1109/42.811279 . PMID 10628954 . S2CID 6263198 .
  20. ^   Sato Y, Nakajima S, Shiraga N, Atsumi H, Yoshida S i in. (1998). „Trójwymiarowy, wieloskalowy filtr liniowy do segmentacji i wizualizacji struktur krzywoliniowych w obrazach medycznych” (PDF) . Analiza obrazu medycznego . 2 (2): 143–168. doi : 10.1016/s1361-8415(98)80009-1 . PMID 10646760 .
  21. ^   Kryssian K.; Malandain G.; Ayache N.; Vaillan R.; Trousset Y. (2000). „Detekcja oparta na modelu struktur rurowych w obrazach 3D” . Widzenie komputerowe i rozumienie obrazu . 80 (2): 130–171. doi : 10.1006/cviu.2000.0866 . S2CID 3727523 .
  22. ^ Koenderink, Jan J., van Doorn, Andrea J. (maj 1994). „Geometria różniczkowa 2 + 1-D”. Litery rozpoznawania wzorców . 15 (5): 439–443. doi : 10.1016/0167-8655(94)90134-1 . {{ cite journal }} : CS1 maint: wiele nazw: lista autorów ( link )
  23. ^    Kirbas C, Quek F (2004). „Przegląd technik i algorytmów ekstrakcji naczyń” (PDF) . Ankiety komputerowe ACM . 36 (2): 81–121. CiteSeerX 10.1.1.460.8544 . doi : 10.1145/1031120.1031121 . S2CID 810806 .
  24. ^   Eberly, D. (1996). Grzbiety w analizie obrazu i danych . Kluwer. ISBN 978-0-7923-4268-7 .
  25. ^ Kerrel, R. Ogólne przejścia względnych zbiorów krytycznych w rodzinach sparametryzowanych z zastosowaniami do analizy obrazu . Uniwersytet Karoliny Północnej. 1999.
  26. ^ Fritsch, DS, Eberly, D., Pizer, SM i McAuliffe, MJ. „Stymulowane rdzenie i ich zastosowania w obrazowaniu medycznym”. Przetwarzanie informacji w obrazowaniu medycznym, Y. Bizais, C Barillot, R DiPaola, red., Kluwer Series in Computational Imaging and Vision, s. 365–368.
  27. ^    Canny J. (1986). „Obliczeniowe podejście do wykrywania krawędzi” . IEEE Trans Pattern Anal Mach Intell . 8 (6): 679–698. doi : 10.1109/TPAMI.1986.4767851 . PMID 21869365 . S2CID 13284142 .
  28. ^   Lindeberg T. (1993). „Dyskretne przybliżenia pochodne z właściwościami przestrzeni skali: podstawa do ekstrakcji cech niskiego poziomu” . Journal of Mathematical Imaging and Vision . 3 (4): 349–376. doi : 10.1007/BF01664794 . S2CID 16396756 .