Progowanie (przetwarzanie obrazu)

Oryginalny obraz.
Obraz binarny powstały w wyniku progowania oryginalnego obrazu.

W cyfrowym przetwarzaniu obrazu progowanie jest najprostszą metodą segmentacji obrazów . Z w skali szarości można użyć progowania do utworzenia obrazów binarnych .

Definicja

na obrazie czarnym pikselem, jeśli intensywność obrazu niż stała wartość zwana progiem a biały piksel, jeśli intensywność piksela jest większa niż ten próg. Na przykładowym obrazie po prawej stronie powoduje to, że ciemne drzewo staje się całkowicie czarne, a jasny śnieg staje się całkowicie biały.

Automatyczne progowanie

użytkownik może wybrać próg ręcznie, w W takich przypadkach próg powinien być „najlepszym” progiem w tym sensie, że podział pikseli powyżej i poniżej progu powinien jak najbardziej odpowiadać rzeczywistemu podziałowi między dwie klasy obiektów reprezentowane przez te piksele (np. piksele poniżej progu powinny odpowiadać tłu, a powyżej niektórym interesującym obiektom na obrazie).

Istnieje wiele rodzajów automatycznych metod progowania, z których najbardziej znaną i szeroko stosowaną jest metoda Otsu . Poniższa lista, oparta na pracach Sezgina i in. (2004) dzieli metody progowania na szerokie grupy na podstawie informacji, którymi manipuluje algorytm. Należy jednak zauważyć, że taka kategoryzacja jest z konieczności rozmyta, ponieważ niektóre metody mogą należeć do kilku kategorii (na przykład metodę Otsu można uznać zarówno za kształt histogramu, jak i algorytm grupowania)

  • kształcie histogramu , w których analizowane są na przykład szczyty, doliny i krzywizny wygładzonego histogramu. Należy zauważyć, że metody te, bardziej niż inne, przyjmują pewne założenia dotyczące rozkładu prawdopodobieństwa intensywności obrazu (tj. kształtu histogramu),
  • klastrowaniu , w których próbki na poziomie szarości są skupione w dwóch częściach jako tło i pierwszy plan,
  • entropii dają algorytmy, które wykorzystują entropię obszarów pierwszego planu i tła, entropię krzyżową między obrazem oryginalnym a zbinaryzowanym itp.,
  • atrybutach obiektów wyszukują miarę podobieństwa między obrazami na poziomie szarości a obrazami binarnymi, takimi jak rozmyte podobieństwo kształtu, zbieżność krawędzi itp.,
  • przestrzenne wykorzystują rozkład prawdopodobieństwa wyższego rzędu i/lub korelację między pikselami.
Przykład korzyści z progowania lokalnego w przypadku oświetlenia niejednorodnego. Obraz zaadaptowany z [1] .

Progowanie globalne a lokalne

W większości metod ten sam próg jest stosowany do wszystkich pikseli obrazu. Jednak w niektórych przypadkach korzystne może być zastosowanie różnych wartości progowych do różnych części obrazu w oparciu o lokalną wartość pikseli. Ta kategoria metod nazywana jest progowaniem lokalnym lub adaptacyjnym. Są one szczególnie przystosowane do przypadków, w których obrazy mają niejednorodne oświetlenie, na przykład na obrazie sudoku po prawej stronie. W takich przypadkach definiowane jest sąsiedztwo i obliczana jest wartość progowa dla każdego piksela i jego otoczenia. Wiele globalnych metod progowania można dostosować do pracy w sposób lokalny, ale istnieją również metody opracowane specjalnie do lokalnego progowania, takie jak algorytmy Niblacka lub Bernsena.

Oprogramowanie takie jak ImageJ oferuje szeroką gamę automatycznych metod progowych, zarówno globalnych , jak i lokalnych .

Rozszerzenia progowania binarnego

Obrazy wielopasmowe

Obrazy kolorowe mogą być również progowane. Jednym ze sposobów jest wyznaczenie oddzielnego progu dla każdej ze RGB obrazu, a następnie połączenie ich z operacją AND . Odzwierciedla to sposób działania aparatu i sposób przechowywania danych w komputerze, ale nie odpowiada sposobowi, w jaki ludzie rozpoznają kolory. Dlatego częściej stosuje się modele kolorów HSL i HSV ; zauważ, że ponieważ barwa jest wielkością kołową, wymaga ona kołowego progowania . Istnieje również możliwość wykorzystania CMYK .

Wiele progów

Zamiast pojedynczego progu skutkującego obrazem binarnym, możliwe jest również wprowadzenie wielu rosnących progów . W takim przypadku wdrożenie progów spowoduje powstanie obrazu z o intensywności , że zostanie przypisany do klasy . Większość binarnych automatycznych metod progowania ma naturalne rozszerzenie dla wieloprogowych.

Ograniczenia

Próg będzie działał najlepiej w pewnych warunkach:

  • niski poziom hałasu
  • wyższa wariancja wewnątrzklasowa niż wariancja międzyklasowa, tj. piksele z tej samej grupy mają do siebie bliższe intensywności niż piksele z innej grupy,
  • jednolite oświetlenie itp.

W trudnych przypadkach progowanie będzie prawdopodobnie niedoskonałe i da obraz binarny z fałszywie dodatnimi i fałszywie ujemnymi wynikami .

Źródła

  • Pham N, Morrison A, Schwock J i in. (2007). Ilościowa analiza obrazu plam immunohistochemicznych przy użyciu modelu kolorów CMYK. Diagnozuj Pathol. 2: 8 .
  •   Shapiro, Linda G. i Stockman, George C. (2002). "Wizja komputerowa". Sala Prentice'a. ISBN 0-13-030796-3
  • Mehmet Sezgin i Bulent Sankur, Ankieta dotycząca technik progowania obrazu i ilościowej oceny wydajności, Journal of Electronic Imaging 13(1), 146–165 (styczeń 2004). doi : 10.1117/1.1631315

Dalsza lektura

  •   Gonzalez, Rafael C. & Woods, Richard E. (2002). Progowanie. W Cyfrowe przetwarzanie obrazu, s. 595–611. Edukacja Pearsona. ISBN 81-7808-629-8
  • M. Luessi, M. Eichmann, GM Schuster i AK Katsaggelos, Ramy dla wydajnego, optymalnego progowania obrazu wielopoziomowego, Journal of Electronic Imaging, tom. 18, s. 013004+, 2009. doi : 10.1117/1.3073891
  • YK Lai, PL Rosin, Efficient Circular Thresholding, IEEE Trans. w sprawie przetwarzania obrazu 23 (3), s. 992–1001 (2014). doi : 10.1109/TIP.2013.2297014
  •   Scott E. Umbaugh (2018). Cyfrowe przetwarzanie i analiza obrazu, s. 93–96. Prasa CRC. ISBN 978-1-4987-6602-9