Prostopadłościan (wizja komputerowa)

W wizji komputerowej termin prostopadłościan jest używany do opisania małej objętości czasoprzestrzennej wyodrębnionej w celu rozpoznania zachowania . Prostopadłościan jest uważany za podstawowy prymitywny typ geometryczny i służy do przedstawiania trójwymiarowych obiektów w trójwymiarowej reprezentacji płaskiego, dwuwymiarowego obrazu.

Produkcja

Prostopadłościany można wytwarzać zarówno z obrazów dwuwymiarowych, jak i trójwymiarowych.

Jedna z metod wykorzystywanych do tworzenia prostopadłościanów wykorzystuje prymitywne bazy danych SUN, które są zbiorami obrazów, które już zawierają prostopadłościany. Sortując prymitywne bazy danych SUN za pomocą narzędzi uczenia maszynowego, komputery obserwują warunki, w jakich powstają prostopadłościany na obrazach z prymitywnych baz danych SUN i mogą nauczyć się tworzyć prostopadłościany z innych obrazów.

Obrazy RGB-D, które są obrazami RGB , które również rejestrują głębię każdego piksela, są czasami używane do tworzenia prostopadłościanów, ponieważ komputery nie muszą już określać głębokości obiektu, jak to zwykle robią, ponieważ głębokość jest już zarejestrowana.

Produkcja prostopadłościanu jest wrażliwa na zmiany koloru i oświetlenia, blokadę i bałagan w tle. Oznacza to, że komputerom trudno jest tworzyć prostopadłościany obiektów, które są wielokolorowe, nieregularnie oświetlone lub częściowo zasłonięte, lub jeśli w tle znajduje się wiele obiektów. Wynika to częściowo z faktu, że algorytmy tworzenia prostopadłościanów są nadal stosunkowo proste.

Stosowanie

Prostopadłościany są tworzone dla trójwymiarowych map opartych na chmurze punktów i mogą być wykorzystywane w różnych sytuacjach, takich jak rzeczywistość rozszerzona, zautomatyzowane sterowanie samochodami, dronami i robotami oraz wykrywanie obiektów .

Prostopadłościany pozwalają oprogramowaniu identyfikować scenę za pomocą opisów geometrycznych w sposób „niezależny od obiektu”.

Punkty zainteresowania, lokalizacje na obrazach, które są identyfikowane przez komputer jako niezbędne do identyfikacji obrazu, utworzone z dwuwymiarowych obrazów, mogą być używane z prostopadłościanami do dopasowywania obrazów, identyfikowania pomieszczenia lub sceny oraz rozpoznawania instancji. Punkty procentowe utworzone z trójwymiarowych obrazów mogą być używane z prostopadłościanami do rozpoznawania czynności. Jest to możliwe, ponieważ punkty procentowe pomagają oprogramowaniu skupić się tylko na najważniejszych aspektach obrazów.

Obrazy RGB-D i systemy SLAM są używane razem w systemach RGB-D SLAM, które są wykorzystywane przez systemy projektowania wspomaganego komputerowo do generowania trójwymiarowych map opartych na chmurze punktów.

Większość przemysłowych narzędzi do obróbki wieloosiowej wykorzystuje produkcję wspomaganą komputerowo , a następnie pracuje w prostopadłościennych przestrzeniach roboczych.