Grupa zdjęć

W kodowaniu wideo grupa obrazów lub struktura GOP określa kolejność, w jakiej rozmieszczone są ramki wewnątrz i między ramkami . GOP to zbiór kolejnych obrazów w zakodowanym strumieniu wideo. Każdy zakodowany strumień wideo składa się z kolejnych GOP, z których generowane są widoczne klatki. Napotkanie nowego GOP w skompresowanym strumieniu wideo oznacza, że dekoder nie potrzebuje żadnych poprzednich klatek do zdekodowania następnych i umożliwia szybkie przeszukiwanie wideo.

Opis

GOP może zawierać następujące typy obrazów:

Obraz I lub I-ramka (obraz zakodowany wewnętrznie, zwany także klatką kluczową lub i-klatką) – obraz, który jest kodowany niezależnie od wszystkich innych obrazów. Każdy GOP rozpoczyna się (w kolejności dekodowania) od tego typu obrazu.
Obraz P lub ramka P (obraz zakodowany predykcyjnie) – zawiera informacje różnicowe z kompensacją ruchu w stosunku do wcześniej zdekodowanych obrazów. W starszych projektach, takich jak MPEG-1 , H.262 / MPEG-2 i H.263 , każdy obraz P może odnosić się tylko do jednego obrazu, który musi poprzedzać obraz P w kolejności wyświetlania, jak również w kolejności dekodowania i musi być obraz I lub P. Ograniczenia te nie mają zastosowania w nowszych standardach H.264/MPEG-4 AVC i HEVC .
Obraz B lub ramka B (obraz zakodowany z podwójną predykcją) - zawiera informacje różnicowe z kompensacją ruchu w stosunku do wcześniej zdekodowanych obrazów. W starszych projektach, takich jak MPEG-1 i H.262/MPEG-2, każdy obraz B może odnosić się tylko do dwóch obrazów, tego, który poprzedza obraz B w kolejności wyświetlania i tego, który następuje po nim, a wszystkie obrazy odniesienia muszą być I lub Zdjęcia P. Te ograniczenia nie mają zastosowania w nowszych standardach H.264/MPEG-4 AVC i HEVC .
Obraz D lub ramka D (obraz kodowany bezpośrednio DC) — służy jako szybka reprezentacja obrazu w celu zapewnienia odporności na straty lub szybkiego przewijania do przodu. Obrazy D są używane tylko w MPEG-1 .

Ramka I wskazuje początek grupy GOP. Następnie następuje kilka ramek P i B. W starszych projektach dozwolona struktura porządkowania i odwoływania się jest stosunkowo ograniczona.

Ramki I zawierają pełny obraz i nie wymagają żadnych dodatkowych informacji do ich odtworzenia. Zazwyczaj kodery używają struktur GOP, które powodują, że każda ramka I jest „czystym punktem dostępu losowego”, tak że dekodowanie może rozpocząć się czysto na ramce I, a wszelkie błędy w strukturze GOP są korygowane po przetworzeniu prawidłowej ramki I.

W nowszych projektach znalezionych w H.264/MPEG-4 AVC i HEVC kodery mają znacznie większą elastyczność w zakresie struktur odniesienia. Mogą używać tych samych struktur odniesienia, które były wcześniej używane w starszych projektach, lub mogą użyć większej liczby obrazów jako odniesienia i mogą zastosować bardziej elastyczne uporządkowanie kolejności kodowania w stosunku do kolejności wyświetlania. Mogą również używać obrazów B jako odniesień podczas kodowania innych obrazów (B lub P). Ta dodatkowa elastyczność może poprawić wydajność kompresji, ale może spowodować propagację błędów, jeśli niektóre dane zostaną utracone lub uszkodzone. Jedną z popularnych struktur stosowanych w nowszych projektach jest hierarchia obrazów B. Hierarchiczne obrazy B mogą zapewniać bardzo dobrą wydajność kompresji, a także mogą ograniczać propagację błędów, ponieważ hierarchia może zapewnić, że liczba obrazów, których dotyczy jakikolwiek problem z uszkodzeniem danych, jest ściśle ograniczona.

Ogólnie rzecz biorąc, im więcej klatek I ma strumień wideo, tym łatwiej jest go edytować. Jednak posiadanie większej liczby klatek I znacznie zwiększa przepływność potrzebną do zakodowania wideo.

Struktura GOP

Struktura GOP jest często określana przez dwie liczby, na przykład M=3, N=12. Pierwsza liczba określa odległość między dwiema ramami kotwiącymi (I lub P). Drugi określa odległość między dwoma pełnymi obrazami (I-ramki): jest to rozmiar GOP. Dla przykładu M=3, N=12 struktura GOP to IBBPBBPBBPBBI. Zamiast parametru M można zastosować maksymalną liczbę ramek B między dwiema kolejnymi ramkami kotwiącymi.

Na przykład w sekwencji ze wzorcem IBBBBPBBBBPBBBBI rozmiar GOP ( wartość N ) jest równy 15 (długość między dwiema ramkami I), a odległość między dwiema ramkami kontrolnymi ( wartość M ) wynosi 5 (długość między ramkami I i P lub długość między dwie kolejne ramki P).

^ „Klatki kluczowe, kompresja międzyklatkowa i wideo” . 13 kwietnia 2021 r.
^ „Ramki B” .
^ „Instrukcja obsługi sprężarki 4” .

[1] „Klatki kluczowe, kompresja międzyklatkowa i wideo” . 13 kwietnia 2021 r.

[2] „Ramki B” .

[3] „Instrukcja obsługi sprężarki 4” .