Ciągła ochrona danych

Ciągła ochrona danych ( CDP ), zwana także ciągłą kopią zapasową lub kopią zapasową w czasie rzeczywistym , odnosi się do tworzenia kopii zapasowych danych komputerowych poprzez automatyczne zapisywanie kopii każdej zmiany dokonanej w tych danych, zasadniczo przechwytując każdą wersję danych zapisanych przez użytkownika. W swojej prawdziwej postaci pozwala użytkownikowi lub administratorowi przywrócić dane do dowolnego punktu w czasie. Technika ta została opatentowana przez brytyjskiego przedsiębiorcę Pete'a Malcolma w 1989 roku jako „system kopii zapasowych, w którym kopia [ podkreślenie redaktora] każdej zmiany dokonanej na nośniku pamięci jest rejestrowana w momencie wystąpienia zmiany [podkreślenie redaktora]”.

W idealnym przypadku ciągłej ochrony danych cel punktu przywracania — „maksymalny docelowy okres, w którym dane (transakcje) mogą zostać utracone z usługi IT z powodu poważnego incydentu” — wynosi zero, mimo że docelowy czas odzyskiwania — docelowy czas i poziom usług, w ramach których proces biznesowy musi zostać przywrócony po katastrofie (lub zakłóceniu), aby uniknąć niedopuszczalnych konsekwencji związanych z przerwaniem ciągłości działania” – nie wynosi zero. Przykładem okresu, w którym transakcje danych mogą zostać utracone, jest duża sieć dyskontów, w której czytniki kart przy kasach zostały wyłączone w wielu lokalizacjach na blisko dwie godziny w czerwcu 2019 r.

CDP działa jako usługa, która przechwytuje zmiany danych w osobnej lokalizacji przechowywania. Istnieje wiele metod rejestrowania ciągłych danych w czasie rzeczywistym, obejmujących różne technologie, które służą różnym potrzebom. Prawdziwe rozwiązania oparte na protokole CDP mogą zapewniać dużą szczegółowość przywracanych obiektów, począwszy od obrazów spójnych w przypadku awarii, a skończywszy na obiektach logicznych, takich jak pliki, skrzynki pocztowe, wiadomości oraz pliki baz danych i dzienniki. Niekoniecznie jest to prawdą w przypadku rozwiązań zbliżonych do -CDP .

Różnice w stosunku do tradycyjnego tworzenia kopii zapasowych

Prawdziwie ciągła ochrona danych różni się od tradycyjnego tworzenia kopii zapasowych tym, że nie jest konieczne określanie punktu w czasie, od którego ma nastąpić odzyskiwanie do momentu gotowości do przywrócenia. Tradycyjne kopie zapasowe przywracają dane tylko od momentu utworzenia kopii zapasowej. Prawdziwie ciągła ochrona danych, w przeciwieństwie do „migawek”, nie ma harmonogramów tworzenia kopii zapasowych. Gdy dane są zapisywane na dysku, są one również asynchronicznie zapisywane w drugiej lokalizacji, na innym komputerze w sieci lub urządzeniu. Wprowadza to pewne narzuty do operacji zapisu na dysku, ale eliminuje potrzebę tworzenia zaplanowanych kopii zapasowych.

Umożliwiając przywracanie danych do dowolnego punktu w czasie, „CDP jest złotym standardem — najbardziej wszechstronną i zaawansowaną ochroną danych. Jednak technologie zbliżone do CDP mogą zapewnić wystarczającą ochronę dla wielu firm przy mniejszej złożoności i kosztach. Na przykład migawki [„blisko CDP” -CDP” wyjaśnienie w sekcji poniżej ] może zapewnić rozsądny poziom ochrony udziałów plików zbliżony do CDP, umożliwiając użytkownikom bezpośredni dostęp do danych w udziale plików w regularnych odstępach czasu — powiedzmy co pół godziny lub 15 minut. To z pewnością wyższa wyższy poziom ochrony niż nocne kopie zapasowe na taśmach lub dyskach i może to wszystko, czego potrzebujesz”. Ponieważ „prawie CDP wykonuje to [kopiowanie] we wcześniej ustalonych odstępach czasu”, zasadniczo jest to przyrostowa kopia zapasowa inicjowana - oddzielnie dla każdej maszyny źródłowej - przez zegar zamiast skryptu.

Ciągły vs prawie ciągły

Ponieważ prawdziwe CDP „operacje zapisu kopii zapasowej są wykonywane na poziomie podstawowego systemu wejścia/wyjścia (BIOS) mikrokomputera w taki sposób, że nie ma to wpływu na normalne użytkowanie komputera”, prawdziwa kopia zapasowa CDP musi w praktyce być uruchamiana w połączeniu z maszynę wirtualną lub jej odpowiednik — wykluczając to w przypadku zwykłych osobistych aplikacji do tworzenia kopii zapasowych. Dlatego jest omówiony w „Kopia zapasowa klienta-serwera w przedsiębiorstwie” , a nie w artykule „ Kopia zapasowa ”.

Niektóre rozwiązania sprzedawane jako ciągła ochrona danych mogą zezwalać na przywracanie tylko w stałych odstępach czasu, na przykład co 15 minut, godzinę lub 24 godziny, ponieważ automatycznie wykonują przyrostowe kopie zapasowe w tych odstępach czasu. Takie schematy „near-CDP” — skrót od słowa „ niemal ciągła ochrona danych” — nie są powszechnie uznawane za prawdziwie ciągłą ochronę danych, ponieważ nie zapewniają możliwości przywrócenia do dowolnego punktu w czasie. Gdy interwał jest krótszy niż jedna godzina, rozwiązania „blisko CDP” — na przykład Arq Backup — są zazwyczaj oparte na okresowych „migawkach” ; „aby uniknąć przestojów, systemy o wysokiej dostępności mogą zamiast tego wykonywać kopie zapasowe na… kopii zestawu danych tylko do odczytu zamrożonej w określonym momencie - i zezwalać aplikacjom na dalsze zapisywanie ich danych”.

W branży toczy się debata na temat tego, czy granulacja kopii zapasowej musi być „każdy zapis”, aby była CDP, czy też rozwiązanie „prawie CDP”, które przechwytuje dane co kilka minut, jest wystarczająco dobre. Ta ostatnia jest czasami nazywana niemal ciągłą kopią zapasową . Debata toczy się wokół użycia terminu „ ciągły” : czy tylko proces tworzenia kopii zapasowej musi być stale automatycznie planowany , co często wystarcza do osiągnięcia wyżej wymienionych korzyści , czy też możliwość odtwarzania z kopii zapasowej również musi być ciągła. Stowarzyszenie Storage Networking Industry Association (SNIA) używa definicji „każdego zapisu”.

W artykule „Kopia zapasowa” znajduje się krótsza podsekcja na ten temat, której nazwa została teraz zmieniona na „Near-CDP” , aby uniknąć nieporozumień.

Różnice w stosunku do RAID, replikacji czy dublowania

Ciągła ochrona danych różni się od RAID , replikacji lub dublowania tym, że te technologie chronią tylko jedną kopię danych (najnowszą). Jeśli dane zostaną uszkodzone w sposób, który nie zostanie natychmiast wykryty, technologie te po prostu chronią uszkodzone dane bez możliwości przywrócenia nieuszkodzonej wersji.

Ciągła ochrona danych chroni przed niektórymi skutkami uszkodzenia danych, umożliwiając przywrócenie poprzedniej, nieuszkodzonej wersji danych. Transakcje, które miały miejsce między wydarzeniem niszczącym a przywróceniem, zostaną jednak utracone. Można je odzyskać za pomocą innych środków, takich jak kronikowanie .

Rozmiar dysku kopii zapasowej

W niektórych sytuacjach ciągła ochrona danych wymaga mniej miejsca na nośnikach kopii zapasowych (zwykle na dysku) niż tradycyjna kopia zapasowa. Większość rozwiązań do ciągłej ochrony danych zapisuje bajtów lub bloków, a nie różnice na poziomie plików . Oznacza to, że jeśli jeden bajt pliku o wielkości 100 GB zostanie zmodyfikowany, kopia zapasowa zostanie utworzona tylko dla zmienionego bajtu lub bloku. Tradycyjne przyrostowe i różnicowe kopie zapasowe tworzą kopie całych plików; jednak od około 2013 r. korporacyjne aplikacje do tworzenia kopii zapasowych typu klient-serwer zaimplementowały możliwość tworzenia przyrostowych kopii zapasowych na poziomie bloków , zaprojektowaną dla dużych plików, takich jak bazy danych.

Ryzyka i wady

Gdy zmiany w czasie rzeczywistym — zwłaszcza w środowiskach multimedialnych i projektowych CAD — są archiwizowane poza siedzibą firmy przez kanał upstream sieci szerokopasmowej instalacji, może być konieczne ograniczenie przepustowości sieci w celu zmniejszenia wpływu rzeczywistego protokołu CDP. Alternatywnym podejściem jest utworzenie kopii zapasowej na oddzielnym SAN podłączonym do Fibre-Channel .

Zobacz też