Wydajność przechowywania

Efektywność pamięci masowej to zdolność do przechowywania danych i zarządzania nimi, które zajmują najmniej miejsca i mają niewielki lub żaden wpływ na wydajność; co skutkuje niższymi całkowitymi kosztami operacyjnymi. Wydajność odpowiada rzeczywistym wymaganiom zarządzania kosztami, zmniejszania złożoności i ograniczania ryzyka. Stowarzyszenie Storage Networking Industry Association (SNIA) definiuje wydajność pamięci masowej w słowniku SNIA w następujący sposób:

{\ Displaystyle {\ tekst {wydajność pamięci}} = {\ Frac {{\ tekst {efektywna pojemność}} + {\ tekst {wolna pojemność}}} {\ tekst {pojemność pierwotna}}}.}

zastosowanej kombinacji RAID , dublowania i innych technologii ochrony danych, a może być jeszcze niższa w przypadku wysoce redundantnych zdalnie lustrzanych systemów. Gdy dane są przechowywane w systemie, technologie takie jak deduplikacja i kompresja mogą przechowywać dane w stosunku rozmiaru danych do zajmowanego miejsca większym niż 1 do 1, a wydajność wzrasta, często do ponad 100% w przypadku danych podstawowych, a tysiące procent dla danych kopii zapasowej.

Technologie

Różne technologie istnieją na różnych, a czasem na wielu poziomach:

Technologia migawek — znana formalnie jako „technologia migawek delta” — umożliwia wielokrotne korzystanie z tego samego zestawu danych z wielu powodów, przy jednoczesnym przechowywaniu tylko zmian między poszczególnymi zestawami danych. Niektórzy dostawcy pamięci masowych integrują swoje funkcje migawek na poziomie systemu operacyjnego i/lub aplikacji, umożliwiając dostęp do danych przechowywanych przez migawki w warstwach zarządzania systemem i/lub aplikacjami. Terminologia dotycząca migawek i „klonów” jest obecnie myląca i należy zachować ostrożność przy ocenie roszczeń dostawców. W szczególności niektórzy dostawcy nazywają kopie pełnych punktów w czasie „migawkami” lub „klonami”, podczas gdy inni używają tych samych terminów w odniesieniu do migawek „delta” lub klonów współdzielonego bloku. Niektóre implementacje mogą wykonywać migawki tylko do odczytu, podczas gdy inne są w stanie zapewnić również zapisywalne.

Technologię deduplikacji danych można wykorzystać do bardzo wydajnego śledzenia i usuwania zduplikowanych bloków danych w jednostce pamięci. Istnieje wiele implementacji, z których każda ma swoje zalety i wady. Deduplikacja jest najbardziej wydajna w warstwie współdzielonej pamięci masowej, jednak istnieją implementacje w oprogramowaniu, a nawet w bazach danych. Najbardziej odpowiednimi kandydatami do deduplikacji są tworzenie kopii zapasowych i wirtualizacja platformy , ponieważ obie aplikacje zwykle tworzą lub używają wielu niemal identycznych kopii. Jednak niektórzy dostawcy oferują obecnie deduplikację w miejscu, która deduplikuje podstawową pamięć masową.

Technologia cienkiego przydzielania zasobów to technika zapobiegająca niepełnemu wykorzystaniu przez współdzielenie przydzielonej, ale jeszcze niewykorzystanej pojemności. Dobrym przykładem jest Gmail , gdzie każde konto Gmail ma dużą ilość przydzielonej pojemności. Ponieważ większość użytkowników Gmaila wykorzystuje tylko ułamek przydzielonej pojemności, to „wolne miejsce” jest „dzielone” między wszystkich użytkowników Gmaila.

Główne zalety

Aktywne zwiększanie wydajności pamięci masowej za pomocą tych technik ma następujące zalety:

Tworzenie kopii zapasowych i przywracanie . Używając migawek, można zminimalizować czas potrzebny na tworzenie kopii zapasowych i przywracanie RTO . Może to znacznie obniżyć koszty i skrócić godziny przestojów do sekund przestojów. Migawki pozwalają również na uzyskanie lepszych RPO .

Zmniejszenie powierzchni . Gdy do przechowywania określonej ilości danych potrzeba mniej pamięci, wymagana jest mniejsza powierzchnia centrum danych.

Zmniejszenie zużycia energii . Gdy potrzeba mniej wrzecion do przechowywania danej ilości danych, wymagana jest mniejsza moc.

Wydajność udostępniania . Technologia zapisywalnych migawek delta umożliwia bardzo szybkie dostarczanie zapisywalnych kopii danych. Skraca to czas oczekiwania w procesach wymagających tych danych. Przykładami są eksploracja danych , dane testowe itp. Integracja migawek na poziomie systemu operacyjnego i/lub aplikacji prowadzi również do szybszego udostępniania, ponieważ menedżerowie systemu i/lub aplikacji mogą zarządzać własnymi migawkami bez konieczności czekania na menedżerów pamięci masowej i/lub procedury zaopatrzenia.

Główni gracze komercyjni

Wszyscy główni dostawcy wdrażają jedną lub więcej z tych technologii, ponieważ wydajność pamięci masowej staje się coraz bardziej popularna. Klienci mają do czynienia z zapotrzebowaniem na pamięć masową, które rośnie wykładniczo i silnym żądaniem cięcia kosztów. Główni dostawcy to NetApp , EMC , HDS , IBM i HP .