Predykcyjna analiza awarii

Analiza predykcyjna awarii ( PFA ) odnosi się do metod mających na celu przewidywanie zbliżającej się awarii systemów lub komponentów (oprogramowania lub sprzętu) i potencjalnie umożliwia mechanizmy unikania lub przeciwdziałania awariom lub zalecania konserwacji systemów przed awarią.

Na przykład mechanizmy komputerowe, które analizują trendy w poprawianych błędach, aby przewidzieć przyszłe awarie komponentów sprzętu/pamięci i proaktywnie umożliwiają mechanizmy ich unikania. Analiza predykcyjna awarii była pierwotnie używana jako termin określający zastrzeżoną IBM do monitorowania prawdopodobieństwa awarii dysków twardych , chociaż termin ten jest obecnie używany ogólnie w odniesieniu do różnych technologii oceny zbliżającej się awarii procesora, pamięci i urządzeń we / wy . Zobacz także przechwytywanie danych o pierwszej awarii.

Dyski

IBM wprowadził termin PFA i swoją technologię w 1992 roku w odniesieniu do swojego napędu 0662-S1x ( dysk Fast-Wide SCSI-2 o pojemności 1052 MB, który działał z prędkością 5400 obr./min ).

Technologia polega na pomiarze kilku kluczowych (głównie mechanicznych) parametrów jednostki napędowej, np. wysokości lotu głowic . Oprogramowanie układowe dysku porównuje zmierzone parametry z predefiniowanymi wartościami progowymi i ocenia stan dysku. Jeśli dysk prawdopodobnie wkrótce ulegnie awarii, system wysyła powiadomienie do kontrolera dysku.

Do głównych wad technologii należały:

  • wynik binarny - jedynym statusem widocznym dla hosta była obecność lub brak powiadomienia
  • komunikacja jednokierunkowa - powiadomienie o wysłaniu oprogramowania układowego napędu

Technologia połączyła się z IntelliSafe, tworząc technologię samokontroli, analizy i raportowania (SMART).

Procesor i pamięć

Wysoka liczba poprawionych sporadycznych błędów pamięci RAM przez ECC może przewidywać przyszłe awarie DIMM , dlatego można zastosować automatyczne wyłączanie pamięci podręcznej i pamięci podręcznej procesora, aby uniknąć przyszłych błędów, na przykład w systemie operacyjnym Linux demon mcelog automatycznie usunie ze stron pamięci użytkowania pokazujące nadmierne poprawki i usunie z użycia rdzenie procesorów pokazujące nadmierne błędy pamięci podręcznej, które można naprawić.

Nośniki optyczne

W przypadku nośników optycznych ( CD , DVD i Blu-ray ) można przewidzieć awarie spowodowane degradacją nośnika , a nośniki o niskiej jakości produkcyjnej można wykryć przed utratą danych, mierząc odsetek możliwych do naprawienia błędów danych za pomocą oprogramowania takiego jak QpxTool lub Nero Disc Speed . Jednak nie wszyscy dostawcy i modele napędów optycznych umożliwiają skanowanie błędów.

Zobacz też