Pięć sejfów

Pięć Sejfów to ramy pomagające podejmować decyzje dotyczące efektywnego wykorzystania danych, które są poufne lub wrażliwe. Jest używany głównie do opisywania lub projektowania dostępu badawczego do danych statystycznych przechowywanych przez agencje rządowe i archiwa danych, takie jak UK Data Service .

Dwa z pięciu sejfów odnoszą się do statystycznej kontroli ujawnień , dlatego pięć sejfów jest zwykle używanych do kontrastowania kontroli statystycznych i niestatystycznych podczas porównywania opcji zarządzania danymi.

Pojęcie

The Five Safes proponuje, aby decyzje dotyczące zarządzania danymi były rozpatrywane jako rozwiązywanie problemów w pięciu „wymiarach”: projekty, ludzie, ustawienia, dane i wyniki. Połączenie elementów sterujących prowadzi do „bezpiecznego użytkowania”. Są one najczęściej wyrażane w formie pytań, na przykład:

Bezpieczne projekty Czy takie wykorzystanie danych jest właściwe?
Bezpieczni ludzie Czy można ufać użytkownikom, że użyją go w odpowiedni sposób?
Bezpieczne ustawienia Czy urządzenie dostępu ogranicza nieautoryzowane użycie?
Bezpieczne dane Czy w samych danych istnieje ryzyko ujawnienia?
Bezpieczne wyjścia Czy wyniki statystyczne są niejawne?

Te wymiary to skale, a nie granice. Oznacza to, że rozwiązania mogą zawierać więcej lub mniej elementów sterujących w każdym wymiarze, ale ogólny cel „bezpiecznego użytkowania” jest niezależny od konkretnego zestawu. Na przykład plik użytku publicznego dostępny do otwartego pobrania nie może kontrolować, kto go używa, gdzie iw jakim celu, dlatego cała kontrola (ochrona) musi znajdować się w samych danych. Z kolei plik, do którego dostęp uzyskuje się wyłącznie w bezpiecznym środowisku z certyfikowanymi użytkownikami, może zawierać bardzo poufne informacje: niestatystyczne kontrole sprawiają, że dane są „niebezpieczne”. Pewien naukowiec porównał ten proces do korektora graficznego, w którym tony niskie i wysokie można łączyć niezależnie, aby uzyskać dźwięk, który lubi słuchacz.

Nie ma żadnego „porządku” dla Pięciu Sejfów, ponieważ jeden z nich jest z konieczności ważniejszy niż inne. Jednak Ritchie argumentował, że kontrole „zarządcze” (projekty, ludzie, otoczenie) powinny być rozpatrywane przed kontrolami „statystycznymi” (dane, wyniki).

Koncepcja pięciu sejfów jest powiązana z innymi tematami, które rozwinęły się z tego samego programu w ONS, chociaż niekoniecznie są one realizowane. Bezpieczni ludzie są kojarzeni z „aktywnym zarządzaniem badaczami”, podczas gdy bezpieczne wyniki są powiązane z opartą na zasadach kontrolą ujawniania danych statystycznych.

Pięć sejfów to pozytywne ramy opisujące, co jest, a co nie. Model postaw EDRU („oparty na dowodach, domyślnie otwarty, zarządzany ryzykiem, zorientowany na użytkownika”) jest czasami używany do nadania kontekstu normatywnego

„Widmo dostępu do danych”

Od 2003 roku Pięć Sejfów było również reprezentowane w prostszej formie jako „Data Access Spectrum”. Kontrole niezwiązane z danymi (projekt, ludzie, otoczenie, wyniki) mają tendencję do współpracy, ponieważ organizacje często postrzegają je jako uzupełniający się zestaw ograniczenia w dostępie. Można je następnie zestawić z wyborami dotyczącymi anonimizacji danych, aby przedstawić liniową reprezentację opcji dostępu do danych. Ta prezentacja jest zgodna z ideą „danych jako pozostałości”, a także z ówczesnymi przepisami o ochronie danych, które często charakteryzowały dane po prostu jako anonimowe lub nieanonimowe.

Podobny pomysł został już niezależnie opracowany w 2001 roku przez Chucka Humphreya z kanadyjskiej sieci RDC, „kontinuum dostępu”. Niedawno Instytut Otwartych Danych opracował „zestaw narzędzi Data Spectrum”, który zawiera przykłady branżowe.

Historia i terminologia

Pięć sejfów zostało wymyślonych zimą 2002/2003 przez Felixa Ritchiego z brytyjskiego Urzędu Statystyk Narodowych (ONS) w celu opisania jego bezpiecznego, zdalnego, wirtualnego laboratorium mikrodanych (VML). W tym czasie został opisany jako „Model bezpieczeństwa VML”. Zostało to przyjęte przez NORC , a szerzej w Stanach Zjednoczonych, jako „model portfelowy” (chociaż obecnie jest to również używane w odniesieniu do nieco innego podziału prawnego/statystycznego/edukacyjnego). W 2012 r. ramę nadal nazywano „modelem bezpieczeństwa VML”, ale jej coraz częstsze stosowanie wśród organizacji spoza Wielkiej Brytanii doprowadziło do przyjęcia bardziej ogólnego i pouczającego sformułowania „Pięć sejfów”.

Oryginalna rama zawierała tylko cztery sejfy (projekty, ludzie, ustawienia i wyniki): rama była używana do opisywania bardzo szczegółowego dostępu do danych przez bezpieczne środowisko, więc wymiar „dane” był nieistotny. Od 2007 r. uwzględniano „bezpieczne dane”, ponieważ ramy były wykorzystywane do opisywania szerszego zakresu działań ONS. Ponieważ wersja amerykańska była oparta na specyfikacji z 2005 r., niektóre iteracje amerykańskie mają oryginalne cztery wymiary (np.).

Niektóre dyskusje, takie jak OECD, używają terminu „bezpieczny” zamiast „bezpieczny”. Jednak użycie obu tych terminów może powodować problemy z prezentacją: mniejsza kontrola w określonym wymiarze może oznaczać na przykład „niebezpiecznych użytkowników” lub „niepewne ustawienia”, co odwraca uwagę od głównego przesłania. Dlatego rząd Australii używa terminu „pięć zasad udostępniania danych”.

„Ramy podejmowania decyzji w sprawie anonimizacji” wykorzystują ramy oparte na pięciu sejfach, ale zmieniając nazwy „projektów”, „ludzi” i „ośrodków” odpowiednio na „zarządzanie”, „agencja” i „infrastruktura”; „Wyjście” jest pomijane, a „bezpieczne użytkowanie” staje się „anonimizacją funkcjonalną”. Nie ma odniesienia do Pięciu Sejfów ani żadnej powiązanej literatury. Wersja australijska musiała zawierać odniesienia do Pięciu Sejfów i przedstawiała ją jako alternatywę bez komentarza.

Aplikacja

Ramy miały trzy zastosowania: pedagogiczne, opisowe i projektowe. Ten ostatni jest stosunkowo nowym osiągnięciem.

Pedagogia

Pierwszym znaczącym zastosowaniem ram, innym niż wewnętrzne zastosowanie administracyjne, było ustrukturyzowanie kursów szkoleniowych dla naukowców w brytyjskim Urzędzie ds. Statystyk Narodowych od 2003 r. Archiwum danych w Wielkiej Brytanii, Administrative Data Research Network, Eurostat , Statistics New Zealand , Statystyka i Geografia , NORC , Statistics Canada i Australijskie Biuro Statystyczne również korzystały z tych ram. Większość z tych kursów jest przeznaczona dla naukowców korzystających z obiektów o ograniczonym dostępie; kursy Eurostatu są niezwykłe, ponieważ są przeznaczone dla wszystkich użytkowników danych wrażliwych.

Opis

Ramy te są często wykorzystywane do opisywania istniejących rozwiązań w zakresie dostępu do danych (np. UK HMRC Data Lab, UK Data Service, Statistics New Zealand) lub rozwiązań planowanych/koncepcyjnych (np. Eurostat w 2011 r.). Wczesne zastosowanie miało pomóc zidentyfikować obszary, w których ONS nadal ponosi „nieredukowalne ryzyko” w zapewnianiu bezpiecznego zdalnego dostępu.

Ramy są najczęściej używane do poufnych danych z nauk społecznych. Jak dotąd wydaje się, że miało to niewielki wpływ na planowanie badań medycznych, chociaż jest teraz uwzględnione w zmienionych wytycznych dotyczących wdrażania HIPAA w USA oraz przez Cancer Research UK i Health Foundation w Wielkiej Brytanii. Został również użyty do opisania modelu bezpieczeństwa dla Scottish Health Informatics Programme.

Projekt

Ogólnie rzecz biorąc, Pięć Sejfów było używanych do opisywania rozwiązań post factum oraz do wyjaśniania/uzasadniania dokonanych wyborów, ale coraz większa liczba organizacji korzysta z ram do projektowania rozwiązań dostępu do danych. Na przykład Grecka Agencja Statystyczna opracowała w 2016 r. strategię dotyczącą danych opartą na pięciu sejfach; brytyjska Fundacja Zdrowia wykorzystała Pięć Sejfów do zaprojektowania swoich programów szkoleniowych i zarządzania danymi. Używanie w sektorze prywatnym jest mniej powszechne, ale niektóre organizacje włączyły Pięć Sejfów do usług konsultingowych.

Główne zastosowanie projektu ma miejsce w Australii: zarówno Australijskie Biuro Statystyczne, jak i Australijski Departament Opieki Społecznej wykorzystały Pięć Sejfów jako narzędzie do projektowania ex ante. W 2017 r. australijska komisja ds. produktywności zaleciła przyjęcie wersji ram wspierających udostępnianie i ponowne wykorzystywanie danych między rządami. Jest to obecnie przedmiotem konsultacji z projektami legislacyjnymi spodziewanymi w 2020 r.

W 2015 r. brytyjska Data Service zorganizowała warsztaty, aby zachęcić użytkowników danych z sektora akademickiego i prywatnego do zastanowienia się, jak zarządzać poufnymi danymi badawczymi, wykorzystując pięć sejfów, aby zademonstrować alternatywne opcje i najlepsze praktyki.

Sejfy Fives zostały włączone do dwóch przepisów: wyraźnie w ustawie o sektorze publicznym (udostępnianie danych) Australii Południowej z 2016 r. , pośrednio w przepisach dotyczących badań zawartych w ustawie o gospodarce cyfrowej .

Publiczne zaangażowanie

UK Data Service stworzyło blog i wideo dla ogółu społeczeństwa na temat wykorzystania Five Safes w ponownym wykorzystywaniu danych administracyjnych. Statistics New Zealand przygotowało opis nietechniczny, podobnie jak ONS z okazji Dnia Ochrony Danych Osobowych 2017. Australijski rząd federalny wyprodukował kilka filmów na temat udostępniania danych, w tym Zasady udostępniania danych.

Linki zewnętrzne