System uchwytów
System uchwytów to zastrzeżony rejestr Corporation for National Research Initiatives, który przypisuje trwałe identyfikatory lub uchwyty do zasobów informacyjnych oraz do przekształcania „tych uchwytów w informacje niezbędne do zlokalizowania, uzyskania dostępu i innego wykorzystania zasobów”.
Podobnie jak w przypadku uchwytów używanych w innych miejscach w informatyce, uchwyty systemu uchwytów są nieprzejrzyste i nie kodują żadnych informacji o zasobie źródłowym, ponieważ są powiązane tylko z metadanymi dotyczącymi zasobu. W związku z tym uchwyty nie są unieważniane przez zmiany w metadanych.
System został opracowany przez Boba Kahna z Corporation for National Research Initiatives (CNRI). Oryginalna praca została sfinansowana przez Agencję Zaawansowanych Projektów Badawczych Obrony (DARPA) w latach 1992-1996 jako część szerszych ram dla usług rozproszonych obiektów cyfrowych, a zatem była równoczesna z wczesnym wdrożeniem sieci WWW i miała podobne cele.
System Handle został po raz pierwszy wdrożony jesienią 1994 r. I był administrowany i obsługiwany przez CNRI do grudnia 2015 r., Kiedy to wprowadzono nowy tryb działania „wielu podstawowych administratorów” (MPA). Fundacja DONA zarządza teraz systemem Global Handle Registry i akredytuje MPA, w tym CNRI i International DOI Foundation. Obecnie system zapewnia podstawową infrastrukturę dla takich systemów opartych na uchwytach, jak Digital Object Identifiers i DSpace , które są wykorzystywane głównie do zapewniania dostępu do dokumentów naukowych, zawodowych i rządowych oraz innych zasobów informacyjnych.
CNRI dostarcza specyfikacje i kod źródłowy dla implementacji referencyjnych dla serwerów i protokołów używanych w systemie na nieodpłatnej „Licencji Publicznej”, podobnej do licencji open source.
Tysiące obsługiwanych usług jest obecnie uruchomionych. Ponad 1000 z nich znajduje się na uniwersytetach i bibliotekach, ale działają one również w laboratoriach krajowych, grupach badawczych, agencjach rządowych i przedsiębiorstwach komercyjnych, otrzymując ponad 200 milionów wniosków o rozwiązanie problemu miesięcznie.
Specyfikacje
System obsługi jest zdefiniowany w informacyjnych dokumentach RFC 3650, 3651 i 3652 Internet Engineering Task Force (IETF) ; zawiera otwarty zestaw protokołów, przestrzeń nazw i referencyjną implementację protokołów. Dokumentacja, oprogramowanie i powiązane informacje są udostępniane przez CNRI na dedykowanej stronie internetowej
Uchwyty składają się z przedrostka, który identyfikuje „organ nazewnictwa” i sufiksu, który podaje „nazwę lokalną” zasobu. Podobnie jak w przypadku nazw domen, prefiksy są wydawane władzom nazewniczym przez jednego z „wielopodstawowych administratorów” systemu po uiszczeniu opłaty, którą należy corocznie odnawiać. Organ nazewniczy może utworzyć dowolną liczbę uchwytów z unikalnymi „nazwami lokalnymi” w ramach przypisanych im przedrostków. Przykładem uchwytu jest:
20.1000/100
2381/12345
W pierwszym przykładzie, który jest uchwytem licencji oprogramowania HANDLE.NET, 20.1000
to prefiks przypisany do organu nazewnictwa (w tym przypadku samego Handle.net), a 100
to nazwa lokalna w tej przestrzeni nazw. Nazwa lokalna może składać się z dowolnych znaków z Unicode UCS-2 . Przedrostek składa się również z dowolnych znaków UCS-2 innych niż „/”. Przedrostki składają się z jednego lub więcej segmentów uprawnień do nazewnictwa, oddzielonych kropkami, reprezentujących hierarchię uprawnień do nazewnictwa. Tak więc w przykładzie 20
jest prefiksem organu nazewnictwa dla CNRI, podczas gdy 1000
oznacza podrzędny organ nazewniczy w obrębie przedrostka 20. Inne przykłady przedrostków najwyższego poziomu dla federacyjnych organów nazewniczych Fundacji DONA to 10
dla uchwytów DOI; 11
dla uchwytów nadanych przez ITU ; 21
dla uchwytów wydane przez niemieckie Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), naukowe centrum obliczeniowe Uniwersytetu w Getyndze ; i 86
dla Coalition of Handle Services – Chiny. Starsze „starsze” prefiksy wydawane przez CNRI przed ustanowieniem struktury „wielu podstawowych administratorów” (MPA) składają się zazwyczaj z czterech z pięciu cyfr, jak w drugim przykładzie powyżej, uchwyt administrowany przez University of Leicester . Wszystkie prefiksy muszą być zarejestrowane w rejestrze Global Handle Registry za pośrednictwem rejestratora zatwierdzonego przez Fundację DONA, zwykle za opłatą.
Podobnie jak w przypadku innych zastosowań uchwytów w komputerach, uchwyt jest nieprzezroczysty; to znaczy, że nie koduje żadnych informacji o zasobie źródłowym i zapewnia jedynie środki do pobierania metadanych o zasobie.
Można to porównać z Uniform Resource Locator (URL), który może kodować w identyfikatorze takie atrybuty zasobu, jak protokół, który ma być używany w celu uzyskania dostępu do serwera przechowującego zasób, nazwę hosta serwera i numer portu, a być może nawet lokalizację szczegóły, takie jak nazwa pliku w systemie plików serwera zawierającego zasób. W systemie uchwytów te szczegóły nie są zakodowane w uchwycie, ale znajdują się w metadanych, z którymi uchwyt jest powiązany.
Metadane mogą zawierać wiele atrybutów zasobu informacyjnego, takich jak jego lokalizacja, formy, w jakich jest dostępny, rodzaje oferowanego dostępu (np. „bezpłatny” czy „płatny”) i dla kogo. Przetwarzanie metadanych w celu określenia, w jaki sposób i gdzie należy uzyskać dostęp do zasobu, oraz udostępnianie zasobu użytkownikowi, odbywa się w oddzielnym kroku, zwanym „rozwiązaniem”, przy użyciu Resolvera, serwera, który może różnić się od zaangażowane w wymianę uchwytu na metadane. W przeciwieństwie do adresów URL, które mogą stać się nieprawidłowe, jeśli osadzone w nich metadane staną się nieprawidłowe, uchwyty nie tracą ważności i nie muszą być zmieniane, gdy zmieniają się lokalizacje lub inne atrybuty metadanych. To pomaga zapobiegać link rot , ponieważ zmiany w zasobie informacyjnym (takim jak lokalizacja) muszą być odzwierciedlone jedynie w zmianach metadanych, a nie w zmianach każdego odniesienia do zasobu.
Każdy uchwyt może mieć własnego administratora, a administrowanie uchwytami może odbywać się w środowisku rozproszonym, podobnie jak w przypadku nazw domen DNS. Powiązania nazwa-wartość mogą być również zabezpieczone, zarówno za pomocą podpisów w celu weryfikacji danych, jak i odpowiedzi na wezwanie w celu zweryfikowania transmisji danych, umożliwiając użycie uchwytów w aplikacjach do zarządzania zaufaniem.
Możliwe jest, aby ten sam podstawowy zasób informacji był powiązany z wieloma uchwytami, tak jak w przypadku, gdy dwie biblioteki uniwersyteckie generują uchwyty (a zatem prawdopodobnie różne zestawy metadanych) dla tej samej książki.
System uchwytów jest zgodny z systemem nazw domen (DNS), ale go nie wymaga, w przeciwieństwie do trwałych identyfikatorów, takich jak PURL lub ARK , które są podobne do uchwytów, ale wykorzystują nazwy domen. Jednak w przeciwieństwie do podejść opartych na nazwach domen, uchwyty wymagają oddzielnego procesu rejestracji prefiksu i obsługują serwery oddzielnie od serwerów nazw domen.
Uchwyty mogą być używane natywnie lub wyrażone jako Uniform Resource Identifiers (URI) poprzez przestrzeń nazw w schemacie info URI ; na przykład 20.1000/100
można zapisać jako identyfikator URI, info:hdl/20.1000/100
. Niektóre przestrzenie nazw systemu obsługi, takie jak identyfikatory obiektów cyfrowych, same w sobie są przestrzeniami nazw „info:” URI; na przykład info:doi/10.1000/182
to inny sposób zapisania uchwytu dla bieżącej wersji Podręcznika DOI jako identyfikatora URI.
Niektóre przestrzenie nazw Handle System definiują specjalne reguły prezentacji. Na przykład cyfrowe identyfikatory obiektów , które reprezentują wysoki odsetek zachowanych uchwytów, są zwykle przedstawiane z przedrostkiem „doi:”: doi:10.1000/182
.
Dowolny Uchwyt może być wyrażony jako Uniform Resource Locator (URL) za pomocą ogólnego serwera proxy HTTP :
Niektóre systemy oparte na uchwytach oferują serwer proxy HTTP przeznaczony do użytku z ich własnym systemem, na przykład:
Realizacja
Implementacja systemu uchwytów składa się z lokalnych usług uchwytów, z których każdy składa się z jednej lub więcej witryn, które udostępniają serwery przechowujące określone uchwyty. Global Handle Registry to unikalna lokalna usługa obsługi, która przechowuje informacje o prefiksach (znanych również jako uprawnienia do nazewnictwa) w systemie obsługi i można do niej przeszukiwać, aby dowiedzieć się, gdzie są przechowywane określone obsługi w innych usługach obsługi lokalnej w tym systemie rozproszonym.
Witryna internetowa Handle System zawiera szereg narzędzi wdrożeniowych, w szczególności oprogramowanie HANDLE.NET i biblioteki klienckie HANDLE.NET. Klienci obsługi mogą być osadzeni w oprogramowaniu użytkownika końcowego (np. przeglądarce internetowej) lub oprogramowaniu serwera (np. serwerze sieciowym), a rozszerzenia są już dostępne dla programów Adobe Acrobat i Firefox .
Obsługiwane biblioteki oprogramowania klienckiego są dostępne zarówno w językach C, jak i Java. Niektóre aplikacje opracowały specjalne narzędzia dodatkowe, np. dla systemu DOI.
Interoperacyjna sieć rozproszonych serwerów rozpoznawania uchwytów (znana również jako system serwera proxy) jest połączona za pośrednictwem globalnego rozwiązania (które jest jedną logiczną jednostką, choć fizycznie zdecentralizowaną i dublowaną). Użytkownicy technologii Handle System uzyskują przedrostek uchwytu utworzony w Globalnym rejestrze uchwytów. Globalny Rejestr Obsługi obsługuje i rozwiązuje prefiksy lokalnie obsługiwanych usług obsługi. W związku z tym każda lokalna usługa dojścia może rozwiązać dowolne dojście za pośrednictwem Globalnego Resolvera.
Uchwyty (identyfikatory) są przekazywane przez klienta, jako zapytanie o urząd/prefiks nazewnictwa, do Globalnego Rejestru Uchwytów (GHR) systemu uchwytów. GHR odpowiada, wysyłając klientowi informacje o lokalizacji dla odpowiedniej usługi obsługi lokalnej (która może składać się z wielu serwerów w wielu lokalizacjach); zapytanie jest następnie wysyłane do odpowiedniego serwera w ramach Local Handle Service. Usługa obsługi lokalnej zwraca informacje potrzebne do pozyskania zasobu, np. adres URL, który można następnie przekształcić w przekierowanie HTTP. (Uwaga: jeśli klient ma już informacje na temat odpowiedniego LHS do zapytania, początkowe zapytanie do GHR jest pomijane)
Chociaż oryginalny model, z którego wywodzi się system obsługi, dotyczył zarządzania obiektami cyfrowymi, system obsługi nie narzuca żadnego konkretnego modelu relacji między zidentyfikowanymi podmiotami ani nie ogranicza się do identyfikowania wyłącznie obiektów cyfrowych: podmioty niecyfrowe mogą być reprezentowane jako odpowiedni obiekt cyfrowy do celów zarządzania obiektami cyfrowymi. Należy zachować ostrożność przy definiowaniu takich obiektów i ich powiązaniu z bytami niecyfrowymi; istnieją ustalone modele, które mogą pomóc w takich definicjach, np. Wymagania funkcjonalne dla rekordów bibliograficznych (FRBR) , CIDOC CRM oraz Model zawartości indeksów . Niektóre aplikacje uznały za pomocne połączenie takiej struktury z aplikacją obsługującą: na przykład Inicjatywa Advanced Distributed Learning (ADL) łączy aplikację Handle System z istniejącymi standardami dla rozproszonych treści edukacyjnych, przy użyciu modelu referencyjnego obiektów udostępnianych treści (SCORM) , a systemu Digital Object Identifier (DOI) systemu Handle przyjęła go wraz ze strukturą indecs , aby poradzić sobie z interoperacyjnością semantyczną .
System uchwytów również wyraźnie podkreśla znaczenie zaangażowania organizacji w system trwałych identyfikatorów, ale nie określa jednego modelu zapewniania takiego zaangażowania. Poszczególne aplikacje mogą zdecydować się na ustanowienie własnych zestawów zasad i infrastruktury społecznej w celu zapewnienia trwałości (np. w przypadku użycia w aplikacji DSpace i aplikacji DOI).
Zasady projektowania
System uchwytów został zaprojektowany tak, aby spełniał następujące wymagania i przyczyniał się do trwałości
Ciąg identyfikatora:
- nie opiera się na żadnych zmiennych atrybutach podmiotu (lokalizacja, własność lub jakikolwiek inny atrybut, który może ulec zmianie bez zmiany tożsamości odniesienia);
- jest nieprzejrzysty (najlepiej „głupi numer”: dobrze znany wzorzec zachęca do przyjmowania założeń, które mogą wprowadzać w błąd, a sensowna semantyka może nie przekładać się na inne języki i może powodować konflikty znaków towarowych);
- jest unikalny w systemie (aby uniknąć kolizji i niepewności odniesienia);
- ma opcjonalne, ale dobrze mieć funkcje, które powinny być obsługiwane (czytelne dla człowieka, z możliwością wycinania i wklejania, osadzania; pasuje do popularnych systemów, np. specyfikacji URI).
Mechanizm rozpoznawania identyfikatorów:
- jest niezawodny (wykorzystując nadmiarowość, brak pojedynczych punktów awarii i wystarczająco szybki, aby nie wyglądał na zepsuty);
- jest skalowalny (wyższe obciążenia są po prostu zarządzane przy użyciu większej liczby komputerów);
- jest elastyczny (można dostosować się do zmieniających się środowisk komputerowych; przydatny w nowych aplikacjach):
- cieszy się zaufaniem (zarówno restrukturyzacja i uporządkowana likwidacja, jak i administracja stosują techniczne metody zaufania; organizacja operacyjna jest zaangażowana w perspektywie długoterminowej);
- opiera się na otwartej architekturze (zachęcanie do wykorzystania wysiłków społeczności w budowaniu aplikacji w infrastrukturze);
- jest przejrzysty (użytkownicy nie muszą znać szczegółów infrastruktury).
Aplikacje
Wśród obiektów, które są obecnie identyfikowane przez uchwyty, znajdują się artykuły z czasopism, raporty techniczne, książki, prace magisterskie i dysertacje, dokumenty rządowe, metadane, rozproszone treści edukacyjne i zbiory danych. Uchwyty są używane w do cyfrowego znakowania wodnego , GRID aplikacje, repozytoria i inne. Chociaż indywidualni użytkownicy mogą pobierać i używać oprogramowania HANDLE.NET niezależnie, wielu użytkowników uznało za korzystne współpracę przy tworzeniu aplikacji w ramach federacji, przy użyciu wspólnej polityki lub dodatkowej technologii w celu świadczenia wspólnych usług. Jako jeden z pierwszych trwałych schematów identyfikatorów, Handle System został szeroko przyjęty przez instytucje publiczne i prywatne i sprawdzony przez kilka lat. (Patrz paradygmat, trwałe identyfikatory).
Uchwyty Aplikacje systemowe mogą używać uchwytów jako prostych, trwałych identyfikatorów (najczęściej używanych do rozpoznawania bieżącego adresu URL obiektu) lub mogą korzystać z innych funkcji. Jego wsparcie dla jednoczesnego zwracania jako wyjścia wielu bieżących informacji związanych z obiektem, w zdefiniowanych strukturach danych, umożliwia ustalenie priorytetów dla kolejności, w jakiej będą wykorzystywane różne rozdzielczości. Uchwyty mogą zatem odnosić się do różnych cyfrowych wersji tej samej treści, do kopii lustrzanych witryn lub do różnych modeli biznesowych (płatny vs. bezpłatny, bezpieczny vs. otwarty, publiczny vs. prywatny). Mogą również zdecydować się na różne wersje cyfrowe różnych treści, takie jak mieszanka obiektów wymaganych do kursu nauczania na odległość.
Obecnie działają tysiące serwisów obsługi, zlokalizowanych w 71 krajach na 6 kontynentach; ponad 1000 z nich działa na uniwersytetach iw bibliotekach. Usługi obsługi są prowadzone przez federacje użytkowników, krajowe laboratoria, uniwersytety, centra obliczeniowe, biblioteki (krajowe i lokalne), agencje rządowe, wykonawców, korporacje i grupy badawcze. Główni wydawcy używają systemu Handle do trwałej identyfikacji treści dostępnych w obrocie komercyjnym i Open Access poprzez jego wdrożenie w systemie Digital Object Identifier (DOI) .
Liczba prefiksów, które umożliwiają użytkownikom przypisywanie uchwytów, rośnie i wynosi ponad 12 000 na początku 2014 r. Istnieje sześć serwerów najwyższego poziomu Global Handle Registry, które otrzymują (średnio) 68 milionów żądań rozwiązania miesięcznie. Znane CNRI serwery proxy, przekazujące żądania do systemu w sieci, odbierają (średnio) 200 milionów żądań rozwiązania miesięcznie. (Statystyki z Handle Quick Facts.)
W 2010 roku CNRI i ITU (Międzynarodowy Związek Telekomunikacyjny) zawarły porozumienie o współpracy w zakresie korzystania z systemu obsługi (i bardziej ogólnie architektury obiektów cyfrowych) i pracują nad szczegółowymi szczegółami tej współpracy; w kwietniu 2009 r. ITU wymieniło system uchwytów jako „wschodzący trend”.
Licencje i zasady użytkowania
Handle System, HANDLE.NET i Global Handle Registry są znakami towarowymi Corporation for National Research Initiatives (CNRI), organizacji non-profit zajmującej się badaniami i rozwojem w USA. System Handle jest przedmiotem patentów CNRI, które licencjonuje swoją technologię Handle System na podstawie licencji publicznej, podobnej do licencji open source, w celu umożliwienia szerszego wykorzystania technologii. Infrastruktura systemu Handle jest obsługiwana przez opłaty za rejestrację prefiksów i usługi, z których większość pochodzi od posiadaczy pojedynczych prefiksów. Największym obecnie pojedynczym ofiarodawcą jest Międzynarodowa Fundacja DOI . Licencja Publiczna pozwala na komercyjne i niekomercyjne użytkowanie po niskich kosztach zarówno opatentowanej technologii, jak i referencyjnej implementacji oprogramowania, a także umożliwia swobodną osadzenie oprogramowania w innych systemach i produktach. Umowa serwisowa jest również dostępna dla użytkowników, którzy zamierzają świadczyć usługi identyfikacji i/lub rozwiązania z wykorzystaniem technologii Handle System na licencji publicznej Handle System.
Powiązane technologie
System uchwytów reprezentuje kilka elementów długoterminowej architektury obiektów cyfrowych. W styczniu 2010 r. CNRI wypuściło oprogramowanie Digital Object Repository ogólnego przeznaczenia, kolejny ważny składnik tej architektury. Więcej informacji na temat wydania, w tym specyfikacja protokołu, kod źródłowy i gotowy do użycia system, klienci i narzędzia, jest dostępnych.
Zobacz też
Linki zewnętrzne
- Oficjalna strona internetowa
- trwałych identyfikatorów w Paradigm Archived 2016-01-27 at the Wayback Machine