Cyfrowy identyfikator obiektu

Cyfrowy identyfikator obiektu
DOI logo.svg
Akronim DOI
Organizacja Międzynarodowa Fundacja DOI
wprowadzony 2000 ; 23 lata temu ( 2000 )
Przykład 10.1000/182
Strona internetowa www.doi.org _ _ Edit this at Wikidata

Cyfrowy identyfikator obiektu ( DOI ) to trwały identyfikator lub uchwyt służący do jednoznacznej identyfikacji różnych obiektów, znormalizowany przez Międzynarodową Organizację Normalizacyjną (ISO). DOI są implementacją systemu uchwytów ; pasują również do systemu URI ( Uniform Resource Identifier ). Są szeroko stosowane do identyfikowania informacji akademickich, zawodowych i rządowych, takich jak w czasopismach , raporty z badań, zbiory danych i oficjalne publikacje. Numery DOI zostały również wykorzystane do identyfikacji innych rodzajów zasobów informacyjnych, takich jak komercyjne filmy wideo.

DOI ma na celu rozwiązanie celu, obiektu informacyjnego, do którego odnosi się DOI. Osiąga się to poprzez powiązanie DOI z metadanymi dotyczącymi obiektu, takimi jak adres URL , pod którym znajduje się obiekt. Tak więc, będąc wykonalnym i interoperacyjnym , DOI różni się od numerów ISBN lub ISRC , które są tylko identyfikatorami. System DOI wykorzystuje model treści indecs do reprezentacji metadanych.

DOI dokumentu pozostaje stały przez cały okres jego istnienia, podczas gdy jego lokalizacja i inne metadane mogą ulec zmianie. Odwoływanie się do dokumentu online za pomocą jego DOI powinno zapewniać bardziej stabilne łącze niż bezpośrednie użycie jego adresu URL. Jeśli jednak jego adres URL ulegnie zmianie, wydawca musi zaktualizować metadane DOI, aby zachować link do adresu URL. Aktualizacja bazy danych DOI jest obowiązkiem wydawcy. Jeśli tego nie zrobią, DOI zostanie rozwiązane jako martwy link , pozostawiając DOI bezużytecznym.

Twórcą i administratorem systemu DOI jest Międzynarodowa Fundacja DOI (IDF), która wprowadziła go w 2000 roku. Organizacje, które wypełniają zobowiązania umowne systemu DOI i są skłonne zapłacić, aby zostać członkiem systemu, mogą nadawać DOI. System DOI jest wdrażany przez federację agencji rejestracyjnych koordynowaną przez IDF. Do końca kwietnia 2011 roku około 4000 organizacji nadało ponad 50 milionów nazw DOI, a do kwietnia 2013 roku liczba ta wzrosła do 85 milionów nazw DOI nadanych przez 9500 organizacji.

Nazewnictwo i składnia

DOI to rodzaj uchwytu systemu uchwytów, który ma postać ciągu znaków podzielonego na dwie części, przedrostek i sufiks, oddzielonych ukośnikiem.

przedrostek/sufiks

Prefiks identyfikuje rejestrującego identyfikator, a sufiks jest wybierany przez rejestrującego i identyfikuje konkretny obiekt powiązany z tym DOI. W tych ciągach dozwolonych jest większość legalnych Unicode , które są interpretowane bez uwzględniania wielkości liter . Przedrostek ma zwykle postać 10.NNNN , gdzie NNNN to co najmniej czterocyfrowa liczba większa lub równa 1000 , której limit zależy tylko od całkowitej liczby abonentów. Prefiks może być dalej dzielony kropkami, na przykład 10.NNNN.N .

Na przykład w nazwie DOI 10.1000/182 przedrostek to 10.1000 , a sufiks to 182 . Część „10” prefiksu wyróżnia uchwyt jako część przestrzeni nazw DOI, w przeciwieństwie do innej przestrzeni nazw Handle System, a znaki 1000 w przedrostku identyfikują rejestrującego; w tym przypadku rejestrującym jest sama Międzynarodowa Fundacja DOI. 182 to sufiks lub identyfikator elementu, identyfikujący pojedynczy obiekt (w tym przypadku najnowsza wersja podręcznika DOI ).

Nazwy DOI mogą identyfikować dzieła twórcze (takie jak teksty, obrazy, elementy audio lub wideo oraz oprogramowanie) zarówno w formie elektronicznej, jak i fizycznej, przedstawienia i dzieła abstrakcyjne, takie jak licencje, strony transakcji itp.

Nazwy mogą odnosić się do obiektów na różnych poziomach szczegółowości: w ten sposób nazwy DOI mogą identyfikować czasopismo, pojedyncze wydanie czasopisma, pojedynczy artykuł w czasopiśmie lub pojedynczą tabelę w tym artykule. Wybór poziomu szczegółowości pozostawia się cesjonariuszowi, ale w systemie DOI musi on być zadeklarowany jako część metadanych powiązanych z nazwą DOI, przy użyciu słownika danych opartego na Indecs Content Model .

Wyświetlacz

Oficjalny Podręcznik DOI wyraźnie stwierdza, że ​​DOI powinny być wyświetlane na ekranach iw druku w formacie doi:10.1000/182 .

W przeciwieństwie do podręcznika DOI , CrossRef , główna agencja rejestracji DOI, zaleca wyświetlanie adresu URL (na przykład https://doi.org/10.1000/182 ) zamiast oficjalnego formatu (na przykład doi:10.1000/182 ) Ten adres URL jest trwały (istnieje umowa zapewniająca trwałość w domenie DOI.ORG), więc jest to PURL – udostępniający lokalizację serwera proxy HTTP , który przekieruje dostęp do sieci do właściwej lokalizacji online elementu, do którego prowadzi link.

Rekomendacja CrossRef opiera się przede wszystkim na założeniu, że DOI jest wyświetlany bez hiperłącza do odpowiedniego adresu URL – argumentem jest to, że bez hiperłącza nie jest tak łatwo skopiować i wkleić pełny adres URL, aby faktycznie wyświetlić stronę dla DOI, dlatego powinien zostać wyświetlony cały adres URL, umożliwiając osobom przeglądającym stronę zawierającą DOI ręczne skopiowanie i wklejenie adresu URL do nowego okna/zakładki w przeglądarce w celu przejścia do odpowiedniej strony dokument, który reprezentuje DOI.

Ponieważ DOI jest przestrzenią nazw w systemie uchwytów , semantycznie poprawne jest reprezentowanie go jako URI info:doi/10.1000/182 .

Treść

Główna zawartość systemu DOI obejmuje obecnie:

  • Materiały naukowe (artykuły z czasopism, książki, e-booki itp.) za pośrednictwem Crossref , konsorcjum około 3000 wydawców; Airiti , wiodący dostawca chińskich i tajwańskich elektronicznych czasopism akademickich; oraz Japan Link Center (JaLC), organizację zapewniającą zarządzanie łączami i przypisywanie DOI dla elektronicznych czasopism akademickich w języku japońskim.
  • Zbiory danych badawczych za pośrednictwem Datacite , konsorcjum wiodących bibliotek naukowych, dostawców informacji technicznych i naukowych centrów danych;
  • oficjalne publikacje Unii Europejskiej za pośrednictwem Urzędu Publikacji UE ;
  • Projekt Chińskiej Narodowej Infrastruktury Wiedzy na Uniwersytecie Tsinghua oraz w Instytucie Informacji Naukowo-Technicznej Chin (ISTIC), dwie inicjatywy sponsorowane przez chiński rząd.
  • Stałe globalne identyfikatory zarówno komercyjnych, jak i niekomercyjnych tytułów treści audiowizualnych, zmian i manifestacji za pośrednictwem rejestru Entertainment ID Registry, powszechnie znanego jako EIDR .

W serwisie wydawniczym Organizacji Współpracy Gospodarczej i Rozwoju OECD iLibrary każda tabela lub wykres w publikacji OECD jest opatrzona nazwą DOI, która prowadzi do pliku Excel zawierającego dane leżące u podstaw tabel i wykresów. Planowany jest dalszy rozwój tego typu usług.

Inne rejestry obejmują Crossref i wielojęzyczną Europejską Agencję Rejestracji DOI (mEDRA) . Od 2015 r. dokumenty RFC można określać jako doi:10.17487/rfc ... .

Cechy i zalety

IDF zaprojektowało system DOI, aby zapewnić formę trwałej identyfikacji , w której każda nazwa DOI trwale i jednoznacznie identyfikuje obiekt, z którym jest powiązana (chociaż gdy zmienia się wydawca czasopisma, czasami wszystkie DOI ulegną zmianie, z stare DOI już nie działają). Kojarzy również metadane z obiektami, umożliwiając dostarczanie użytkownikom odpowiednich informacji o obiektach i ich relacjach. Częścią tych metadanych są działania sieciowe, które umożliwiają rozpoznawanie nazw DOI w lokalizacjach internetowych, w których można znaleźć opisywane przez nie obiekty. Aby osiągnąć swoje cele, system DOI łączy System Obsługi i Indeksowy Model Treści z infrastrukturą społecznościową.

System uchwytów zapewnia, że ​​nazwa DOI obiektu nie jest oparta na żadnych zmiennych atrybutach obiektu, takich jak jego fizyczna lokalizacja lub własność, że atrybuty obiektu są zakodowane w jego metadanych, a nie w jego nazwie DOI, oraz że żadne dwóm obiektom przypisano tę samą nazwę DOI. Ponieważ nazwy DOI są krótkimi ciągami znaków, są czytelne dla człowieka, mogą być kopiowane i wklejane jako tekst oraz pasują do URI . Mechanizm rozpoznawania nazw DOI działa za kulisami, dzięki czemu użytkownicy komunikują się z nim w taki sam sposób, jak z każdą inną usługą internetową; jest zbudowany na otwartych architekturach , zawiera mechanizmy zaufania i został zaprojektowany tak, aby działał niezawodnie i elastycznie, dzięki czemu można go dostosować do zmieniających się wymagań i nowych zastosowań systemu DOI. Rozpoznawanie nazw DOI może być używane z OpenURL , aby wybrać najbardziej odpowiednią spośród wielu lokalizacji dla danego obiektu, zgodnie z lokalizacją użytkownika wysyłającego żądanie. Jednak pomimo tej możliwości system DOI spotkał się z krytyką ze strony bibliotekarzy za kierowanie użytkowników do niewolnych kopii dokumentów, które byłyby dostępne bez dodatkowej opłaty z alternatywnych lokalizacji.

Indecs Content Model używany w systemie DOI łączy metadane z obiektami. Małe jądro wspólnych metadanych jest wspólne dla wszystkich nazw DOI i może być opcjonalnie rozszerzone o inne istotne dane, które mogą być publiczne lub zastrzeżone. Rejestrujący mogą aktualizować metadane swoich nazw DOI w dowolnym momencie, na przykład w przypadku zmiany informacji o publikacji lub przeniesienia obiektu pod inny adres URL.

Międzynarodowa Fundacja DOI (IDF) nadzoruje integrację tych technologii i działanie systemu poprzez infrastrukturę techniczną i społeczną. Infrastruktura społeczna federacji niezależnych agencji rejestracyjnych oferujących usługi DOI była wzorowana na istniejących udanych federacyjnych wdrożeniach identyfikatorów, takich jak GS1 i ISBN .

Porównanie z innymi schematami identyfikatorów

Nazwa DOI różni się od powszechnie używanych internetowych wskaźników do materiałów, takich jak Uniform Resource Locator (URL), tym, że identyfikuje sam obiekt jako jednostkę pierwszej klasy , a nie konkretne miejsce, w którym znajduje się obiekt w określonym czasie . Implementuje Uniform Resource Identifier ( Uniform Resource Name ) i dodaje do niej model danych oraz infrastrukturę społeczną.

Nazwa DOI różni się również od standardowych rejestrów identyfikatorów, takich jak ISBN , ISRC itp . Celem rejestru identyfikatorów jest zarządzanie danym zbiorem identyfikatorów, podczas gdy głównym celem systemu DOI jest umożliwienie wykorzystania zbioru identyfikatorów i interoperacyjne, gdzie ta kolekcja może zawierać identyfikatory z wielu innych kontrolowanych kolekcji.

System DOI oferuje trwałą, semantycznie interoperacyjną rozdzielczość powiązanych danych bieżących i najlepiej nadaje się do materiałów, które będą wykorzystywane w usługach pozostających poza bezpośrednią kontrolą podmiotu wydającego (np. cytaty publiczne lub zarządzanie wartościowymi treściami). Korzysta z rejestru zarządzanego (zapewniającego infrastrukturę socjalną i techniczną). Nie zakłada żadnego konkretnego modelu biznesowego dostarczania identyfikatorów ani usług i umożliwia innym istniejącym usługom łączenie się z nim w określony sposób. Zaproponowano kilka podejść do utrwalenia identyfikatorów. Porównanie podejść opartych na trwałych identyfikatorach jest trudne, ponieważ nie wszystkie robią to samo. Nieprecyzyjne nazywanie zestawu schematów „identyfikatorami” nie oznacza, że ​​można je łatwo porównywać. Inne „systemy identyfikatorów” mogą umożliwiać technologie o niskich barierach wejścia, zapewniając łatwy w użyciu mechanizm etykietowania, który pozwala każdemu skonfigurować nową instancję (przykłady obejmują Persistent Uniform Resource Locator (PURL), adresy URL, globalnie unikalne identyfikatory (GUID) itp.), ale może brakować niektórych funkcji schematu kontrolowanego przez rejestr i zwykle nie będzie mu towarzyszyć metadane w kontrolowanym schemacie. System DOI nie ma takiego podejścia i nie należy go bezpośrednio porównywać z takimi schematami identyfikatorów. Opracowano różne aplikacje wykorzystujące takie technologie wspomagające z dodatkowymi funkcjami, które spełniają niektóre funkcje oferowane przez system DOI dla określonych sektorów (np. ARK ).

Nazwa DOI nie zależy od lokalizacji obiektu iw ten sposób jest podobna do jednolitej nazwy zasobu (URN) lub PURL, ale różni się od zwykłego adresu URL. Adresy URL są często używane jako zastępcze identyfikatory dokumentów w Internecie, chociaż ten sam dokument w dwóch różnych lokalizacjach ma dwa adresy URL. Natomiast trwałe identyfikatory, takie jak nazwy DOI, identyfikują obiekty jako jednostki pierwszej klasy: dwie instancje tego samego obiektu miałyby tę samą nazwę DOI.

Rezolucja

Rozpoznawanie nazw DOI jest zapewniane przez system uchwytów , opracowany przez Corporation for National Research Initiatives i jest swobodnie dostępny dla każdego użytkownika, który napotka nazwę DOI. Rozdzielczość przekierowuje użytkownika z nazwy DOI do jednej lub więcej wpisanych danych: adresów URL reprezentujących instancje obiektu, usługi, takie jak poczta e-mail, lub jeden lub więcej elementów metadanych. W systemie uchwytów nazwa DOI jest uchwytem, ​​a więc ma przypisany zestaw wartości i może być traktowana jako rekord składający się z grupy pól. Każda wartość uchwytu musi mieć określony typ danych w <type> , które definiuje składnię i semantykę jej danych. Podczas gdy DOI trwale i jednoznacznie identyfikuje obiekt, do którego jest przypisany, rozdzielczość DOI może nie być trwała z powodu problemów technicznych i administracyjnych.

Aby rozwiązać nazwę DOI, można ją wprowadzić do narzędzia rozpoznawania DOI, takiego jak doi.org .

Innym podejściem, które pozwala uniknąć wpisywania lub wycinania i wklejania do programu tłumaczącego, jest umieszczenie DOI w dokumencie jako adresu URL, który wykorzystuje program tłumaczący jako serwer proxy HTTP, na przykład https://doi.org/ (preferowany) lub http ://dx.doi.org/ , z których oba obsługują HTTPS. Na przykład DOI 10.1000/182 można umieścić w odnośniku lub hiperłączu jako https://doi.org/10.1000/182 . Takie podejście umożliwia użytkownikom kliknięcie DOI jako zwykłego hiperłącza . Rzeczywiście, jak wspomniano wcześniej, w ten sposób CrossRef zaleca, aby DOI były zawsze reprezentowane (preferując HTTPS zamiast HTTP), aby po wycięciu i wklejeniu do innych dokumentów, wiadomości e-mail itp. można było z nich skorzystać.

Inne narzędzia rozpoznawania nazw DOI i serwery proxy HTTP obejmują system uchwytów i PANGEA . Na początku 2016 roku http://doai.io uruchomiła nową klasę alternatywnych resolwerów DOI . Ta usługa jest niezwykła, ponieważ próbuje znaleźć niepłatną (często zarchiwizowaną przez autora ) wersję tytułu i przekierowuje użytkownika do tej wersji zamiast do wersji wydawcy . Od tego czasu powstały inne otwarte narzędzia do rozpoznawania DOI, w szczególności https://oadoi.org/ w październiku 2016 r. (później Unpaywall ). Podczas gdy tradycyjne resolwery DOI opierają się wyłącznie na systemie Handle System, alternatywne resolwery DOI najpierw sprawdzają zasoby o otwartym dostępie, takie jak BASE (Academic Search Engine Bielefeld).

Alternatywą dla serwerów proxy HTTP jest użycie jednego z wielu dodatków i wtyczek do przeglądarek , unikając w ten sposób konwersji DOI na adresy URL, które zależą od nazw domen i mogą podlegać zmianom, jednocześnie umożliwiając DOI być traktowane jako zwykłe hiperłącze. Wadą tego podejścia dla wydawców jest to, że przynajmniej obecnie większość użytkowników napotyka DOI w przeglądarce, czytniku poczty lub innym oprogramowaniu, które nie ma zainstalowanej żadnej z tych wtyczek.

Struktura organizacyjna IDF

Międzynarodowa Fundacja DOI ( IDF ), organizacja non-profit utworzona w 1998 roku, jest organem zarządzającym systemem DOI. Chroni wszelkie prawa własności intelektualnej związane z systemem DOI, zarządza wspólnymi funkcjami operacyjnymi oraz wspiera rozwój i promocję systemu DOI. IDF zapewnia, że ​​wszelkie ulepszenia wprowadzone do systemu DOI (w tym tworzenie, konserwacja, rejestracja, rozwiązywanie i ustalanie zasad nazw DOI) są dostępne dla każdego rejestrującego DOI. Uniemożliwia również stronom trzecim nakładanie dodatkowych wymagań licencyjnych poza wymaganiami IDF na użytkowników systemu DOI.

IDF jest kontrolowany przez Radę wybraną przez członków Fundacji, z wyznaczonym Agentem Zarządzającym, który jest odpowiedzialny za koordynację i planowanie jej działań. Członkostwo jest otwarte dla wszystkich organizacji zainteresowanych publikacjami elektronicznymi i powiązanymi technologiami wspomagającymi. IDF organizuje coroczne otwarte spotkania na tematy DOI i powiązanych zagadnień.

Agencje rejestracyjne, wyznaczone przez IDF, świadczą usługi dla rejestrujących DOI: przydzielają prefiksy DOI, rejestrują nazwy DOI i zapewniają niezbędną infrastrukturę umożliwiającą rejestrującym deklarowanie i utrzymywanie metadanych i danych stanowych. Oczekuje się również, że agencje rejestracyjne będą aktywnie promować szerokie przyjęcie systemu DOI, współpracować z IDF w rozwoju systemu DOI jako całości oraz świadczyć usługi w imieniu określonej społeczności użytkowników. Lista aktualnych RA jest prowadzona przez Międzynarodową Fundację DOI. 10 najwyższego poziomu .

Agencje rejestracyjne zazwyczaj pobierają opłatę za nadanie nowej nazwy DOI; część tych opłat jest wykorzystywana do wspierania IDF. Ogólnie system DOI, za pośrednictwem IDF, działa na non-profit .

Normalizacja

System DOI to międzynarodowy standard opracowany przez Międzynarodową Organizację Normalizacyjną w jej komitecie technicznym ds. identyfikacji i opisu, TC46/SC9. Projekt Normy Międzynarodowej ISO/DIS 26324, Informacja i dokumentacja – System Cyfrowego Identyfikatora Obiektów spełnił wymagania ISO do zatwierdzenia. Odpowiednia Grupa Robocza ISO przedłożyła później ISO zredagowaną wersję do dystrybucji jako kartę do głosowania FDIS (Final Draft International Standard), która została zatwierdzona przez 100% głosujących w głosowaniu zamykającym się 15 listopada 2010 r. Ostateczna norma została opublikowana 23 listopada 2010 r. kwiecień 2012 r.

  DOI to zarejestrowany identyfikator URI zgodnie ze schematem info URI określonym przez IETF RFC 4452 . info:doi/ to przestrzeń nazw infoURI cyfrowych identyfikatorów obiektów.

Składnia DOI to standard NISO , po raz pierwszy znormalizowany w 2000 r., składnia ANSI/NISO Z39.84-2005 dla identyfikatora obiektu cyfrowego.

Opiekunowie systemu DOI celowo nie zarejestrowali przestrzeni nazw DOI dla URN , stwierdzając, że:

Architektura URN zakłada opartą na DNS usługę rozpoznawania rozdzielczości (RDS) w celu znalezienia usługi odpowiedniej dla danego schematu URN. Jednak obecnie nie istnieją tak szeroko rozpowszechnione schematy RDS ... DOI nie jest zarejestrowany jako przestrzeń nazw URN, pomimo spełnienia wszystkich wymagań funkcjonalnych, ponieważ rejestracja URN wydaje się nie przynosić korzyści systemowi DOI. Wymaga to dodatkowej warstwy administracyjnej w celu zdefiniowania DOI jako przestrzeni nazw URN (łańcuch znaków urn:doi:10.1000/1 zamiast prostszego doi:10.1000/1 ) oraz dodatkowego etapu niepotrzebnego przekierowania w celu uzyskania dostępu do usługi rozwiązywania problemów, co zostało już osiągnięte poprzez albo serwer proxy http, albo rozdzielczość natywna. Jeśli mechanizmy RDS obsługujące specyfikacje URN staną się powszechnie dostępne, DOI zostanie zarejestrowane jako URN.

Zobacz też

Notatki

Linki zewnętrzne