Biblioteka Cyfrowa
Biblioteka cyfrowa , zwana także biblioteką online , biblioteką internetową , repozytorium cyfrowym lub zbiorem cyfrowym, to internetowa baza danych obiektów cyfrowych, która może zawierać tekst, nieruchome obrazy, audio, wideo, dokumenty cyfrowe lub inne formaty mediów cyfrowych lub biblioteka dostępna przez Internet . Obiekty mogą składać się z cyfrowych treści, takich jak wydruki lub zdjęcia , a także oryginalnie wyprodukowanych treści cyfrowych, takich jak pliki edytora tekstu lub posty w mediach społecznościowych . Oprócz przechowywania treści biblioteki cyfrowe zapewniają środki do organizowania, wyszukiwania i odzyskiwania treści zawartych w zbiorach. Biblioteki cyfrowe mogą być bardzo różne pod względem wielkości i zakresu i mogą być utrzymywane przez osoby lub organizacje. Treści cyfrowe mogą być przechowywane lokalnie lub dostępne zdalnie za pośrednictwem sieci komputerowych. Te systemy wyszukiwania informacji są w stanie wymieniać informacje między sobą dzięki interoperacyjności i trwałości .
Historia
Wczesna historia bibliotek cyfrowych nie jest dobrze udokumentowana, ale kilku kluczowych myślicieli jest związanych z pojawieniem się tej koncepcji. Do poprzedników należą Mundaneum Paula Otleta i Henri La Fontaine'a , rozpoczęta w 1895 roku próba zebrania i systematycznego skatalogowania światowej wiedzy w nadziei na zaprowadzenie pokoju na świecie. Wizje biblioteki cyfrowej zostały w dużej mierze zrealizowane sto lat później, podczas wielkiej ekspansji Internetu, z dostępem do książek i przeszukiwaniem dokumentów przez miliony osób w sieci WWW.
Vannevar Bush i JCR Licklider to dwaj współpracownicy, którzy rozwinęli ten pomysł w ówczesną technologię. Bush wspierał badania, które doprowadziły do zrzucenia bomby na Hiroszimę . Po obejrzeniu katastrofy zapragnął stworzyć maszynę, która pokazałaby, jak technologia może prowadzić do zrozumienia zamiast do zniszczenia. Ta maszyna zawierałaby biurko z dwoma ekranami, przełącznikami i przyciskami oraz klawiaturą. Nazwał to „ Memexem ”. W ten sposób osoby fizyczne miałyby szybki dostęp do przechowywanych książek i plików. W 1956 roku Fundacja Forda sfinansowała Licklider, aby przeanalizować, w jaki sposób biblioteki można ulepszyć za pomocą technologii. Prawie dekadę później jego książka zatytułowana „ Biblioteki przyszłości ” zawierała jego wizję. Chciał stworzyć system wykorzystujący komputery i sieci, tak aby ludzka wiedza była dostępna dla potrzeb człowieka, a informacje zwrotne były automatyczne dla celów maszynowych. System ten składał się z trzech elementów: korpusu wiedzy, pytania i odpowiedzi. Licklider nazwał to systemem prokognitywnym.
Wczesne projekty koncentrowały się na stworzeniu elektronicznego katalogu kartkowego znanego jako Online Public Access Catalog (OPAC). W latach 80. sukces tych przedsięwzięć spowodował, że OPAC zastąpił tradycyjny katalog kartkowy w wielu bibliotekach akademickich, publicznych i specjalnych. Umożliwiło to bibliotekom podjęcie dodatkowych satysfakcjonujących wspólnych wysiłków w celu wspierania wymiany zasobów i rozszerzenia dostępu do materiałów bibliotecznych poza pojedynczą bibliotekę.
Wczesnym przykładem biblioteki cyfrowej jest Centrum Informacji o Zasobach Edukacyjnych (ERIC), baza danych cytatów, streszczeń i tekstów edukacyjnych, która została utworzona w 1964 roku i udostępniona online za pośrednictwem DIALOG w 1969 roku.
W 1994 roku biblioteki cyfrowe stały się szeroko widoczne w społeczności naukowej dzięki programowi zarządzanemu przez NSF o wartości 24,4 miliona dolarów , wspieranemu wspólnie przez program DARPA Intelligent Integration of Information (I3), NASA i samą NSF. Udane propozycje badań pochodziły z sześciu amerykańskich uniwersytetów. Uniwersytety obejmowały Carnegie Mellon University , University of California-Berkeley , University of Michigan , University of Illinois , University of California-Santa Barbara i Stanford University . Artykuły z projektów podsumowały ich postępy na półmetku w maju 1996 r. Badania Stanforda, przeprowadzone przez Sergeya Brina i Larry'ego Page'a , doprowadziły do powstania Google .
Wczesne próby stworzenia modelu dla bibliotek cyfrowych obejmowały DELOS Digital Library Reference Model i 5S Framework.
Terminologia
Termin biblioteka cyfrowa został po raz pierwszy spopularyzowany przez NSF / DARPA / NASA Digital Libraries Initiative w 1994 roku. Oczekuje się, że wraz z dostępnością sieci komputerowych zasoby informacyjne będą rozproszone i dostępne w razie potrzeby, podczas gdy w eseju Vannevara Busha As We May Pomyśl (1945), że miały być zebrane i przechowywane w Memeksie badacza .
Termin biblioteka wirtualna był początkowo używany zamiennie z biblioteką cyfrową, ale obecnie jest używany głównie w odniesieniu do bibliotek wirtualnych w innych znaczeniach (takich jak biblioteki agregujące rozproszoną zawartość). Na początku istnienia bibliotek cyfrowych dyskutowano o podobieństwach i różnicach między pojęciami cyfrowy , wirtualny i elektroniczny .
Często rozróżnia się treść utworzoną w formacie cyfrowym, znanym jako born-digital , oraz informację, która została przekształcona z nośnika fizycznego, np. papieru, poprzez digitalizację . Nie wszystkie treści elektroniczne są w danych cyfrowych . Termin biblioteka hybrydowa jest czasami używany w odniesieniu do bibliotek, które posiadają zarówno zbiory fizyczne, jak i zbiory elektroniczne. Na przykład American Memory to biblioteka cyfrowa w Bibliotece Kongresu .
Niektóre ważne biblioteki cyfrowe służą również jako archiwa długoterminowe, takie jak arXiv i Internet Archive . Inne, takie jak Digital Public Library of America , dążą do tego, aby cyfrowe informacje z różnych instytucji były szeroko dostępne online.
Rodzaje bibliotek cyfrowych
Repozytoria instytucjonalne
Wiele bibliotek akademickich jest aktywnie zaangażowanych w budowanie repozytoriów swoich książek, artykułów, prac dyplomowych i innych prac, które można zdigitalizować lub które „urodziły się w formie cyfrowej”. Wiele z tych repozytoriów jest udostępnianych ogółowi społeczeństwa z niewielkimi ograniczeniami, zgodnie z celami otwartego dostępu , w przeciwieństwie do publikacji badań w czasopismach komercyjnych, gdzie wydawcy zwykle ograniczają prawa dostępu. Niezależnie od praw dostępu, repozytoria instytucjonalne, prawdziwie bezpłatne i korporacyjne można nazwać bibliotekami cyfrowymi. repozytorium instytucjonalnego jest przeznaczone do archiwizacji, organizowania i wyszukiwania zawartości biblioteki. Popularne rozwiązania typu open source obejmują DSpace , Greenstone Digital Library (GSDL) , EPrints , Digital Commons oraz systemy Islandora i Samvera oparte na Fedorze Commons .
Zbiory bibliotek narodowych
Depozyt prawny jest często objęty przepisami dotyczącymi praw autorskich , a czasami przepisami dotyczącymi depozytu prawnego, i wymaga, aby jedna lub więcej kopii wszystkich materiałów opublikowanych w danym kraju została złożona do zachowania w instytucji, zazwyczaj w bibliotece narodowej . Od czasu pojawienia się dokumentów elektronicznych , ustawodawstwo musiało zostać zmienione w celu uwzględnienia nowych formatów, takich jak poprawka z 2016 r. do ustawy o prawie autorskim z 1968 r. w Australii.
Od tego czasu powstały różnego rodzaju depozyty elektroniczne. Portal Biblioteki Brytyjskiej i niemiecki model w Deutsche Nationalbibliothek mają jeden punkt depozytowy dla sieci bibliotek, ale publiczny dostęp jest możliwy tylko w czytelniach w bibliotekach. System edeposit Australian National ma te same funkcje, ale umożliwia również zdalny dostęp ogółowi społeczeństwa do większości treści.
Archiwa cyfrowe
Archiwa fizyczne różnią się od bibliotek fizycznych na kilka sposobów. Tradycyjnie archiwa są definiowane jako:
- Zawierające pierwotne źródła informacji (zwykle listy i dokumenty sporządzone bezpośrednio przez osobę lub organizację), a nie wtórne źródła znalezione w bibliotece (książki, czasopisma itp.).
- Organizowanie ich treści w grupach, a nie w pojedynczych elementach.
- Posiadanie unikalnych treści.
Technologia wykorzystywana do tworzenia bibliotek cyfrowych jest jeszcze bardziej rewolucyjna dla archiwów, ponieważ łamie drugą i trzecią z tych ogólnych zasad. Innymi słowy, „archiwa cyfrowe” lub „archiwa online” nadal będą zasadniczo zawierać źródła pierwotne, ale prawdopodobnie będą one opisywane indywidualnie, a nie (lub dodatkowo) w grupach lub zbiorach. Ponadto, ponieważ są one cyfrowe, ich zawartość jest łatwa do odtworzenia i rzeczywiście mogła zostać powielona z innego źródła. Oxford Text Archive jest powszechnie uważane za najstarsze cyfrowe archiwum akademickich fizycznych materiałów źródłowych.
Archiwa różnią się od bibliotek charakterem przechowywanych materiałów. Biblioteki gromadzą pojedyncze opublikowane książki i serie lub ograniczone zestawy pojedynczych pozycji. Książki i czasopisma znajdujące się w posiadaniu bibliotek nie są unikatowe, ponieważ istnieje wiele egzemplarzy, a każdy egzemplarz będzie generalnie równie zadowalający, jak każdy inny. Materiał w archiwach i bibliotekach rękopisów to „unikalne akta organów korporacyjnych oraz dokumenty jednostek i rodzin”.
Podstawową cechą archiwów jest to, że muszą one zachowywać kontekst, w jakim powstały ich akta, oraz sieć relacji między nimi, aby zachować ich zawartość informacyjną i dostarczać zrozumiałych i użytecznych informacji w czasie. Podstawową cechą archiwów jest ich hierarchiczna organizacja, wyrażająca kontekst za pomocą więzi archiwalnej .
Opisy archiwalne są podstawowym sposobem opisywania, rozumienia, wyszukiwania i uzyskiwania dostępu do materiałów archiwalnych. Na poziomie cyfrowym opisy archiwalne są zwykle kodowane za pomocą Encoded Archival Description XML. EAD to ustandaryzowana elektroniczna reprezentacja opisu archiwalnego, która umożliwia związkowy dostęp do szczegółowych opisów archiwalnych i zasobów w repozytoriach rozproszonych na całym świecie.
Biorąc pod uwagę znaczenie archiwów, zdefiniowano dedykowany model formalny, zwany NEsted SeTs for Object Hierarchies (NESTOR), zbudowany wokół ich osobliwych składników. NESTOR opiera się na idei wyrażania hierarchicznych relacji między obiektami poprzez właściwość inkluzji między zbiorami, w przeciwieństwie do binarnej relacji między węzłami wykorzystywanej przez drzewo. NESTOR został wykorzystany do formalnego rozszerzenia modelu 5S w celu zdefiniowania archiwum cyfrowego jako szczególnego przypadku biblioteki cyfrowej, która może uwzględniać specyfikę archiwów.
Cechy bibliotek cyfrowych
Zalety bibliotek cyfrowych jako sposobu na łatwy i szybki dostęp do różnego rodzaju książek, archiwów i obrazów są obecnie powszechnie uznawane zarówno przez interesy komercyjne, jak i organy publiczne.
Tradycyjne biblioteki są ograniczone przestrzenią dyskową; biblioteki cyfrowe mają potencjał do przechowywania znacznie większej ilości informacji, po prostu dlatego, że informacje cyfrowe wymagają bardzo niewielkiej przestrzeni fizycznej, aby je pomieścić. W związku z tym koszt utrzymania biblioteki cyfrowej może być znacznie niższy niż w przypadku tradycyjnej biblioteki. Fizyczna biblioteka musi wydawać duże sumy pieniędzy na personel, konserwację książek, czynsz i dodatkowe książki. Biblioteki cyfrowe mogą obniżyć lub, w niektórych przypadkach, znieść te opłaty. Oba rodzaje bibliotek wymagają danych wejściowych do katalogowania, aby umożliwić użytkownikom zlokalizowanie i pobranie materiałów. Biblioteki cyfrowe mogą być bardziej skłonne do przyjmowania innowacji technologicznych, zapewniając użytkownikom ulepszenia technologii książek elektronicznych i audio, a także prezentując nowe formy komunikacji, takie jak wiki i blogi; konwencjonalne biblioteki mogą uznać, że zapewnienie dostępu online do ich katalogu OP AC jest wystarczające. Ważną zaletą konwersji cyfrowej jest zwiększona dostępność dla użytkowników. Zwiększają również dostępność dla osób, które mogą nie być tradycyjnymi klientami biblioteki ze względu na położenie geograficzne lub przynależność organizacyjną.
- Brak fizycznych granic: użytkownik biblioteki cyfrowej nie musi fizycznie udawać się do biblioteki; ludzie z całego świata mogą uzyskać dostęp do tych samych informacji, o ile dostępne jest połączenie z Internetem.
- Dostępność przez całą dobę: Główną zaletą bibliotek cyfrowych jest to, że ludzie mogą uzyskać dostęp do informacji 24 godziny na dobę, 7 dni w tygodniu.
- Wielokrotny dostęp: te same zasoby mogą być używane jednocześnie przez wiele instytucji i patronów. Może tak nie być w przypadku materiałów chronionych prawem autorskim: biblioteka może mieć licencję na „wypożyczanie” tylko jednej kopii na raz; osiąga się to dzięki systemowi zarządzania prawami cyfrowymi , w którym zasób może stać się niedostępny po upływie okresu wypożyczenia lub po tym, jak pożyczkodawca zdecyduje się go uniemożliwić (co jest równoznaczne ze zwrotem zasobu).
- Wyszukiwanie informacji: Użytkownik może użyć dowolnego wyszukiwanego hasła (słowo, fraza, tytuł, nazwa, temat), aby przeszukać cały zbiór. Biblioteki cyfrowe mogą zapewniać bardzo przyjazne dla użytkownika interfejsy, dając dostęp do swoich zasobów za pomocą kliknięć.
- Konserwacja i konserwacja: Digitalizacja nie jest długoterminowym sposobem ochrony zbiorów fizycznych, ale zapewnia dostęp do kopii materiałów, które w przeciwnym razie uległyby degradacji w wyniku wielokrotnego użytkowania. Zdigitalizowane kolekcje i obiekty powstałe w formie cyfrowej stwarzają wiele problemów związanych z ochroną i konserwacją, których nie mają materiały analogowe. Przykłady można znaleźć w sekcji „Problemy” na tej stronie.
- Przestrzeń: podczas gdy tradycyjne biblioteki są ograniczone przestrzenią dyskową, biblioteki cyfrowe mają potencjał do przechowywania znacznie większej ilości informacji, po prostu dlatego, że informacje cyfrowe wymagają bardzo niewielkiej przestrzeni fizycznej, aby je pomieścić, a technologie przechowywania multimediów są bardziej przystępne cenowo niż kiedykolwiek wcześniej.
- Wartość dodana: Niektóre cechy obiektów, przede wszystkim jakość obrazów, mogą ulec poprawie. Digitalizacja może poprawić czytelność i usunąć widoczne wady, takie jak plamy i przebarwienia.
Oprogramowanie
Istnieje wiele pakietów oprogramowania do użytku w ogólnych bibliotekach cyfrowych (ważne z nich można znaleźć w kategorii: Oprogramowanie bibliotek cyfrowych ). Oprogramowanie repozytorium instytucjonalnego, które koncentruje się głównie na pozyskiwaniu, przechowywaniu i udostępnianiu dokumentów tworzonych lokalnie, w szczególności tworzonych lokalnie wyników akademickich, można znaleźć w oprogramowaniu repozytorium instytucjonalnego . To oprogramowanie może być zastrzeżone, jak ma to miejsce w przypadku Biblioteki Kongresu, która używa Digiboard i CTS do zarządzania treściami cyfrowymi.
Projektowanie i wdrażanie w bibliotekach cyfrowych jest tak skonstruowane, aby systemy komputerowe i oprogramowanie mogły wykorzystywać informacje podczas ich wymiany. Są one określane jako semantyczne biblioteki cyfrowe. Biblioteki semantyczne są również wykorzystywane do komunikowania się z różnymi społecznościami z wielu sieci społecznościowych. DjDL to rodzaj semantycznej biblioteki cyfrowej. Wyszukiwanie oparte na słowach kluczowych i wyszukiwanie semantyczne to dwa główne typy wyszukiwania. W wyszukiwaniu semantycznym dostępne jest narzędzie, które tworzy grupę do rozszerzania i udoskonalania wyszukiwania opartego na słowach kluczowych. Wiedza konceptualna wykorzystywana w DjDL koncentruje się wokół dwóch form; ontologia przedmiotowa i zbiór wzorców wyszukiwania pojęć opartych na ontologii. Trzy rodzaje ontologii, które są powiązane z tym wyszukiwaniem, to ontologie bibliograficzne , ontologie świadome społeczności i ontologie przedmiotowe.
Metadane
W tradycyjnych bibliotekach możliwość znalezienia interesujących dzieł jest bezpośrednio związana z tym, jak dobrze zostały one skatalogowane. Podczas gdy katalogowanie dzieł elektronicznych zdigitalizowanych z istniejącego zasobu biblioteki może być tak proste, jak skopiowanie lub przeniesienie zapisu z wersji drukowanej do postaci elektronicznej, złożone i stworzone w formie cyfrowej prace wymagają znacznie więcej wysiłku. Aby obsłużyć rosnącą liczbę publikacji elektronicznych, należy zaprojektować nowe narzędzia i technologie umożliwiające skuteczną automatyczną klasyfikację i wyszukiwanie semantyczne. Podczas gdy wyszukiwanie pełnotekstowe może być używane dla niektórych pozycji, istnieje wiele typowych przeszukiwań katalogu, których nie można przeprowadzić przy użyciu pełnego tekstu, w tym:
- wyszukiwanie tekstów będących tłumaczeniami innych tekstów
- rozróżnianie wydań/tomów tekstu/czasopisma
- niespójne deskryptory (zwłaszcza nagłówki tematyczne)
- brakujące, wadliwe lub niskiej jakości praktyki taksonomiczne
- łączenie tekstów publikowanych pod pseudonimami z prawdziwymi autorami ( np. Samuel Clemens i Mark Twain )
- odróżnianie literatury faktu od parodii ( The Onion z The New York Times )
Badawczy
Większość bibliotek cyfrowych zapewnia interfejs wyszukiwania, który umożliwia znalezienie zasobów. Zasoby te to zazwyczaj głębokiej sieci (lub niewidocznej sieci), ponieważ roboty indeksujące często nie mogą ich zlokalizować . Niektóre biblioteki cyfrowe tworzą specjalne strony lub mapy witryn , aby umożliwić wyszukiwarkom znalezienie wszystkich ich zasobów. Biblioteki cyfrowe często korzystają z Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH), aby udostępniać swoje metadane innym bibliotekom cyfrowym i wyszukiwarkom, takim jak Google Scholar , Yahoo! a Scirus może również używać OAI-PMH do znajdowania tych głębokich zasobów internetowych.
Istnieją dwie ogólne strategie przeszukiwania federacji bibliotek cyfrowych: przeszukiwanie rozproszone i przeszukiwanie wcześniej zebranych metadanych .
Wyszukiwanie rozproszone zazwyczaj obejmuje wysyłanie przez klienta wielu żądań wyszukiwania równolegle do wielu serwerów w federacji. Wyniki są gromadzone, duplikaty są eliminowane lub grupowane, a pozostałe elementy są sortowane i przedstawiane z powrotem klientowi. Protokoły takie jak Z39.50 są często używane w wyszukiwaniu rozproszonym. Zaletą tego podejścia jest to, że zadania indeksowania i przechowywania wymagające dużej ilości zasobów są pozostawione odpowiednim serwerom w federacji. Wadą tego podejścia jest to, że mechanizm wyszukiwania jest ograniczony przez różne możliwości indeksowania i oceniania każdej bazy danych; dlatego trudno jest zebrać połączony wynik składający się z najbardziej odpowiednich znalezionych elementów.
Przeszukiwanie wcześniej zebranych metadanych obejmuje przeszukiwanie lokalnie przechowywanego indeksu informacji, które zostały wcześniej zebrane z bibliotek w federacji. Podczas wyszukiwania mechanizm wyszukiwania nie musi łączyć się z przeszukiwanymi bibliotekami cyfrowymi — ma już lokalną reprezentację informacji. Takie podejście wymaga stworzenia mechanizmu indeksowania i zbierania, który działa regularnie, łącząc się ze wszystkimi bibliotekami cyfrowymi i przeszukując całą kolekcję w celu odkrycia nowych i zaktualizowanych zasobów. OAI-PMH jest często używany przez biblioteki cyfrowe do zbierania metadanych. Zaletą tego podejścia jest to, że mechanizm wyszukiwania ma pełną kontrolę nad algorytmami indeksowania i rankingu, co prawdopodobnie pozwala uzyskać bardziej spójne wyniki. Wadą jest to, że systemy zbierania i indeksowania są bardziej zasobochłonne, a przez to drogie.
Konserwacja cyfrowa
Konserwacja cyfrowa ma na celu zapewnienie możliwości interpretacji cyfrowych mediów i systemów informacyjnych w nieokreślonej przyszłości. Każdy niezbędny składnik tego musi zostać przeniesiony, zachowany lub emulowany . Zwykle emulowane są niższe poziomy systemów ( dyskietki ), strumienie bitów (rzeczywiste pliki przechowywane na dyskach) są zachowywane, a systemy operacyjne są emulowane jako maszyna wirtualna . Tylko tam, gdzie znaczenie i treść cyfrowych mediów i systemów informacyjnych są dobrze rozumiane, migracja jest możliwa, tak jak ma to miejsce w przypadku dokumentów biurowych. Jednak co najmniej jedna organizacja, Wider Net Project, stworzyła bibliotekę cyfrową offline, eGranary , odtwarzając materiały na dysku twardym o pojemności 6 TB . Zamiast środowiska strumienia bitów biblioteka cyfrowa zawiera wbudowany serwer proxy i wyszukiwarkę, dzięki czemu dostęp do materiałów cyfrowych można uzyskać za pomocą przeglądarki internetowej . Ponadto materiały nie są zachowywane na przyszłość. eGranary jest przeznaczony do użytku w miejscach lub sytuacjach, w których łączność z Internetem jest bardzo wolna, nie istnieje, jest zawodna, nieodpowiednia lub zbyt droga.
W ciągu ostatnich kilku lat procedury digitalizacji książek z dużą szybkością i stosunkowo niskimi kosztami uległy znacznej poprawie, w wyniku czego obecnie możliwa jest digitalizacja milionów książek rocznie. Projekt skanowania książek Google współpracuje również z bibliotekami, aby oferować digitalizację książek, posuwając naprzód dziedzinę digitalizacji książek.
Prawa autorskie i licencje
Biblioteki cyfrowe są utrudnione przez prawo autorskie , ponieważ w przeciwieństwie do tradycyjnych dzieł drukowanych, prawa dotyczące cyfrowego prawa autorskiego wciąż się kształtują. Ponowne publikowanie materiałów w Internecie przez biblioteki może wymagać zgody posiadaczy praw, a ponadto istnieje konflikt interesów między bibliotekami a wydawcami, którzy mogą chcieć tworzyć wersje online nabytych przez siebie treści w celach komercyjnych. W 2010 roku oszacowano, że dwadzieścia trzy procent istniejących książek powstało przed 1923 rokiem, a zatem poza prawami autorskimi. Spośród książek wydrukowanych po tej dacie tylko pięć procent było nadal w druku w 2010 r. Tak więc około siedemdziesiąt dwa procent książek nie było dostępnych publicznie.
Rozmycie odpowiedzialności wynika z rozproszonego charakteru zasobów cyfrowych. W grę mogą wchodzić złożone kwestie własności intelektualnej, ponieważ materiały cyfrowe nie zawsze są własnością biblioteki. Treść w wielu przypadkach należy do domeny publicznej lub jest wyłącznie treścią generowaną samodzielnie. Niektóre biblioteki cyfrowe, takie jak Project Gutenberg , pracują nad digitalizacją dzieł nieobjętych prawami autorskimi i udostępnianiem ich publicznie. Dokonano oszacowania liczby odrębnych książek, które nadal istnieją w katalogach bibliotecznych od 2000 pne do 1960 r.
Przepisy dotyczące dozwolonego użytku (17 USC § 107) zawarte w ustawie o prawie autorskim z 1976 r. zawierają szczegółowe wytyczne, w jakich okolicznościach biblioteki mogą kopiować zasoby cyfrowe. Cztery czynniki, które składają się na dozwolony użytek, to „Cel wykorzystania, Charakter pracy, Wykorzystana ilość lub istotność oraz Wpływ na rynek”.
Niektóre biblioteki cyfrowe uzyskują licencję na wypożyczanie swoich zasobów. Może to wiązać się z ograniczeniem wypożyczania jednorazowo tylko jednej kopii dla każdej licencji i stosowaniem w tym celu systemu zarządzania prawami cyfrowymi (zob. także powyżej).
Ustawa Digital Millennium Copyright Act z 1998 r. była ustawą stworzoną w Stanach Zjednoczonych w celu rozwiązania problemu wprowadzenia dzieł cyfrowych. Ustawa ta zawiera dwa traktaty z 1996 roku. Kryminalizuje próbę obejścia środków ograniczających dostęp do materiałów chronionych prawem autorskim. Kryminalizuje również próbę obejścia kontroli dostępu. Ustawa ta przewiduje zwolnienie dla bibliotek i archiwów non-profit, które pozwala na wykonanie do trzech kopii, z których jedna może być cyfrowa. Nie może to być jednak upubliczniane ani rozpowszechniane w Internecie. Ponadto umożliwia bibliotekom i archiwom kopiowanie dzieła, jeśli jego format stanie się przestarzały.
Nadal występują problemy z prawami autorskimi. W związku z tym wysunięto propozycje sugerujące zwolnienie bibliotek cyfrowych z prawa autorskiego. Chociaż byłoby to bardzo korzystne dla społeczeństwa, może mieć negatywny skutek ekonomiczny, a autorzy mogą być mniej skłonni do tworzenia nowych dzieł.
Kolejną komplikującą sprawę kwestią jest dążenie niektórych wydawnictw do ograniczenia korzystania z materiałów cyfrowych, takich jak e-booki kupowane przez biblioteki. Podczas gdy w przypadku książek drukowanych biblioteka jest właścicielem książki, dopóki nie może być już rozpowszechniana, wydawcy chcą ograniczyć liczbę wypożyczeń e-booka, zanim biblioteka będzie musiała ją odkupić. „[HarperCollins] zaczął udzielać licencji na korzystanie z każdej kopii e-booka maksymalnie do 26 wypożyczeń. Dotyczy to tylko najpopularniejszych tytułów i nie ma żadnego praktycznego wpływu na inne. Po osiągnięciu limitu biblioteka może odkupić prawa dostępu po niższej cenie koszt niż pierwotna cena”. Chociaż z perspektywy wydawniczej brzmi to jak dobra równowaga między wypożyczaniem bibliotek a ochroną przed spadkiem sprzedaży książek, którego się obawiamy, biblioteki nie są stworzone do monitorowania swoich zbiorów jako takich. Uznają zwiększone zapotrzebowanie na materiały cyfrowe dostępne dla patronów i chęć poszerzenia biblioteki cyfrowej o bestsellery, ale licencje wydawcy mogą utrudniać ten proces.
Systemy rekomendacji
Wiele bibliotek cyfrowych oferuje systemy rekomendacyjne , które zmniejszają nadmiar informacji i pomagają użytkownikom w odkrywaniu odpowiedniej literatury. Niektóre przykłady bibliotek cyfrowych oferujących systemy rekomendujące to IEEE Xplore , Europeana i GESIS Sowiport . Systemy rekomendacji działają głównie w oparciu o filtrowanie treści, ale stosowane są również inne podejścia, takie jak filtrowanie oparte na współpracy i rekomendacje oparte na cytowaniach. Beel i in. donoszą, że istnieje ponad 90 różnych podejść rekomendacyjnych dla bibliotek cyfrowych, przedstawionych w ponad 200 artykułach naukowych .
Zazwyczaj biblioteki cyfrowe opracowują i utrzymują własne systemy rekomendacji w oparciu o istniejące ramy wyszukiwania i rekomendacji, takie jak Apache Lucene lub Apache Mahout . Istnieją jednak również rekomendacji jako usługi specjalizujący się w oferowaniu systemu rekomendacji dla bibliotek cyfrowych jako usługi .
Wady bibliotek cyfrowych
Biblioteki cyfrowe, a przynajmniej ich zbiory cyfrowe, niestety przyniosły też własne problemy i wyzwania w takich obszarach jak:
- Uwierzytelnianie użytkownika w celu uzyskania dostępu do zbiorów
- Prawo autorskie
- Konserwacja cyfrowa (patrz wyżej)
- Równość dostępu (zob. przepaść cyfrowa )
- Projekt interfejsu
- Interoperacyjność systemów i oprogramowania
- Organizacja informacji
- Nieefektywne lub nieistniejące praktyki taksonomiczne (zwłaszcza w przypadku materiału historycznego)
- Trening i rozwój
- Jakość metadanych
- Wygórowany koszt budowy/utrzymania terabajtów pamięci masowej, serwerów i redundancji niezbędnych do funkcjonalnej kolekcji cyfrowej.
Istnieje wiele projektów digitalizacji na dużą skalę, które utrwalają te problemy.
Przyszły rozwój
Google , Million Book Project i Internet Archive prowadzone są projekty digitalizacji na dużą skalę . Dzięki ciągłym ulepszeniom technologii obsługi i prezentacji książek, takim jak optyczne rozpoznawanie znaków oraz rozwój alternatywnych magazynów i modeli biznesowych, popularność bibliotek cyfrowych szybko rośnie. Tak jak biblioteki zapuściły się w kolekcje audio i wideo, tak samo biblioteki cyfrowe, takie jak Internet Archive. W 2016 roku Google Books odniósł zwycięstwo w sądzie w sprawie kontynuacji projektu skanowania książek, który został wstrzymany przez Gildię Autorów. Pomogło to bibliotekom otworzyć drogę do współpracy z Google, aby lepiej docierać do klientów, którzy są przyzwyczajeni do informacji skomputeryzowanych.
Według Larry'ego Lannom, dyrektora ds. technologii zarządzania informacjami w organizacji non-profit Corporation for National Research Initiatives (CNRI), „wszystkie problemy związane z bibliotekami cyfrowymi sprowadzają się do archiwizacji”. Dalej stwierdza: „Jeśli za 100 lat ludzie nadal będą mogli przeczytać twój artykuł, rozwiążemy problem”. Daniel Akst, autor The Webster Chronicle, proponuje, że „przyszłość bibliotek - i informacji - jest cyfrowa”. Peter Lyman i Hal Variant, informatycy z Uniwersytetu Kalifornijskiego w Berkeley szacują, że „całkowita światowa roczna produkcja treści drukowanych, filmowych, optycznych i magnetycznych wymagałaby około 1,5 miliarda gigabajtów pamięci”. Dlatego uważają, że „niedługo będzie technicznie możliwe, aby przeciętny człowiek miał dostęp do praktycznie wszystkich zapisanych informacji”.
Archiwa cyfrowe są medium ewoluującym i rozwijają się w różnych okolicznościach. Oprócz repozytoriów na dużą skalę, w odpowiedzi na potrzeby badań i komunikacji badawczej na różnych poziomach instytucjonalnych ewoluowały również inne projekty archiwizacji cyfrowej . Na przykład podczas pandemii COVID-19 biblioteki i uczelnie uruchomiły projekty archiwizacji cyfrowej, aby udokumentować życie w czasie pandemii, tworząc w ten sposób cyfrowy, kulturowy zapis zbiorowych wspomnień z tamtego okresu. Badacze wykorzystali również archiwizację cyfrową do stworzenia specjalistycznych badawczych baz danych . Te bazy danych gromadzą zapisy cyfrowe do użytku na poziomie międzynarodowym i interdyscyplinarnym. Przykładem takiej bazy danych, zbudowanej w odpowiedzi na potrzeby komunikacji naukowej w świetle pandemii, jest uruchomiony w październiku 2020 r. COVID CORPUS. Poza środowiskiem akademickim, ostatnio opracowano również kolekcje cyfrowe, aby przemawiać do szerszej publiczności, jak ma to miejsce w przypadku wybranych treści dla ogółu odbiorców Internet-First University Press opracowanych przez Cornell University. Ta baza danych przeznaczona dla ogółu odbiorców zawiera specjalistyczne informacje badawcze, ale jest zorganizowana cyfrowo w celu ułatwienia dostępu. Ustanowienie tych archiwów ułatwiło wyspecjalizowane formy prowadzenia dokumentacji cyfrowej, aby wypełnić różne nisze w komunikacji online opartej na badaniach.
Zobacz też
- Archiwum Anny
- Baza bibliograficzna
- Repozytorium treści
- Federacja Bibliotek Cyfrowych
- Kryteria wyboru zbiorów cyfrowych
- Cyfryzacja
- D-Lib , magazyn o bibliotekach cyfrowych
- Baza danych pełnotekstowych
- Lista projektów bibliotek cyfrowych
- Biblioteka mobilna
- Biblioteka cieni
- Podróżująca biblioteka
- Archiwum internetowe
Dalsza lektura
- Harvey, Ross; Weatherburn, Jaye (2018). Ochrona materiałów cyfrowych (wyd. 3). Rowmana i Littlefielda. ISBN 9781538102985 .
- McCormack, Allison i Rachel Wittmann. (2022) „Rzadko analizowano związek między cyfrowymi i fizycznymi kolekcjami rzadkich książek”. Informatyka i biblioteki 41,2; 1–13.
- Pomerantz, Jeffrey i Gary Marchionini. 2007. „Biblioteka cyfrowa jako miejsce”. Dziennik dokumentacji 63 (4): 505–33.