Projekt Gutenberg

Projekt Gutenberg
Project Gutenberg logo.svg
Przyjęty
grudzień 1971 ; 51 lat temu ( 1971-12 ) (pierwszy opublikowany dokument)
Kolekcja
Rozmiar Ponad 60 000 dokumentów
Strona internetowa Gutenberg.org _

Projekt Gutenberg ( PG ) to wolontariat mający na celu digitalizację i archiwizację dzieł kultury , a także „zachęcanie do tworzenia i dystrybucji e-booków ”. Została założona w 1971 roku przez amerykańskiego pisarza Michaela S. Harta i jest najstarszą biblioteką cyfrową . Większość pozycji w jej zbiorach to pełne teksty książek lub pojedyncze opowiadania znajdujące się w domenie publicznej . Wszystkie pliki są dostępne bezpłatnie w otwartym formacie układ, dostępny na prawie każdym komputerze. Na dzień 3 października 2015 r. Projekt Gutenberg osiągnął 50 000 pozycji w swojej kolekcji bezpłatnych e-booków.

Wydania są dostępne w postaci zwykłego tekstu , a także w innych formatach, takich jak HTML , PDF , EPUB , MOBI i Plucker , jeśli to możliwe. Większość publikacji jest w języku angielskim , ale dostępnych jest również wiele prac w języku innym niż angielski. Istnieje wiele powiązanych projektów, które zapewniają dodatkowe treści, w tym prace specyficzne dla regionu i języka. Projekt Gutenberg jest ściśle powiązany z Distributed Proofreaders , internetową społecznością zajmującą się korektą zeskanowanych tekstów.

Project Gutenberg nosi imię Johannesa Gutenberga , który wprowadził w Europie drukowanie książek ruchomą czcionką.

Historia

Michael S. Hart (po lewej) i Gregory Newby (po prawej) z Projektu Gutenberg na konferencji Hackers on Planet Earth (HOPE), 2006.

Michael S. Hart rozpoczął Projekt Gutenberg w 1971 roku od digitalizacji Deklaracji Niepodległości Stanów Zjednoczonych . Hart, student University of Illinois , uzyskał dostęp do komputera typu mainframe Xerox Sigma V w uniwersyteckim Laboratorium Badań nad Materiałami. Za pośrednictwem zaprzyjaźnionych operatorów otrzymał konto z praktycznie nieograniczoną ilością czasu komputerowego; jego wartość w tamtym czasie była różnie szacowana na 100 000 lub 100 000 000 dolarów. Hart wyjaśnił, że chce „oddać” ten dar, robiąc coś, co można by uznać za bardzo wartościowe. Jego początkowym celem było udostępnienie opinii publicznej 10 000 najczęściej przeglądanych książek za niewielką opłatą lub bezpłatnie do końca XX wieku.

4 lipca 1971 roku, zainspirowany bezpłatną drukowaną kopią Deklaracji Niepodległości Stanów Zjednoczonych, postanowił wpisać tekst do komputera i przesłać go innym użytkownikom w sieci komputerowej.

— Gregory B. Newby

Ten konkretny komputer był jednym z 15 węzłów ARPANET , sieci komputerowej, która miała stać się Internetem . Hart wierzył, że pewnego dnia ogół społeczeństwa będzie mógł uzyskać dostęp do komputerów i postanowił bezpłatnie udostępniać dzieła literackie w formie elektronicznej. W swoim plecaku użył kopii Deklaracji Niepodległości Stanów Zjednoczonych, która stała się pierwszym e-tekstem Projektu Gutenberg . Nazwał projekt na cześć Johannesa Gutenberga , XV-wiecznego niemieckiego drukarza, który napędzał prasę drukarską z ruchomymi czcionkami rewolucja.

W połowie lat 90. Hart prowadził Projekt Gutenberg w Illinois Benedictine College . Do akcji włączyło się więcej ochotników. Ręcznie wprowadzał cały tekst do 1989 r., kiedy skanery obrazu i oprogramowanie do optycznego rozpoznawania znaków ulepszyły się i stały się bardziej dostępne, dzięki czemu skanowanie książek stało się bardziej wykonalne. Hart później doszedł do porozumienia z Carnegie Mellon University , który zgodził się zarządzać finansami Projektu Gutenberg. Wraz ze wzrostem liczby e-tekstów wolontariusze zaczęli przejmować codzienne operacje projektu, którymi kierował Hart.

Włoski wolontariusz Pietro Di Miceli opracował i administrował pierwszą witryną internetową Projektu Gutenberg oraz rozpoczął tworzenie katalogu online Projektu. W ciągu dziesięciu lat pełnienia tej roli (1994–2004) strony internetowe Projektu zdobyły wiele nagród, często pojawiając się na listach „best of the Web”, przyczyniając się do popularności projektu.

Począwszy od 2004 r., ulepszony katalog online ułatwił przeglądanie, dostęp i hiperłącze do treści projektu Gutenberg . Projekt Gutenberg jest teraz obsługiwany przez ibiblio na Uniwersytecie Północnej Karoliny w Chapel Hill .

Hart zmarł 6 września 2011 roku w swoim domu w Urbana w stanie Illinois w wieku 64 lat.

Projekt CD i DVD

W sierpniu 2003 r. Project Gutenberg stworzył płytę CD zawierającą około 600 „najlepszych” e-booków z kolekcji. Płyta CD jest dostępna do pobrania jako obraz ISO . Jeśli użytkownicy nie mogą pobrać płyty CD, mogą poprosić o przesłanie bezpłatnej kopii.

W grudniu 2003 roku powstała płyta DVD zawierająca blisko 10 000 pozycji. W tamtym czasie stanowiło to prawie całą kolekcję. Na początku 2004 roku DVD stało się również dostępne pocztą.

W lipcu 2007 roku ukazało się nowe wydanie DVD zawierające ponad 17 000 książek, aw kwietniu 2010 roku dwuwarstwowe DVD zawierające prawie 30 000 pozycji.

Większość płyt DVD i wszystkie płyty CD wysłane pocztą w ramach projektu zostały nagrane na nośnikach zapisywalnych przez wolontariuszy. Jednak wyprodukowano nowe dwuwarstwowe płyty DVD, ponieważ okazało się to bardziej ekonomiczne niż nagrywanie ich przez ochotników. Od października 2010 roku projekt wysłał około 40 000 płyt. Od 2017 roku zaprzestano dostarczania bezpłatnych płyt CD, chociaż obraz ISO jest nadal dostępny do pobrania.

Zakres kolekcji

Rozwój publikacji Projektu Gutenberg od 1994 do 2015 roku

każdego tygodnia dodawanych było średnio ponad 50 nowych e-booków . Są to przede wszystkim dzieła literatury wywodzące się z zachodniej tradycji kulturowej . Oprócz literatury, takiej jak powieści, poezja, opowiadania i dramaty, Projekt Gutenberg obejmuje również książki kucharskie , materiały referencyjne i numery czasopism. Kolekcja Projektu Gutenberg zawiera również kilka pozycji nietekstowych, takich jak pliki audio i pliki z notacją muzyczną.

Większość wydań jest w języku angielskim, ale są też znaczące numery w wielu innych językach. Od kwietnia 2016 r. Najbardziej reprezentowanymi językami innymi niż angielski są: francuski, niemiecki, fiński, holenderski, włoski i portugalski.

Jeśli to możliwe, wydania Gutenberga są dostępne w postaci zwykłego tekstu , głównie przy użyciu kodowania znaków US-ASCII , ale często rozszerzonego do ISO-8859-1 (potrzebnego na przykład do reprezentowania znaków akcentowanych w języku francuskim i Scharfes w języku niemieckim). Poza tym, że jest wolny od praw autorskich, wymaganie dotyczące zestawu znaków łacińskich ( ) wersja tekstowa wydania była kryterium Michaela Harta od założenia Projektu Gutenberg, ponieważ uważa, że ​​​​jest to format, który najprawdopodobniej będzie czytelny w dłuższej przyszłości. Z konieczności kryterium to musiało zostać rozszerzone na spory zbiór tekstów w językach wschodnioazjatyckich, takich jak chiński i japoński, które znajdują się obecnie w zbiorze, gdzie zamiast tego używany jest kodek UTF-8 .

Inne formaty mogą również zostać wydane, jeśli zostaną przesłane przez wolontariuszy. Najpopularniejszym formatem innym niż ASCII jest HTML , który umożliwia dołączanie znaczników i ilustracji. Niektórzy członkowie projektu i użytkownicy prosili o bardziej zaawansowane formaty, uważając, że są one łatwiejsze do odczytania. Jednak niektóre formaty, które nie są łatwe do edycji, takie jak PDF , są generalnie uważane za niezgodne z celami Projektu Gutenberg. Również Project Gutenberg ma dwie opcje formatów głównych, które można przesłać (z których generowane są wszystkie inne pliki): dostosowane wersje standardu Text Encoding Initiative (od 2005) i reStructuredText (od 2011).

Począwszy od 2009 roku, katalog Project Gutenberg zaczął oferować automatycznie generowane alternatywne formaty plików, w tym HTML (jeśli nie został jeszcze dostarczony), EPUB i plucker .

ideały

Michael Hart powiedział w 2004 roku: „Misja Projektu Gutenberg jest prosta:„ Zachęcanie do tworzenia i dystrybucji ebooków ”. Jego celem było „dostarczenie jak największej liczby e-booków w jak największej liczbie formatów, aby cały świat mógł czytać w jak największej liczbie języków”. Podobnie hasło projektu brzmi „przełamać bariery ignorancji i analfabetyzmu”, ponieważ jego wolontariusze mają na celu dalsze szerzenie umiejętności czytania i pisania oraz doceniania dziedzictwa literackiego, tak jak zaczęły to robić biblioteki publiczne pod koniec XIX wieku.

Projekt Gutenberg jest celowo zdecentralizowany; nie ma polityki wyboru, która dyktuje, jakie teksty dodać. Zamiast tego poszczególni wolontariusze pracują nad tym, czym są zainteresowani lub czym dysponują. Kolekcja Projektu Gutenberg ma na celu zachowanie przedmiotów przez długi czas, aby nie mogły zostać utracone przez żaden lokalny wypadek. Aby to zapewnić, regularnie tworzone są kopie zapasowe całej kolekcji i kopie lustrzane na serwerach w wielu różnych lokalizacjach.

Prawo autorskie

Projekt Gutenberg starannie weryfikuje status swoich e-booków zgodnie z prawem autorskim Stanów Zjednoczonych . Materiał jest dodawany do archiwum Projektu Gutenberg dopiero po otrzymaniu zezwolenia na prawa autorskie, a zapisy tych zezwoleń są zapisywane do wykorzystania w przyszłości. Project Gutenberg nie rości sobie praw autorskich do publikowanych przez siebie tytułów. Zamiast tego zachęca do ich bezpłatnej reprodukcji i dystrybucji.

Większość książek z kolekcji Projektu Gutenberg jest rozpowszechniana jako domena publiczna zgodnie z prawem autorskim Stanów Zjednoczonych. Istnieje również kilka tekstów chronionych prawem autorskim, takich jak te autorstwa autora science fiction Cory'ego Doctorowa , które Projekt Gutenberg rozpowszechnia za zgodą. Podlegają one dalszym ograniczeniom określonym przez właściciela praw autorskich, chociaż zazwyczaj są objęte licencją Creative Commons .

„Projekt Gutenberg” jest znakiem towarowym organizacji, a znak nie może być używany w komercyjnych lub zmodyfikowanych redystrybucjach tekstów należących do domeny publicznej z projektu. Nie ma prawnych przeszkód w odsprzedaży dzieł należących do domeny publicznej, jeśli wszystkie odniesienia do Projektu Gutenberg zostaną usunięte, ale współtwórcy Gutenberga kwestionowali stosowność bezpośredniego i komercyjnego ponownego wykorzystywania treści sformatowanych przez wolontariuszy. Zdarzały się przypadki, gdy książki były pozbawione przypisania do projektu i sprzedawane z zyskiem w Kindle Store i innych księgarniach, jednym z nich była książka z 1906 roku Łapanie lisów .

Strona internetowa nie była dostępna na terenie Niemiec w wyniku orzeczenia sądu S. Fischer Verlag dotyczącego dzieł Heinricha Manna , Thomasa Manna i Alfreda Döblina . Chociaż w Stanach Zjednoczonych znajdowały się one w domenie publicznej, niemiecki sąd (sąd okręgowy we Frankfurcie nad Menem) uznał naruszenie praw autorskich nadal istniejące w Niemczech i stwierdził, że strona internetowa projektu Gutenberg podlega jurysdykcji niemieckiej, ponieważ zawiera treści w języku niemieckim język i jest dostępny w Niemczech. Wyrok ten został potwierdzony przez Sąd Apelacyjny we Frankfurcie w dniu 30 kwietnia 2019 r. (11 U 27/18). Sąd Apelacyjny we Frankfurcie nie wydał zezwolenia na dalsze odwołanie do Federalnego Trybunału Sprawiedliwości (Bundesgerichtshof), jednak wniosek o zezwolenie na odwołanie został złożony w Federalnym Trybunale Sprawiedliwości. Na dzień 4 października 2020 r. wniosek ten był nadal rozpatrywany (Trybunał Federalny I ZR 97/19). Według Fundacji Archiwum Literackie Projektu Gutenberg „W październiku 2021 r. strony osiągnęły ugodę. Zgodnie z warunkami umowy eBooki Projektu Gutenberg autorstwa trzech autorów będą blokowane z Niemiec do czasu wygaśnięcia ich niemieckich praw autorskich. ugody, ogólnoniemiecka blokada już nie obowiązuje. Pozostałe warunki ugody są poufne”.

Witryna jest zablokowana we Włoszech od maja 2020 r.

Krytyka

Pliki tekstowe używają formatu zwykłego tekstu zakodowanego w UTF-8 i są zwykle opakowane w 65–70 znaków, z akapitami oddzielonymi podwójnym podziałem wiersza. W ostatnich dziesięcioleciach wynikający z tego wygląd i brak możliwości znaczników były często postrzegane jako nijakie i jako wada tego formatu. Projekt Gutenberg próbuje rozwiązać ten problem, udostępniając wiele tekstów również w wersjach HTML, ePub i PDF. Wersje HTML starszych tekstów są wersjami generowanymi automatycznie. Inny projekt non-profit, Standard Ebooks , ma na celu rozwiązanie tych problemów za pomocą kolekcji tytułów należących do domeny publicznej, które są sformatowane i stylizowane. Poprawia kwestie związane z projektowaniem i typografią.

W grudniu 1994 r. Project Gutenberg został skrytykowany przez Text Encoding Initiative za brak dokumentacji lub omówienie decyzji nieuniknionych przy przygotowywaniu tekstu lub w niektórych przypadkach brak udokumentowania, która z kilku (sprzecznych) wersji tekstu była tą zdigitalizowane.

Wybór dostępnych prac (i wydań) został określony przez popularność, łatwość skanowania, brak praw autorskich i inne czynniki; trudno byłoby tego uniknąć w każdym projekcie crowdsourcingowym.

W marcu 2004 r. Michael Hart i John S. Guagliardo rozpoczęli inicjatywę mającą na celu zapewnienie tanich własności intelektualnych. Początkowa nazwa tego projektu brzmiała Project Gutenberg 2 (PG II), co wywołało kontrowersje wśród wolontariuszy PG z powodu ponownego wykorzystania zastrzeżonej nazwy projektu w komercyjnym przedsięwzięciu.

Fundacja Archiwum Literackie Projektu Gutenberg

W 2000 roku korporacja non-profit Project Gutenberg Literary Archive Foundation, Inc. 501(c)(3) EIN : 64-6221541 została zarejestrowana w Mississippi w Stanach Zjednoczonych w celu obsługi potrzeb prawnych projektu. Darowizny na jej rzecz można odliczyć od podatku .

Gregory B. Newby, będąc adiunktem w Szkole Informacji i Bibliotekoznawstwa UNC oraz długoletnim wolontariuszem Projektu Gutenberg, w 2001 roku został pierwszym dyrektorem generalnym fundacji , później dyrektorem Centrum Superkomputerowego Regionu Arktycznego , później dyrektorem ds. technologii Compute Canada.

Wzmacniacz

  • Project Gutenberg Consortia Center specjalizuje się w zbiorach kolekcji. Nie mają one nadzoru redakcyjnego ani spójnego formatowania głównego Projektu Gutenberg. Prezentowane są kolekcje tematyczne, a także liczne języki. Jest to sponsorowane przez worldlibrary.net , na którym znajduje się self.gutenberg.org , portal do samodzielnego publikowania.
  • ibiblio na Uniwersytecie Północnej Karoliny w Chapel Hill jest teraz gospodarzem Projektu Gutenberg
  • Distributed Proofreaders: W 2000 roku Charles Franks założył Distributed Proofreaders (DP), co umożliwiło dystrybucję korekty zeskanowanych tekstów wśród wielu ochotników przez Internet. Wysiłek ten zwiększył liczbę i różnorodność tekstów dodawanych do Projektu Gutenberg, a także ułatwił nowym wolontariuszom rozpoczęcie współpracy. DP zostało oficjalnie stowarzyszone z Projektem Gutenberg w 2002 roku. Od 2018 roku ponad 36 000 książek przesłanych przez DP stanowiło prawie dwie trzecie z prawie 60 000 książek w Projekcie Gutenberg.

Siostrzane projekty

Wszystkie siostrzane projekty są niezależnymi organizacjami, które podzielają te same ideały i otrzymały pozwolenie na używanie znaku towarowego Project Gutenberg . Często mają one szczególny charakter narodowy lub językowy.

Lista projektów siostrzanych

  • Projekt Gutenberg Australia zawiera wiele tekstów, które są własnością publiczną zgodnie z australijskim prawem autorskim , ale nadal są objęte prawami autorskimi (lub mają niepewny status) w Stanach Zjednoczonych, ze szczególnym uwzględnieniem australijskich pisarzy i książek o Australii.
  • Projekt Gutenberg Kanada . biblioteka cyfrowa kanadyjskich tekstów należących do domeny publicznej.
  • Projekt Gutenberg-DE rości sobie prawa autorskie do swojego produktu i ogranicza dostęp do internetowych wersji swoich tekstów, które można przeglądać.
  • Projekt Gutenberg Europe jest prowadzony przez Project Rastko w Serbii . Ma na celu bycie Projektem Gutenberg dla całej Europy i zaczął publikować projekty w 2005 roku. Wykorzystuje Distributed Proofreaders do szybkiego tworzenia etekstów.
  • Project Gutenberg Luxembourg publikuje głównie, ale nie wyłącznie, książki napisane w języku luksemburskim .
  • Projekti Lönnrot, zapoczątkowany przez fińskich wolontariuszy Projektu Gutenberg, wywodzi swoją nazwę od fińskiego filologa Eliasa Lönnrota (1802–1884)
  • Projekt Gutenberg z Filipin ma na celu „udostępnienie jak największej liczby książek jak największej liczbie osób, ze szczególnym uwzględnieniem języków filipińskich i filipińskich”.
  • Projekt Gutenberg Rosja (Rutenberg) ma na celu gromadzenie książek należących do domeny publicznej w językach słowiańskich, zwłaszcza w języku rosyjskim. Dyskusja na temat projektu i jego strony prawnej rozpoczęła się w kwietniu 2012 roku. Słowo Rutenberg to połączenie słów „Rosja” i „Gutenberg”.
  • Projekt Gutenberg Self-Publishing Portal znany również jako Project Gutenberg Self-Publishing Press , przez Project Gutenberg Consortia Center W przeciwieństwie do samego Projektu Gutenberg, Project Gutenberg Self-Publishing umożliwia przesyłanie tekstów nigdy wcześniej nie publikowanych, w tym publikowanych samodzielnie książek elektronicznych. Uruchomiony w 2012 roku, posiada również domenę „gutenberg.us”.
  • Projekt Gutenberg z Tajwanu ma na celu archiwizowanie książek wolnych od praw autorskich, ze szczególnym uwzględnieniem Tajwanu w językach angielskim, mandaryńskim i tajwańskim. Jest to specjalny projekt Forumosa.com
  • Projekt Runeberg , literatura nordycka
  • ReadingRoo.ms , siedziba Projektu Gutenberg PrePrints

Partnerzy

  • Internet Archive , poprzednia długoletnia witryna dystrybucji kopii zapasowych i poprzednia główna witryna hosta.
  • Librivox.org , nowy główny partner AudioBooks

Zobacz też

Linki zewnętrzne

Posłuchaj tego artykułu ( 17 minut )
Spoken Wikipedia icon
Ten plik audio został utworzony na podstawie wersji tego artykułu z dnia 23 lipca 2007 r. ( 2007-07-23 ) i nie odzwierciedla późniejszych edycji.