Archiwum internetowe
Rodzaj biznesu | 501(c)(3) non-profit |
---|---|
Rodzaj witryny |
Biblioteka Cyfrowa |
Dostępne w | język angielski |
Założony | 10 maja 1996 |
Siedziba |
Dystrykt Richmond San Francisco, Kalifornia Współrzędne : |
Przewodniczący | Brewster Kahle |
Usługi |
|
Przychód | 36,7 mln USD (2019) |
Pracownicy | 169 (2019) |
Adres URL | |
Handlowy | NIE |
Wystrzelony | 1996 |
Aktualny stan | Aktywny |
Internet Archive to amerykańska biblioteka cyfrowa , której misją jest „powszechny dostęp do wszelkiej wiedzy”. Zapewnia bezpłatny publiczny dostęp do zbiorów zdigitalizowanych materiałów, w tym stron internetowych, aplikacji/gier, muzyki, filmów/wideo, ruchomych obrazów i milionów książek. Oprócz funkcji archiwizacyjnej, Archiwum jest organizacją aktywistyczną, opowiadającą się za wolnym i otwartym Internetem. Na dzień 1 stycznia 2023 r. Internet Archive zawiera ponad 36 milionów książek i tekstów, 11,6 miliona filmów, wideo, programów telewizyjnych i klipów, 950 tysięcy programów, 15 milionów plików audio, 4,5 miliona obrazów, 251 tysięcy koncertów i 780 miliardów strony internetowe w Maszyna Waybacka .
Internet Archive umożliwia użytkownikom przesyłanie i pobieranie materiałów cyfrowych do swojego klastra danych, ale większość jego danych jest zbierana automatycznie przez roboty indeksujące , które pracują nad zachowaniem jak największej części publicznej sieci. Jej archiwum internetowe , Wayback Machine, zawiera setki miliardów przechwyconych stron internetowych. Archiwum nadzoruje również jeden z największych na świecie projektów digitalizacji książek.
Historia
Brewster Kahle założył Archive w maju 1996 r., mniej więcej w tym samym czasie, kiedy założył firmę Alexa Internet, zajmującą się indeksowaniem sieci . W październiku tego roku Internet Archive rozpoczęło archiwizowanie i przechowywanie dużych ilości sieci World Wide Web , chociaż najwcześniejszą znaną stronę zapisano 10 maja 1996 r. O godzinie 14:42. Zarchiwizowana zawartość została po raz pierwszy udostępniona ogółowi społeczeństwa w 2001 roku, kiedy opracowano Wayback Machine .
Pod koniec 1999 r. Archiwum rozszerzyło swoje zbiory poza archiwum internetowe, poczynając od Archiwum Prelingera . Teraz Internet Archive zawiera teksty, audio, ruchome obrazy i oprogramowanie. Obsługuje szereg innych projektów: NASA Images Archive, usługę indeksowania kontraktów Archive-It oraz edytowalny katalog biblioteczny i witrynę z informacjami o książkach Open Library . Wkrótce potem Archiwum rozpoczęło pracę nad świadczeniem specjalistycznych usług związanych z dostępu do informacji dla osób z niepełnosprawnością druku; publicznie dostępne książki zostały udostępnione w formie chronionej Cyfrowego Systemu Dostępnych Informacji (DAISY).
Według jego strony internetowej :
Większość społeczeństw przywiązuje wagę do zachowania artefaktów swojej kultury i dziedzictwa. Bez takich artefaktów cywilizacja nie ma pamięci ani mechanizmu uczenia się na swoich sukcesach i porażkach. Nasza kultura produkuje obecnie coraz więcej artefaktów w formie cyfrowej. Misją Archiwum jest pomoc w zachowaniu tych artefaktów i stworzenie internetowej biblioteki dla badaczy, historyków i naukowców.
W sierpniu 2012 r. Archiwum ogłosiło, że dodało BitTorrent do swoich opcji pobierania plików dla ponad 1,3 miliona istniejących plików i wszystkich nowo przesłanych plików. Ta metoda jest najszybszym sposobem pobierania multimediów z Archiwum, ponieważ pliki są obsługiwane z dwóch centrów danych Archiwum, oprócz innych klientów torrent, którzy pobrali i nadal obsługują pliki. 6 listopada 2013 r. Siedziba Internet Archive w dzielnicy Richmond w San Francisco zapaliła się, niszcząc sprzęt i uszkadzając niektóre pobliskie mieszkania. Według Archiwum straciło ono boczny budynek, w którym mieściło się jedno z 30 centrów skaningowych; kamery, światła i sprzęt skanujący o wartości setek tysięcy dolarów; oraz „może 20 pudełek książek i filmów, niektóre niezastąpione, większość już zdigitalizowana, a niektóre do wymiany”. Archiwum non-profit zwróciło się o darowizny na pokrycie szkód szacowanych na 600 000 USD.
Przegląd witryny został uruchomiony w wersji beta w listopadzie 2014 r., A starszy układ został usunięty w marcu 2016 r.
W listopadzie 2016 roku Kahle ogłosił, że Internet Archive buduje Internet Archive of Canada, kopię Archiwum, które ma znajdować się gdzieś w Kanadzie . Ogłoszenie odbiło się szerokim echem ze względu na sugestię, że decyzja o utworzeniu archiwum kopii zapasowych w obcym kraju była podyktowana zbliżającą się prezydenturą Donalda Trumpa . Cytowano, że Kahle powiedział:
9 listopada w Ameryce obudziła nas nowa administracja obiecująca radykalną zmianę. Było to stanowcze przypomnienie, że instytucje takie jak nasza, zbudowane z myślą o perspektywie długoterminowej, muszą projektować zmiany. Dla nas oznacza to zapewnienie bezpieczeństwa, prywatności i stałego dostępu do naszych materiałów kulturowych. Oznacza to przygotowanie się do sieci, która może napotkać większe ograniczenia. Oznacza to służenie klientom w świecie, w którym inwigilacja rządu nie zniknie; rzeczywiście wygląda na to, że wzrośnie. Na przestrzeni dziejów biblioteki walczyły ze straszliwymi naruszeniami prywatności — gdy ludzie byli łapani tylko za to, co czytali. W Internet Archive walczymy o ochronę prywatności naszych czytelników w cyfrowym świecie.
Począwszy od 2017 r. OCLC i Internet Archive współpracowały przy udostępnianiu zapisów zdigitalizowanych książek Archiwum w WorldCat .
petabajtami zdigitalizowanych materiałów Archiwum . W trakcie całorocznej rezydencji artyści wizualni tworzą zbiór prac, których zwieńczeniem jest wystawa. Mamy nadzieję, że połączymy cyfrową historię ze sztuką i stworzymy coś, co przyszłe pokolenia docenią w Internecie i poza nim. Wśród poprzednich artystów będących rezydentami byli Taravat Talepasand , Whitney Lynn i Jenny Odell .
W 2019 roku jej siedziba w San Francisco otrzymała informację o zagrożeniu bombowym , co wymusiło tymczasową ewakuację budynku.
Internet Archive pozyskuje większość materiałów z darowizn, takich jak setki tysięcy dysków 78 rpm z Boston Public Library w 2017 r., darowizna w postaci 250 000 książek z Uniwersytetu Trent w 2018 r. oraz cała kolekcja biblioteki Marygrove College w 2020 r. po tym Zamknięte. Wszystkie materiały są następnie digitalizowane i przechowywane w pamięci cyfrowej, podczas gdy kopia cyfrowa jest zwracana pierwotnemu posiadaczowi, a kopia Internet Archive, jeśli nie jest własnością publiczną, jest wypożyczana patronom na całym świecie pojedynczo w ramach kontrolowanego wypożyczania cyfrowego ( CDL ) teoria tzw doktryna pierwszej sprzedaży .
Operacje
The Archive to organizacja non-profit 501(c)(3) działająca w Stanach Zjednoczonych. W 2019 roku miała roczny budżet w wysokości 36 milionów dolarów, pochodzący z przychodów z usług indeksowania sieci, różnych partnerstw, dotacji, darowizn i Fundacji Kahle-Austin . Internet Archive zarządza również okresowymi kampaniami finansowania. Na przykład kampania z grudnia 2019 r. miała na celu zebranie 6 milionów dolarów darowizn.
Archiwum ma siedzibę w San Francisco w Kalifornii . Od 1996 do 2009 roku jej siedziba znajdowała się w Presidio of San Francisco , byłej amerykańskiej bazie wojskowej. Od 2009 roku jej siedziba znajduje się pod adresem 300 Funston Avenue w San Francisco , dawnym kościele Chrześcijańskiej Nauki . Kiedyś większość personelu pracowała w skanowania książek ; od 2019 roku skanowanie jest wykonywane przez 100 płatnych operatorów na całym świecie. Archiwum posiada również centra danych w trzech kalifornijskich miastach: San Francisco, Redwood City i Richmond . Aby zmniejszyć ryzyko utraty danych, Archiwum tworzy kopie części swoich zbiorów w bardziej odległych lokalizacjach, w tym w Bibliotheca Alexandrina w Egipcie i placówce w Amsterdamie .
Archiwum jest członkiem Międzynarodowego Konsorcjum Ochrony Internetu i zostało oficjalnie uznane za bibliotekę przez stan Kalifornia w 2007 roku.
Archiwizacja internetowa
Wayback Maszyna
Internet Archive wykorzystało popularne użycie terminu „ WABAC Machine ” z części kreskówki The Adventures of Rocky and Bullwinkle (konkretnie Peabody's Improbable History ) i używa nazwy „Wayback Machine” w swojej usłudze, która umożliwia archiwizowanie World Wide Web do przeszukiwania i uzyskiwania do nich dostępu. Ta usługa umożliwia użytkownikom przeglądanie niektórych zarchiwizowanych stron internetowych. Wayback Machine powstał jako wspólny wysiłek Alexa Internet (należąca do Amazon.com ) i Internet Archive, kiedy zbudowano trójwymiarowy indeks umożliwiający przeglądanie zarchiwizowanych treści internetowych. Miliony witryn internetowych i powiązanych z nimi danych (obrazy, kod źródłowy, dokumenty itp.) są zapisywane w bazie danych. Z usługi można korzystać, aby zobaczyć, jak wyglądały poprzednie wersje witryn internetowych, pobrać oryginalny kod źródłowy z witryn internetowych, które mogą już nie być bezpośrednio dostępne, lub odwiedzić witryny internetowe, które już nawet nie istnieją. Nie wszystkie witryny są dostępne, ponieważ wielu właścicieli witryn decyduje się na ich wykluczenie. Podobnie jak w przypadku wszystkich witryn opartych na danych z robotów indeksujących, Internet Archive pomija duże obszary sieci z wielu innych powodów. W artykule z 2004 roku stwierdzono międzynarodowe uprzedzenia w relacji, ale uznano je za „niezamierzone”.
Funkcja archiwizacji „Zapisz stronę teraz” została udostępniona w październiku 2013 r., Dostępna w prawym dolnym rogu strony głównej Wayback Machine. Po wprowadzeniu i zapisaniu docelowego adresu URL strona internetowa stanie się częścią Wayback Machine. Za pośrednictwem adresu internetowego web.archive.org użytkownicy mogą przesyłać do Wayback Machine szeroką gamę treści, w tym PDF i pliki do kompresji danych . Wayback Machine tworzy stały lokalny adres URL przesyłanych treści, który jest dostępny w Internecie, nawet jeśli nie jest wymieniony podczas wyszukiwania na oficjalnej stronie internetowej https://archive.org.
W październiku 2016 roku ogłoszono, że sposób liczenia stron internetowych zostanie zmieniony, co spowoduje zmniejszenie liczby pokazywanych zarchiwizowanych stron. Osadzone obiekty, takie jak obrazy, filmy, arkusze stylów, skrypty JavaScript nie są już liczone jako „strona internetowa”, podczas gdy dokumenty HTML, PDF i zwykły tekst nadal są liczone.
Rok | Zarchiwizowane strony (miliardy) |
---|---|
2005 | 40 |
2006 | 85 |
2007 | 85 |
2008 | 85 |
2009 | 150 |
2010 | 150 |
2011 | 150 |
2012 | 150 |
2013 | 373 |
2014 | 430 |
2015 | 479 |
2016 | 510 273 |
2017 | 286 |
2018 | 344 |
2019 | 396 |
2020 | 486 |
2021 | 635 |
2022 | 771 |
|
We wrześniu 2020 r. Internet Archive ogłosiło współpracę z Cloudflare w celu automatycznego indeksowania witryn internetowych obsługiwanych za pośrednictwem usług „Always Online”.
Archiwum-to
Utworzona na początku 2006 r. Archive-It to subskrypcyjna usługa archiwizacji internetowej, która umożliwia instytucjom i osobom indywidualnym tworzenie i przechowywanie kolekcji treści cyfrowych oraz tworzenie archiwów cyfrowych. Archiwum — pozwala użytkownikowi dostosować przechwytywanie lub wykluczanie treści internetowych, które chcą zachować ze względu na dziedzictwo kulturowe. Za pośrednictwem aplikacji internetowej partnerzy Archive-It mogą gromadzić, katalogować, zarządzać, przeglądać, przeszukiwać i przeglądać swoje zarchiwizowane kolekcje.
Jeśli chodzi o dostępność, zarchiwizowane strony internetowe można przeszukiwać w pełnym tekście w ciągu siedmiu dni od przechwycenia. Treść zebrana przez Archive-It jest przechwytywana i przechowywana jako plik WARC . Kopia podstawowa i kopia zapasowa są przechowywane w centrach danych Internet Archive. Kopię pliku WARC można przekazać subskrybującym instytucjom partnerskim w celu przechowywania i przechowywania z nadmiarowością geograficzną zgodnie z ich standardami najlepszych praktyk. Okresowo dane przechwycone przez Archive-It są indeksowane w ogólnym archiwum Internet Archive.
W marcu 2014 r. Archive-It posiadało ponad 275 instytucji partnerskich w 46 stanach USA i 16 krajach, które przechwyciły ponad 7,4 miliarda adresów URL dla ponad 2444 kolekcji publicznych. Partnerami Archive-It są uniwersytety i biblioteki uniwersyteckie, archiwa stanowe, instytucje federalne, muzea, biblioteki prawnicze i organizacje kulturalne, w tym Electronic Literature Organization , North Carolina State Archives and Library, Stanford University , Columbia University , American University in Cairo , Georgetown Biblioteka prawnicza i wiele innych.
Badacz archiwum internetowego
We wrześniu 2020 r. Internet Archive ogłosiło nową inicjatywę mającą na celu archiwizację i zachowanie ogólnodostępnych czasopism naukowych o nazwie Internet Archive Scholar . Jego pełnotekstowy indeks wyszukiwania obejmuje ponad 25 milionów artykułów naukowych i innych dokumentów naukowych zachowanych w Internet Archive. Kolekcja obejmuje zdigitalizowane kopie osiemnastowiecznych czasopism, najnowsze materiały z konferencji w otwartym dostępie i preprinty przeszukane z sieci World Wide Web.
Indeks ogólny
W 2021 r. Internet Archive ogłosiło wstępną wersję Indeksu ogólnego , publicznie dostępnego indeksu zbioru 107 milionów artykułów z czasopism naukowych .
Kolekcje książek
Zbiór tekstów
Internet Archive prowadzi 33 centra skanowania w pięciu krajach, digitalizując około 1000 książek dziennie, łącznie ponad 2 miliony książek, przy wsparciu finansowym bibliotek i fundacji. Od lipca 2013 r. Kolekcja obejmowała 4,4 miliona książek z ponad 15 milionami pobrań miesięcznie. Według stanu na listopad 2008 r., kiedy było około 1 miliona tekstów, cała kolekcja była większa niż 0,5 petabajta i obejmowała nieprzetworzone obrazy z aparatu, przycięte i przekrzywione obrazy, pliki PDF oraz nieprzetworzone dane OCR . W latach około 2006-2008 Microsoft miał szczególny związek z tekstami Internet Archive poprzez swój projekt Live Search Books , skanując ponad 300 000 książek, które zostały przekazane do kolekcji, a także wsparcie finansowe i sprzęt do skanowania. 23 maja 2008 r. Microsoft ogłosił, że zakończy projekt Live Book Search i przestanie skanować książki. Microsoft udostępnił swoje zeskanowane książki bez ograniczeń umownych i przekazał swój sprzęt do skanowania swoim byłym partnerom.
Około października 2007 r. użytkownicy archiwum zaczęli przesyłać książki należące do domeny publicznej z Google Book Search . Od listopada 2013 r. w zbiorach Archiwum znajdowało się ponad 900 000 książek zdigitalizowanych przez Google; książki są identyczne z kopiami znalezionymi w Google, z wyjątkiem braku znaków wodnych Google i są dostępne do nieograniczonego użytku i pobierania. Brewster Kahle ujawnił w 2013 roku, że ten wysiłek archiwalny był koordynowany przez Aarona Swartza , który wraz z „grupą przyjaciół” pobierał książki należące do domeny publicznej z Google na tyle wolno iz wystarczającej liczby komputerów, aby zmieścić się w ograniczeniach Google. Zrobili to, aby zapewnić publiczny dostęp do domeny publicznej . Archiwum zapewniło, że pozycje zostały przypisane i połączone z Google, które nigdy nie narzekało, podczas gdy biblioteki „narzekały”. Zdaniem Kahle jest to przykład „geniuszu” Swartza do pracy nad tym, co może dać najwięcej dobru publicznemu dla milionów ludzi. Oprócz książek, Archiwum oferuje bezpłatny i anonimowy publiczny dostęp do ponad czterech milionów opinii sądowych, opinii prawnych lub dowodów przesłanych z elektronicznego systemu dokumentów PACER sądów federalnych Stanów Zjednoczonych za pośrednictwem wtyczki przeglądarki internetowej RECAP . Dokumenty te były przechowywane za zaporą sądu federalnego. W Archiwum do 2013 r. uzyskało do nich dostęp ponad sześć milionów osób.
Aplikacja internetowa BookReader firmy Archive , wbudowana w jej witrynę internetową, ma takie funkcje, jak tryby jednej strony, dwóch stron i miniatur ; pełny ekran; powiększanie strony obrazów o wysokiej rozdzielczości ; i animacja odwracania strony .
Liczba tekstów dla każdego języka
Liczba wszystkich tekstów (2022) |
34 000 000 |
---|
Język |
Liczba tekstów (2022) |
---|---|
język angielski | 25 000 000 |
Francuski | 700 000 |
Holenderski | 700 000 |
Niemiecki | 700 000 |
chiński | 550 000 |
arabski | 450 000 |
Włoski | 400 000 |
hiszpański | 300 000 |
język japoński | 150 000 |
grecki | 150 000 |
łacina | 150 000 |
urdu | 100 000 |
Liczba tekstów dla każdej dekady
|
|
|
Otwórz bibliotekę
Open Library to kolejny projekt Internet Archive. Projekt ma na celu umieszczenie strony internetowej dla każdej kiedykolwiek opublikowanej książki: zawiera 25 milionów rekordów katalogowych wydań. Stara się również być biblioteką publiczną dostępną przez Internet: zawiera pełne teksty około 1 600 000 książek należących do domeny publicznej (spośród ponad pięciu milionów z głównego zbioru tekstów), a także książki drukowane i objęte prawami autorskimi, wiele z nich można w pełni odczytać, pobrać i przeszukiwać w pełnym tekście ; oferuje dwutygodniową pożyczkę e-booków w ramach kontrolowanego wypożyczania cyfrowego program dla ponad 647 784 książek nienależących do domeny publicznej, we współpracy z ponad 1000 partnerskich bibliotek z sześciu krajów po bezpłatnej rejestracji na stronie internetowej. Open Library to darmowy projekt oprogramowania o otwartym kodzie źródłowym , którego kod źródłowy jest swobodnie dostępny na GitHub .
Otwarta Biblioteka spotyka się ze sprzeciwem niektórych autorów i Stowarzyszenia Autorów , którzy uważają, że projekt rozpowszechnia książki bez zezwolenia, a tym samym narusza prawa autorskie, a czterech głównych wydawców wszczęło pozew o naruszenie praw autorskich przeciwko Internet Archive w czerwcu 2020 r. zatrzymać projekt Open Library.
Digitalizacja sponsorów książek
Wielu dużych sponsorów instytucjonalnych pomogło Internet Archive w dostarczeniu milionów zeskanowanych publikacji (elementów tekstowych). Niektórzy sponsorzy, którzy zdigitalizowali duże ilości tekstów, to Robarts Library University of Toronto , University of Alberta Libraries , University of Ottawa , Library of Congress , biblioteki członkowskie Boston Library Consortium , Boston Public Library , Princeton Theological Seminary Biblioteka i wiele innych.
W 2017 roku MIT Press upoważnił Internet Archive do digitalizacji i wypożyczania książek z backlisty prasy , przy wsparciu finansowym z Funduszu Arcadia . Rok później Internet Archive otrzymało dalsze fundusze z Arcadia Fund, aby zaprosić kilka innych wydawnictw uniwersyteckich do współpracy z Internet Archive w celu digitalizacji książek w ramach projektu o nazwie „Unlocking University Press Books”.
Biblioteka Kongresu stworzyła liczne identyfikatory systemów uchwytów , które wskazywały na bezpłatne zdigitalizowane książki w Internet Archive. Internet Archive i Open Library są wymienione na stronie internetowej Biblioteki Kongresu jako źródło e-booków.
Zbiory mediów
Oprócz archiwów internetowych Internet Archive przechowuje obszerne kolekcje multimediów cyfrowych, które zostały potwierdzone przez przesyłającego jako należące do domeny publicznej w Stanach Zjednoczonych lub licencjonowane na podstawie licencji umożliwiającej redystrybucję, takiej jak licencje Creative Commons . Media są podzielone na kolekcje według typu mediów (ruchome obrazy, dźwięk, tekst itp.) oraz na podkolekcje według różnych kryteriów. Każda z głównych kolekcji zawiera podzbiór „Społeczność” (wcześniej nazywany „Open Source”), w którym przechowywane są ogólne wkłady opinii publicznej.
Audio
Archiwum audio
Archiwum audio to archiwum audio , które obejmuje muzykę, książki audio , wiadomości, dawne programy radiowe, podcasty i wiele innych plików audio. Od stycznia 2023 roku w kolekcji znajduje się ponad 15 000 000 bezpłatnych nagrań cyfrowych. Podkolekcje obejmują audiobooki i poezję, podcasty, audio w języku innym niż angielski i wiele innych. Kuratorem zbiorów dźwiękowych jest B. George , dyrektor ARCHIWUM MUZYKI WSPÓŁCZESNEJ .
Obok standardowego odtwarzacza audio HTML5 dostępny jest Winamp - przypominający Webampa .
Biblioteka Cyfrowa Krótkofalarstwa i Łączności
Projekt zachowania nagrań amatorskich transmisji radiowych, finansowany z fundacji Amateur Radio Digital Communications.
Archiwum muzyki na żywo
Live Music Archive zawiera ponad 170 000 nagrań koncertowych niezależnych muzyków, a także bardziej uznanych artystów i zespołów muzycznych, które mają liberalne zasady dotyczące nagrywania swoich koncertów, takich jak Grateful Dead , a ostatnio The Smashing Pumpkins . Ponadto Jordan Zevon zezwolił Internet Archive na przechowywanie ostatecznej kolekcji nagrań koncertowych jego ojca Warrena Zevona . Kolekcja Zevon obejmuje lata 1976-2001 i zawiera 126 koncertów, w tym 1137 piosenek.
Wielki projekt 78
The Great 78 Project ma na celu zdigitalizowanie 250 000 singli 78 rpm (500 000 utworów) z okresu między 1880 a 1960 rokiem, przekazanych przez różnych kolekcjonerów i instytucje. Został opracowany we współpracy z Archive of Contemporary Music i George Blood Audio, odpowiedzialnym za digitalizację dźwięku.
Etykiety sieciowe
Archiwum posiada kolekcję muzyki do bezpłatnej dystrybucji, która jest przesyłana strumieniowo i dostępna do pobrania za pośrednictwem usługi Netlabels . Muzyka w tej kolekcji ma na ogół katalogi wirtualnych wytwórni płytowych na licencji Creative Commons.
Kolekcja obrazów
Ta kolekcja zawiera ponad 3,5 miliona pozycji. Cover Art Archive , Metropolitan Museum of Art - Gallery Images, NASA Images, Occupy Wall Street Flickr Archive i USGS Maps to tylko niektóre podkolekcje kolekcji Image.
Archiwum okładek
Archiwum okładek to wspólny projekt Internet Archive i MusicBrainz , którego celem jest tworzenie okładek w Internecie. Od kwietnia 2021 r. ta kolekcja zawiera ponad 1 400 000 pozycji.
Obrazy z Metropolitan Museum of Art
Obrazy z tej kolekcji pochodzą z Metropolitan Museum of Art . Ta kolekcja zawiera ponad 140 000 pozycji.
Obrazy NASA
Archiwum obrazów NASA zostało utworzone na mocy umowy Space Act między Internet Archive a NASA w celu zapewnienia publicznego dostępu do kolekcji obrazów, wideo i audio NASA w jednym zasobie, który można przeszukiwać. Zespół IA NASA Images ściśle współpracował ze wszystkimi ośrodkami NASA, aby stale dodawać do stale rosnącej kolekcji. Witryna nasaimages.org została uruchomiona w lipcu 2008 roku i miała ponad 100 000 elementów online pod koniec jej hostingu w 2012 roku.
Archiwum Occupy Wall Street Flickr
Ta kolekcja zawiera fotografie z Flickr na licencji Creative Commons , związane z ruchem Occupy Wall Street . Ta kolekcja zawiera ponad 15 000 pozycji.
Mapy USGS
Ta kolekcja zawiera ponad 59 000 pozycji z projektu Libre Map .
Obrazy matematyczne
Ta kolekcja zawiera obrazy matematyczne stworzone przez artystę matematycznego Hamida Naderi Yeganeha .
Archiwum Machinimy
Jedną z podkolekcji Archiwum wideo Internet Archive jest Archiwum Machinima. Ta mała sekcja zawiera wiele filmów Machinima. Machinima to cyfrowa forma sztuki, w której gry komputerowe , silniki gier lub silniki oprogramowania są używane w trybie przypominającym piaskownicę do tworzenia filmów, odtwarzania sztuk, a nawet publikowania prezentacji lub przemówień. Archiwum gromadzi szereg filmów Machinima od wydawców internetowych, takich jak Rooster Teeth i Machinima.com jak i niezależnych producentów. Podkolekcja jest wspólnym wysiłkiem Internet Archive, projektu badawczego How They Got Game na Uniwersytecie Stanforda, Academy of Machinima Arts and Sciences oraz Machinima.com.
Kolekcja mikrofilmów
Ta kolekcja zawiera około 160 000 zmikrofilmowanych pozycji z różnych bibliotek, w tym Biblioteki Uniwersytetu Chicago , Uniwersytetu Illinois w Urbana-Champaign , Uniwersytetu Alberty , Biblioteki Publicznej Hrabstwa Allen oraz National Technical Information Service .
Kolekcja ruchomych obrazów
Internet Archive posiada kolekcję około 3863 filmów fabularnych. Ponadto kolekcja Moving Image Internet Archive obejmuje: kroniki filmowe , klasyczne kreskówki , propagandę pro- i antywojenną , The Video Cellar Collection, kolekcję „AV Geeks” Skipa Elsheimera, wczesną telewizję i efemeryczne materiały z Prelinger Archives , takie jak reklamy , filmy edukacyjne i przemysłowe, a także kolekcje filmów amatorskich i domowych.
Podkategorie tej kolekcji obejmują:
- Brick Films firmy IA , która zawiera animacje poklatkowe nakręcone z klocków Lego , z których część to „przeróbki” filmów fabularnych.
- IA Election 2004 , bezpartyjne publiczne źródło udostępniania materiałów wideo związanych z wyborami prezydenckimi w Stanach Zjednoczonych w 2004 roku .
- IA FedFlix , Joint Venture NTIS-1832 pomiędzy National Technical Information Service i Public.Resource.Org, która obejmuje „najlepsze filmy rządu Stanów Zjednoczonych, od filmów szkoleniowych po historię, od naszych parków narodowych po amerykańską Akademię Straży Pożarnej i Inspektorzy pocztowi”
- Independent News firmy IA , która obejmuje podkolekcje, takie jak konkurs World At War Internet Archive z 2001 r., w którym uczestnicy tworzyli krótkie filmy pokazujące, „dlaczego dostęp do historii ma znaczenie”. Wśród najczęściej pobieranych plików wideo znajdują się nagrania naocznych świadków niszczycielskiego trzęsienia ziemi na Oceanie Indyjskim w 2004 roku .
- Archiwum telewizyjne IA z 11 września , które zawiera archiwalne materiały z głównych światowych sieci telewizyjnych z ataków terrorystycznych z 11 września 2001 r., które miały miejsce w telewizji na żywo.
Otwarte zasoby edukacyjne
Otwarte zasoby edukacyjne to kolekcja cyfrowa na archive.org. Ta kolekcja zawiera setki bezpłatnych kursów, wykładów wideo i materiałów uzupełniających z uniwersytetów w Stanach Zjednoczonych i Chinach . Autorami tej kolekcji są ArsDigita University , Hewlett Foundation , MIT , Monterey Institute i Naropa University .
Wyszukiwanie i pożyczanie wiadomości telewizyjnych
We wrześniu 2012 r. Internet Archive uruchomiło usługę TV News Search & Borrow do wyszukiwania krajowych programów informacyjnych w USA. Usługa opiera się na transkrypcjach napisów i umożliwia użytkownikom wyszukiwanie i przesyłanie strumieniowe 30-sekundowych klipów wideo. Po uruchomieniu usługa zawierała „350 000 programów informacyjnych zebranych w ciągu 3 lat z krajowych sieci i stacji w USA w San Francisco i Waszyngtonie”. Według Kahle, usługa została zainspirowana Vanderbilt Television News Archive , podobna biblioteka telewizyjnych programów informacyjnych. W przeciwieństwie do Vanderbilt, który ogranicza dostęp do strumieniowego wideo do osób związanych z subskrybującymi kolegiami i uniwersytetami, TV News Search & Borrow umożliwia otwarty dostęp do swoich strumieniowych klipów wideo. W 2013 roku Archiwum otrzymało dodatkową darowiznę w postaci „około 40 000 dobrze zorganizowanych taśm” z majątku mieszkanki Filadelfii , Marion Stokes . Stokes „nagrała ponad 35 lat wiadomości telewizyjnych w Filadelfii i Bostonie za pomocą swoich maszyn VHS i Betamax ”.
Różne kolekcje
Muzeum Brooklynu
Ta kolekcja zawiera około 3000 pozycji z Brooklyn Museum .
Biblioteka Michelsona
do archiwum została przekazana filmoteka Lillian Michelson .
Inne usługi i przedsięwzięcia
Nośniki fizyczne
Wyrażając stanowczą reakcję na pomysł po prostu wyrzucania książek i zainspirowany Svalbard Global Seed Vault , Kahle wyobraża sobie zbieranie jednego egzemplarza każdej kiedykolwiek opublikowanej książki. „Nie dotrzemy tam, ale to jest nasz cel”, powiedział. Oprócz książek Kahle planuje przechowywać stare serwery Internet Archive, które zostały wymienione w 2010 roku.
Oprogramowanie
Internet Archive ma „największą kolekcję historycznego oprogramowania online na świecie”, obejmującą 50 lat historii komputerów w terabajtach magazynów i czasopism komputerowych, książek, dysków typu shareware , witryn FTP, gier wideo itp. Internet Archive stworzyło archiwum tego, co określa jako „stare oprogramowanie”, jako sposób na ich zachowanie. W ramach projektu opowiadano się za zwolnieniem z amerykańskiej ustawy Digital Millennium Copyright Act, aby umożliwić im ominięcie ochrony przed kopiowaniem , którą Urząd Praw Autorskich Stanów Zjednoczonych zatwierdzony w 2003 r. na okres trzech lat. Archiwum nie oferuje oprogramowania do pobrania, ponieważ zwolnienie dotyczy wyłącznie „celu zachowania lub reprodukcji archiwalnej opublikowanych dzieł cyfrowych przez bibliotekę lub archiwum”. Biblioteka Kongresu odnowiła zwolnienie w 2006 r., aw 2009 r. przedłużyła je na czas nieokreślony w oczekiwaniu na dalsze regulacje. Biblioteka powtórzyła zwolnienie jako „ostateczną zasadę” bez daty wygaśnięcia w 2010 r. W 2013 r. Internet Archive zaczęło udostępniać gry wideo porzucone w przeglądarce - w które można grać przez MESS , na przykład gra na Atari 2600 ET the Extra-Terrestrial . Od 23 grudnia 2014 r. Internet Archive prezentuje za pośrednictwem opartej na przeglądarce DOSBox tysiące gier DOS / PC „wyłącznie do celów naukowych i badawczych”. W listopadzie 2020 r. Archive wprowadziło nowy emulator Adobe Flash o nazwie Ruffle i rozpoczęło archiwizację animacji i gier Flash przed końcem okresu eksploatacji wtyczki Flash 31 grudnia 2020 r. We wszystkich systemach komputerowych.
Stołowy system Scribe
Opracowano połączony system oprogramowania sprzętowego, który realizuje bezpieczną metodę digitalizacji treści.
Unia kredytowa
Od 2012 do listopada 2015 r. Internet Archive obsługiwało Internet Archive Federal Credit Union, federalną kasę kredytową z siedzibą w New Brunswick w stanie New Jersey , której celem jest zapewnienie dostępu osobom o niskich i średnich dochodach. W ciągu swojego krótkiego istnienia IAFCU doświadczyła poważnych konfliktów z National Credit Union Administration , co poważnie ograniczyło portfel pożyczkowy IAFCU i obawy związane z obsługą firm Bitcoin . W momencie rozwiązania liczyła 395 członków i była warta 2,5 miliona dolarów.
Kontrowersje, spory prawne i aktywizm
Wdzięczna śmierć
W listopadzie 2005 roku z serwisu usunięto bezpłatne pliki do pobrania koncertów Grateful Dead . Według artykułu w The New York Times , John Perry Barlow zidentyfikował Boba Weira , Mickeya Harta i Billa Kreutzmanna jako inicjatorów zmiany . Phil Lesh skomentował zmianę w dniu 30 listopada 2005 r., publikując na swojej osobistej stronie internetowej:
Zwrócono mi uwagę, że wszystkie programy Grateful Dead zostały usunięte z Archive.org tuż przed Świętem Dziękczynienia . Nie brałem udziału w tym procesie decyzyjnym i nie zostałem powiadomiony o odwołaniu pokazów. Czuję, że muzyka jest dziedzictwem Grateful Dead i mam nadzieję, że w ten czy inny sposób jest dostępna dla tych, którzy tego chcą.
W poście na forum z 30 listopada Brewster Kahle podsumował to, co wydawało się być kompromisem osiągniętym przez członków zespołu. Nagrania publiczności można było pobierać lub przesyłać strumieniowo, ale z płyty rezonansowej miały być dostępne tylko do przesyłania strumieniowego. Od tego czasu ponownie dodano koncerty.
Listy bezpieczeństwa narodowego
8 maja 2008 roku ujawniono, że Internet Archive pomyślnie zakwestionowało list FBI dotyczący bezpieczeństwa narodowego z prośbą o dzienniki nieujawnionego użytkownika.
W dniu 28 listopada 2016 r. Ujawniono, że pomyślnie zakwestionowano drugi list FBI dotyczący bezpieczeństwa narodowego, w którym prośba o dzienniki innego nieujawnionego użytkownika.
Sprzeciw wobec ustaw SOPA i PIPA
Internet Archive zaciemniło swoją stronę internetową na 12 godzin 18 stycznia 2012 r. W proteście przeciwko ustawom Stop Online Piracy Act i PROTECT IP Act , dwóm aktom prawnym Kongresu Stanów Zjednoczonych, które według nich miałyby „negatywny wpływ na ekosystem publikacji internetowych, które doprowadziły do powstania Internet Archive”. Nastąpiło to w związku z awarią angielskiej Wikipedii , a także wieloma innymi protestami w Internecie.
Sprzeciw wobec ugody dotyczącej Google Books
Internet Archive jest członkiem Open Book Alliance , które jest jednym z najbardziej zagorzałych krytyków Google Book Settlement . Archiwum opowiada się za alternatywnym projektem biblioteki cyfrowej.
Magazyn Nintendo Power
W lutym 2016 r. użytkownicy Internet Archive rozpoczęli archiwizację cyfrowych kopii Nintendo Power , oficjalnego magazynu Nintendo poświęconego ich grom i produktom, która trwała od 1988 do 2012 r. Zebrano pierwszych 140 numerów, zanim Nintendo usunęło archiwum w sierpniu 8, 2016. W odpowiedzi na usunięcie, Nintendo powiedział stronie internetowej poświęconej grom , Polygon : „[Nintendo] musi chronić nasze własne postacie, znaki towarowe i inne treści. Niezatwierdzone wykorzystanie własności intelektualnej Nintendo może osłabić naszą zdolność do jej ochrony i zachowania, lub ewentualnie użyć go do nowych projektów”.
Rząd Indii
W sierpniu 2017 r. Departament Telekomunikacji rządu Indii zablokował archiwum internetowe wraz z innymi witrynami do wymiany plików, zgodnie z dwoma orzeczeniami sądowymi wydanymi przez Sąd Najwyższy w Madrasie , powołując się na obawy dotyczące piractwa po rzekomym udostępnieniu kopii dwóch filmów z Bollywood za pośrednictwem serwisu. Wersja HTTP Archiwum została zablokowana, ale pozostała dostępna przy użyciu protokołu HTTPS .
Indyk
9 października 2016 r. Archiwum internetowe zostało tymczasowo zablokowane w Turcji po tym, jak zostało użyte (między innymi usługami hostingu plików) przez hakerów do przechowywania 17 GB ujawnionych rządowych wiadomości e-mail.
Hosting materiałów terrorystycznych
Flashpoint zajmującą się bezpieczeństwem cybernetycznym stwierdzono, że Państwo Islamskie wykorzystuje Internet Archive do rozpowszechniania swojej propagandy. Chris Butler z Internet Archive odpowiedział, że regularnie rozmawiają z rządami USA i UE na temat wymiany informacji o terroryzmie.
W kwietniu 2019 r. Europol , działając na zlecenie francuskiej policji, zwrócił się do Internet Archive o usunięcie 550 stron zawierających „propagandę terrorystyczną”. Archiwum odrzuciło wniosek, twierdząc, że raporty były błędne co do treści, na które wskazywały, lub były zbyt szerokie, aby organizacja mogła się z nimi zgodzić.
W styczniu 2022 r. były wykładowca UCLA przesłał do Internet Archive 800-stronicowy manifest zawierający rasistowskie idee i groźby pod adresem personelu UCLA. Manifest został usunięty przez Internet Archive po tygodniu, podczas dyskusji o tym, czy takie dokumenty powinny być przechowywane przez archiwistów, czy nie.
Narodowa Biblioteka Ratunkowa
W środku pandemii COVID-19 , która spowodowała zamknięcie wielu szkół, uniwersytetów i bibliotek, Archiwum ogłosiło 24 marca 2020 r., że tworzy Narodową Bibliotekę Ratunkową, usuwając ograniczenia wypożyczania 1,4 miliona zdigitalizowanych książek w swojej Bibliotece Otwartej, ale w inny sposób ograniczając użytkowników do liczby książek, które mogą wypożyczyć i wymuszając ich zwrot; normalnie witryna zezwalałaby tylko na jedno cyfrowe wypożyczenie dla każdej posiadanej fizycznej kopii książki, przy użyciu zaszyfrowanego pliku które stałyby się bezużyteczne po zakończeniu okresu wypożyczenia. Biblioteka ta pozostanie w takiej formie co najmniej do 30 czerwca 2020 r. lub do zakończenia stanu wyjątkowego w Stanach Zjednoczonych, w zależności od tego, co nastąpi później. W chwili uruchomienia Internet Archive umożliwiało autorom i posiadaczom praw składanie wniosków o rezygnację z usunięcia ich prac z Narodowej Biblioteki Ratunkowej.
Internet Archive stwierdziło, że National Emergency Library odpowiedziała na „bezprecedensową globalną i natychmiastową potrzebę dostępu do materiałów do czytania i badań” z powodu zamknięcia bibliotek fizycznych na całym świecie. Uzasadniali ten ruch na wiele sposobów. Z prawnego punktu widzenia powiedzieli, że promują dostęp do tych niedostępnych zasobów, co, jak twierdzili, było ćwiczeniem w dozwolonego użytku . Archiwum kontynuowało wdrażanie kontrolowanych pożyczek cyfrowych zasady, które istniały przed Narodową Biblioteką Ratunkową, co oznaczało, że nadal szyfrowały wypożyczone kopie, a użytkownikom nie było łatwiej tworzyć nowe kopie książek niż wcześniej. Ostateczne rozstrzygnięcie, czy Narodowa Biblioteka Ratunkowa stanowiła dozwolony użytek, mógł dokonać tylko sąd. Z moralnego punktu widzenia wskazywali również, że Internet Archive jest zarejestrowaną biblioteką, jak każda inna, że albo sami płacili za książki, albo otrzymywali je jako darowizny, a wypożyczanie za pośrednictwem bibliotek poprzedzało ograniczenia praw autorskich.
Jednak Archiwum było już krytykowane przez autorów i wydawców za wcześniejsze podejście do wypożyczania, a po ogłoszeniu Narodowej Biblioteki Ratunkowej autorzy, wydawcy i grupy reprezentujące obie strony podjęły dalsze kwestie, zrównując ruch z naruszeniem praw autorskich i piractwem cyfrowym oraz wykorzystywanie pandemii COVID-19 jako pretekstu do przekraczania granic praw autorskich (zobacz też: Otwarta Biblioteka § Oskarżenia o naruszenie praw autorskich ). Po tym, jak prace niektórych z tych autorów zostały wyśmiane w odpowiedziach, Jason Scott z Internet Archive zażądał, aby zwolennicy Narodowej Biblioteki Ratunkowej nie oczerniali niczyich książek: „Zdaję sobie sprawę, że toczy się tutaj silna debata i nieporozumienia, ale książki dają życie i zmieniają życie, a ci pisarze je stworzyli”.
Pozew wydawców
Działanie Narodowej Biblioteki Ratunkowej było częścią pozwu wniesionego przeciwko Internet Archive przez czterech głównych wydawców książek – Hachette, HarperCollins, John Wiley & Sons i Penguin Random House – w czerwcu 2020 r., kwestionujących ważność praw autorskich do kontrolowanych pożyczek cyfrowych program. W odpowiedzi Internet Archive zamknęło Narodową Bibliotekę Ratunkową 16 czerwca 2020 r., A nie planowany 30 czerwca 2020 r., Z powodu pozwu. Powodowie, wspierani przez Copyright Alliance , twierdzili w pozwie, że działania Internet Archive stanowiły „umyślne masowe naruszenie praw autorskich”. W sierpniu 2020 r. Rozprawa sądowa miała rozpocząć się wstępnie w listopadzie 2021 r. Do czerwca 2022 r. Obie strony sprawy zażądały wydania wyroku w trybie doraźnym, z których każda faworyzowała swoje strony, co sędzia John G. Koeltl zatwierdził rozprawę w sprawie wyroku w trybie uproszczonym do nastąpi później w 2022 roku.
Senator Thom Tillis z Karoliny Północnej, przewodniczący podkomisji ds. własności intelektualnej w Senackiej Komisji Sądownictwa, napisał w liście do Internet Archive, że „jest zaniepokojony tym, że Internet Archive uważa, iż to ono – a nie Kongres – może określać zakres praw autorskich prawo".
W ramach odpowiedzi na pozew wydawców, pod koniec 2020 roku Archiwum rozpoczęło kampanię Empowering Libraries (hasztag #EmpoweringLibraries), która przedstawiała pozew jako zagrożenie dla wszystkich bibliotek.
W artykule przeddrukowanym z 2021 r. Argyri Panezi argumentował, że sprawa „przedstawia dwie ważne, ale odrębne kwestie związane z elektronicznym dostępem do dzieł bibliotecznych; po pierwsze, stawia pytania dotyczące praktyki prawnej wypożyczania cyfrowego, a po drugie, pyta, czy awaryjne użycie materiałów chronionych prawem autorskim może być dozwolony użytek” i argumentował, że biblioteki pełnią rolę służby publicznej, aby umożliwić „przyszłym pokoleniom utrzymanie równego dostępu - lub możliwości dostępu – do wielu oryginalnych źródeł”.
W grudniu 2020 roku Publishers Weekly umieścił pozew wśród swoich „10 najlepszych historii bibliotecznych 2020 roku”.
Droga do przodu
30 września 2021 r., w ramach obchodów 25-lecia, Internet Archive uruchomiło „Wayforward Machine”, satyryczną , fikcyjną stronę internetową zawierającą wyskakujące okienka z prośbą o podanie danych osobowych. Witryna miała przedstawiać fikcyjną dystopijną oś czasu rzeczywistych wydarzeń prowadzących do takiej przyszłości, takich jak uchylenie sekcji 230 Kodeksu Stanów Zjednoczonych w 2022 r. i wprowadzenie implantów reklamowych w 2041 r. Planowane jest usunięcie Wayforward Machine w 2022 r., po obchodach 25-lecia Internet Archive. [ wymaga aktualizacji ] [ potrzebne źródło ]
Dokument BBC o Modim
Internet Archive stało się popularną witryną, w której Hindusi mogli obejrzeć pierwszy odcinek filmu dokumentalnego BBC, The Modi Question , w 2023 roku. Zgłoszono, że wideo zostało usunięte przez Archiwum 23 stycznia 2023 r. Następnie Internet Archive stwierdziło, 27 stycznia stycznia, że usunęli film w odpowiedzi na żądanie BBC na mocy ustawy Digital Millennium Copyright Act .
Kolekcja archiwistów ceramiki
W Wielkiej Sali Internet Archive znajduje się kolekcja ponad 100 ceramicznych figurek reprezentujących pracowników Internet Archive. Ta kolekcja, inspirowana posągami wojowników Xian w Chinach , została zamówiona przez Brewstera Kahle, wyrzeźbiona przez Nuala Creed , a od 2014 roku jest w toku.
Artyści w rezydencji
Rezydencja sztuki wizualnej Internet Archive, zorganizowana przez Amira Sabera Esfahaniego, ma na celu połączenie początkujących i średniozaawansowanych artystów z milionami kolekcji Archiwum oraz pokazanie, co jest możliwe, gdy otwarty dostęp do informacji krzyżuje się ze sztuką . Podczas tej rocznej rezydencji wybrani artyści opracowują zbiór prac, który odpowiada na zbiory Archiwum i wykorzystuje je we własnej praktyce.
Artyści z rezydencji 2019: Caleb Duarte , Whitney Lynn i Jeffrey Alan Scudder [ potrzebne źródło ] Artyści z rezydencji 2018: Mieke Marple, Chris Sollars i Taravat Talepasand [ potrzebne źródło ]
Artyści z rezydencji 2017: Laura Kim, Jeremiah Jenkins i Jenny Odell [ potrzebne źródło ]
Zobacz też
Podobne projekty
- archiwum.dziś
- Internetowa Fundacja Pamięci
- LibriVox
- Narodowy Program Infrastruktury i Ochrony Informacji Cyfrowej (NDIIPP)
- Program Narodowej Biblioteki Cyfrowej (NDLP)
- Projekt Gutenberg
- Archiwum internetowe rządu Wielkiej Brytanii w The National Archives (Wielka Brytania)
- Archiwum internetowe Wielkiej Brytanii
- WebCite
Inny
Dalsza lektura
Zasoby biblioteczne dotyczące Internet Archive |
- Kahle, Brewster (listopad 1996). „Archiwizacja Internetu” . Ameryka naukowa . Zarchiwizowane od oryginału w dniu 11 października 1997 r.
- Kahle, Brewster (6 listopada 2013). „Pożar centrum skanowania — pomóż w odbudowie” . Blogi archiwum internetowego .
- Lepore, Jill (26 stycznia 2015). „Pajęczyna” . Nowojorczyk .
- Ringmar, Erik (10 kwietnia 2008). „Wyzwalaj i rozpowszechniaj” . Dodatek Times Higher Education .
Linki zewnętrzne
- 1996 zakłady w Kalifornii
- 1996 w Sanoku
- 501(c)(3) organizacje
- Dostęp do ruchu wiedzy
- Organizacje charytatywne z siedzibą w Kalifornii
- Fundacje z siedzibą w Stanach Zjednoczonych
- Archiwum internetowe
- Właściwości internetowe założone w 1996 roku
- Archiwa internetowe Stanów Zjednoczonych
- Organizacje utworzone w 1996 r
- Biblioteki publiczne w Kalifornii
- Dystrykt Richmond, San Francisco
- Archiwa dźwiękowe
- Usługi cebulowe Tor
- Inicjatywy archiwizacji internetowej
- Laureaci nagrody Webby'ego