Archiwum internetowe Wielkiej Brytanii

UK Web Archive to konsorcjum sześciu brytyjskich bibliotek depozytowych , które ma na celu gromadzenie wszystkich brytyjskich witryn internetowych co najmniej raz w roku.

Archiwum internetowe Wielkiej Brytanii
Ukwa-2018-onwhite-close.svg
Przyjęty 2005
Odniesienie do mandatu prawnego Tak, zgodnie z prawem:
Strona internetowa Oficjalna strona internetowa Edit this at Wikidata
UK Web Archive is located in the United Kingdom
George IV Bridge, National Library of Scotland
Moving Image Archive
Near Boston Spa
St. Pancras, London
Aberystwyth
NLW Reading Room at Cardiff University Library
Cambridge University Library
Weston Library
Trinity College Library
Biblioteki zapewniające dostęp do archiwum.

Historia

W 2005 roku British Library , The National Archives , Wellcome Trust , National Library of Scotland , National Library of Wales i JISC utworzyły UK Web Archiving Consortium, projekt mający na celu archiwizowanie stron internetowych.

UKWAC zarchiwizował wybrane strony internetowe na podstawie licencji lub pozwolenia, używając oprogramowania PANDAS opracowanego przez Bibliotekę Narodową Australii . W trakcie projektu jego członkowie zbierali strony związane z ich zainteresowaniami; Wellcome Library zebrała strony medyczne , strony bibliotek narodowych, które odzwierciedlają życie we współczesnej Walii lub Szkocji. Biblioteka Brytyjska prowadziła szeroką politykę gromadzenia miejsc o znaczeniu kulturowym, historycznym i politycznym dla Wielkiej Brytanii.

Konsorcjum zostało rozwiązane w 2010 roku. Grupa Robocza ds. Archiwizacji i Konserwacji przejęła rolę koordynującą UKWAC w zakresie archiwizacji internetowej w Wielkiej Brytanii. Grupa robocza Digital Preservation Coalition jest gospodarzem grupy roboczej.

Archiwizacja internetowa

Archiwum przeprowadza coroczne indeksowanie domen .uk i innych geograficznych domen najwyższego poziomu w Wielkiej Brytanii , takich jak .scot , .cymru lub .london .

A graph showing a small part of a UK Web Archive website crawl. Every circle is a different website, and every line represents a link that was followed between websites. The size of the circle represents how many pages were visited from that site, and the width of the line represents the number of links followed.
Wykres przedstawiający niewielką część indeksowania . Każde kółko to inna strona internetowa, a każda linia reprezentuje link, który został użyty między stronami. Rozmiar koła reprezentuje liczbę stron z tej witryny odwiedzonych, a szerokość linii oznacza liczbę klikniętych linków. Crawls UKWA: jedna godzina w jednej minucie

Przeszukiwanie jest archiwizowane we wspólnej infrastrukturze zwanej Systemem Bibliotek Cyfrowych . Członkowie społeczeństwa mogą zgłaszać miejsca do ochrony za pośrednictwem strony internetowej UKWA . Całe archiwum internetowe jest dostępne dla zarejestrowanych czytelników na terenie biblioteki; a tam, gdzie udzielono pozwolenia lub można spełnić warunki licencji, kopie są również dostępne za pośrednictwem strony internetowej.

Archiwum gromadzi strony w odpowiedzi na wydarzenia, budując kolekcje - między innymi zachowały się pisma i obrazy rejestrujące klęski żywiołowe , kampanie wyborcze od 2005 roku oraz brytyjską blogosferę do celów badawczych.

ŚWIECIĆ

A graph showing the percentage of the dataset which the phrases "millenium bug" or "y2k issue" occur in, between the years of 1996 and 2013. Both trends rise to a maximum in 1999, followed by a decline, following much the same shape.
Wykres SHINE pokazujący, jak często różne frazy dla „ problem roku 2000 ” pojawiają się w latach 1996-2013 na zarchiwizowanych stronach .uk.

UK Web Archive zawiera zbiór wszystkich stron internetowych .uk , które zostały zarchiwizowane przez Internet Archive do końca marca 2013 roku. SHINE to interfejs sieciowy , za pomocą którego można tworzyć powtarzalne listy wyników historycznych stron .uk. Trendy lub wystąpienia słów kluczowych w zbiorze danych na stronach .uk w tym czasie wykorzystują zgodność , aby pokazać słowa kluczowe w kontekście.

Pamiątki

Memento to nazwa wcześniejszych wersji stron internetowych stworzonych przez Memento Project . Interfejs UK Web Archive Memento umożliwia znajdowanie pamiątek w archiwach internetowych . Interfejsu można użyć do znalezienia Memento według daty w tabeli migawek lub sprawdzenia, jak często witryna pojawia się w publicznych archiwach internetowych.

Badanie archiwum

Badania nad siecią jako odbiciem społeczeństwa pomogły w rozwoju dostępu do archiwum. Biblioteki opracowały przewodniki dotyczące umiejętności badawczych potrzebnych do korzystania z archiwów internetowych. Obejmują one wykorzystywanie dużych zbiorów danych do obserwowania wzorców lub trendów lub pisanie cytatów do zarchiwizowanych kopii stron internetowych.

Stół warsztatowy GLAM

GLAM Workbench to projekt, który bada, w jaki sposób badacze mogą wykorzystywać dane przechowywane przez galerie, biblioteki, archiwa i muzea. Zawiera kolekcję notatników Jupyter , które korzystają z Mementos i danych indeksowych. Notatniki łączą opis i edytowalny kod, aby pomóc naukowcom znaleźć dowody w archiwach internetowych.

Gdzie można uzyskać dostęp do całego archiwum, według Biblioteki
Biblioteki Bodleiańskie Biblioteka brytyjska Biblioteki Uniwersytetu Cambridge Biblioteka Narodowa Szkocji Biblioteka Narodowa Walii Trinity College w Dublinie

Zobacz też

Linki zewnętrzne