System danych astrofizycznych
Producent | Smithsonian Astrophysical Observatory dla National Aeronautics and Space Administration (Stany Zjednoczone) |
---|---|
Historia | 1992 do chwili obecnej |
Dostęp | |
Koszt | Bezpłatny |
Zasięg | |
Dyscypliny | Astronomia i fizyka |
Rekordowa głębokość | Indeks i streszczenie i pełny tekst |
Pokrycie geoprzestrzenne | Na całym świecie |
Spinki do mankietów | |
Strona internetowa |
SAO /NASA Astrophysics Data System ( ADS ) to internetowa baza danych zawierająca ponad 16 milionów artykułów z dziedziny astronomii i fizyki , pochodzących zarówno ze źródeł recenzowanych , jak i nie recenzowanych. Abstrakty są dostępne bezpłatnie online dla prawie wszystkich artykułów, a pełne zeskanowane artykuły są dostępne w formacie Graphics Interchange Format (GIF) i Portable Document Format (PDF) dla starszych artykułów. Został opracowany przez National Aeronautics and Space Administration (NASA) i jest zarządzany przez Smithsonian Astrophysical Observatory .
ADS jest potężnym narzędziem badawczym i ma znaczący wpływ na efektywność badań astronomicznych od czasu jego uruchomienia w 1992 roku. Wyszukiwanie literatury, które wcześniej zajmowałoby dni lub tygodnie, można teraz przeprowadzić w kilka sekund za pomocą wyszukiwarki ADS, która jest zbudowany na zamówienie dla potrzeb astronomicznych. Badania wykazały, że korzyści z ADS dla astronomii są równe kilkuset milionom dolarów rocznie, a szacuje się, że system potroił liczbę czytelników czasopism astronomicznych.
Korzystanie z ADS jest niemal powszechne wśród astronomów na całym świecie, dlatego statystyki użytkowania ADS można wykorzystać do analizy światowych trendów w badaniach astronomicznych. Badania te ujawniły, że ilość badań prowadzonych przez astronoma jest związana z produktem krajowym brutto (PKB) na mieszkańca kraju, w którym się znajduje, oraz że liczba astronomów w kraju jest proporcjonalna do PKB tego kraju, więc całkowita ilość badań przeprowadzonych w danym kraju jest proporcjonalna do kwadratu jego PKB podzielonego przez liczbę ludności.
Historia
Przez wiele lat narastającym problemem w badaniach astronomicznych (podobnie jak w innych dyscyplinach akademickich) był stały wzrost liczby artykułów publikowanych w głównych czasopismach astronomicznych, co oznaczało, że astronomowie mogli czytać coraz mniej najnowszych wyników badań. W latach 80. astronomowie zauważyli, że rodzące się technologie, które stanowiły podstawę Internetu, można ostatecznie wykorzystać do zbudowania elektronicznego systemu indeksowania astronomicznych prac naukowych, który pozwoliłby astronomom być na bieżąco ze znacznie szerszym zakresem badań.
Pierwsza propozycja bazy danych abstraktów artykułów z czasopism pojawiła się na konferencji poświęconej astronomii z dużych baz danych, która odbyła się w Garching bei München w 1987 r. Początkowy rozwój elektronicznego systemu dostępu do abstraktów astrofizycznych miał miejsce w ciągu następnych dwóch lat; w 1991 roku toczyły się dyskusje nad tym, jak zintegrować ADS z SIMBAD , zawierającą wszystkie dostępne oznaczenia katalogowe dla obiektów spoza Układu Słonecznego , aby stworzyć system, w którym astronomowie mogliby wyszukiwać wszystkie prace napisane na temat danego obiektu.
Wstępna wersja ADS, z bazą danych składającą się z 40 artykułów, powstała jako dowód słuszności koncepcji w 1988 roku, a latem 1993 roku pomyślnie połączono bazę danych ADS z bazą SIMBAD. Twórcy sądzili, że było to pierwsze użycie Internet, aby umożliwić jednoczesne przeszukiwanie transatlantyckich naukowych baz danych. Do 1994 roku usługa była dostępna za pośrednictwem zastrzeżonego oprogramowania sieciowego, ale została przeniesiona do rodzącej się sieci World Wide Web na początku tego roku. Liczba użytkowników usługi wzrosła czterokrotnie w ciągu pięciu tygodni od wprowadzenia usługi internetowej ADS.
Początkowo artykuły z czasopism dostępne za pośrednictwem ADS były zeskanowanymi mapami bitowymi utworzonymi z czasopism papierowych, ale od 1995 r. Astrophysical Journal zaczął publikować wydanie on-line, a wkrótce potem inne główne czasopisma, takie jak Astronomy i Astrophysics oraz Monthly Zawiadomienia Królewskiego Towarzystwa Astronomicznego . ADS udostępniało linki do tych wydań elektronicznych od ich pierwszego pojawienia się. Od około 1995 roku liczba użytkowników ADS podwaja się mniej więcej co dwa lata. ADS ma teraz umowy z prawie wszystkimi czasopismami astronomicznymi, które dostarczają streszczenia. Zeskanowane artykuły z początku XIX wieku są dostępne za pośrednictwem serwisu, który zawiera obecnie ponad osiem milionów dokumentów. Usługa jest dystrybuowana na całym świecie, z dwunastoma witrynami lustrzanymi w dwunastu krajach na pięciu kontynentach, z bazą danych synchronizowaną za pomocą cotygodniowych aktualizacji za pomocą rsync , narzędzia do tworzenia kopii lustrzanych, które umożliwia aktualizacje tylko tych części bazy danych, które uległy zmianie. Wszystkie aktualizacje są uruchamiane centralnie, ale inicjują skrypty w witrynach lustrzanych, które „ściągają” zaktualizowane dane z głównych serwerów ADS.
Dane w systemie
Artykuły są indeksowane w bazie danych według ich rekordu bibliograficznego, zawierającego szczegółowe informacje o czasopiśmie, w którym zostały opublikowane, oraz różne powiązane metadane , takie jak listy autorów, odniesienia i cytaty . Pierwotnie dane te były przechowywane w ASCII , ale ostatecznie ograniczenia tego skłoniły opiekunów baz danych do migracji wszystkich rekordów do formatu XML (Extensible Markup Language) w 2000 r. Rekordy bibliograficzne są teraz przechowywane jako element XML, z elementami podrzędnymi dla różne metadane.
Od czasu pojawienia się internetowych wydań czasopism, streszczenia są ładowane do ADS w dniu lub przed datą publikacji artykułów, a pełny tekst czasopisma jest dostępny dla subskrybentów. Starsze artykuły zostały zeskanowane, a streszczenie zostało utworzone za pomocą do optycznego rozpoznawania znaków . Zeskanowane artykuły sprzed około 1995 roku są zwykle dostępne bezpłatnie, po uzgodnieniu z wydawcami czasopism.
Zeskanowane artykuły są przechowywane w formacie TIFF , zarówno w średniej, jak i wysokiej rozdzielczości . Pliki TIFF są konwertowane na żądanie na pliki GIF do wyświetlania na ekranie oraz PDF lub PostScript do drukowania. Wygenerowane pliki są następnie zapisywane w pamięci podręcznej , aby wyeliminować niepotrzebnie częste regeneracje popularnych artykułów. Od 2000 r. ADS zawierał 250 GB skanów, na które składało się 1 128 955 stron artykułów zawierających 138 789 artykułów. Do 2005 r. liczba ta wzrosła do 650 GB i oczekuje się dalszego wzrostu do około 900 GB do 2007 r. Nie opublikowano żadnych dalszych informacji.
Baza danych początkowo zawierała tylko odniesienia astronomiczne, ale teraz rozrosła się do trzech baz danych, obejmujących odniesienia astronomiczne (w tym nauki planetarne i fizykę Słońca), odniesienia fizyczne (w tym oprzyrządowanie i nauki o Ziemi), a także przedruki artykułów naukowych z arXiv . Astronomiczna baza danych jest zdecydowanie najbardziej zaawansowana, a jej wykorzystanie odpowiada za około 85% całkowitego wykorzystania ADS. Artykuły są przypisywane do różnych baz danych według tematu, a nie czasopisma, w którym są publikowane, tak więc artykuły z dowolnego czasopisma mogą pojawiać się we wszystkich trzech tematycznych bazach danych. Separacja baz danych umożliwia dopasowanie wyszukiwania w każdej dyscyplinie, dzięki czemu słowom można automatycznie przypisywać różne funkcje wagi w różnych wyszukiwaniach w bazach danych, w zależności od tego, jak często występują w danej dziedzinie.
Dane w archiwum przedruków są codziennie aktualizowane z arXiv , głównego repozytorium przedruków z fizyki i astronomii. Pojawienie się serwerów preprint, podobnie jak ADS, miało znaczący wpływ na tempo badań astronomicznych, ponieważ artykuły są często udostępniane z serwerów preprint na tygodnie lub miesiące przed ich publikacją w czasopismach. Włączenie preprintów z arXiv do ADS oznacza, że wyszukiwarka może zwrócić najbardziej aktualne dostępne badania, z zastrzeżeniem, że preprinty mogły nie być recenzowane lub sprawdzane zgodnie z wymaganym standardem publikacji w głównych czasopismach. Tam, gdzie jest to możliwe, baza danych ADS łączy preprinty z później publikowanymi artykułami, dzięki czemu wyszukiwanie cytowań i odniesień zwróci linki do artykułu w czasopiśmie, w którym cytowano preprint.
Oprogramowanie i sprzęt
Oprogramowanie działa w systemie, który został napisany specjalnie dla niego, co pozwala na szerokie dostosowanie do potrzeb astronomicznych, co nie byłoby możliwe w przypadku oprogramowania bazodanowego ogólnego przeznaczenia. Skrypty zostały zaprojektowane tak, aby były jak najbardziej niezależne od platformy , biorąc pod uwagę potrzebę ułatwienia tworzenia kopii lustrzanych w różnych systemach na całym świecie, chociaż rosnące wykorzystanie Linuksa jako systemu operacyjnego z wyboru w astronomii doprowadziło do coraz większej optymalizacji skryptów pod kątem instalacji na ta platforma.
Główny serwer ADS znajduje się w Centrum Astrofizyki | Harvard & Smithsonian w Cambridge, Massachusetts , i jest podwójnym 64-bitowym serwerem Intel X86 z dwoma czterordzeniowymi procesorami 3,0 GHz i 32 GB pamięci RAM , z dystrybucją CentOS 5.4 Linux . Lustra znajdują się w Brazylii, Chinach, Chile, Francji, Niemczech, Indiach, Indonezji, Japonii, Rosji, Korei Południowej, Wielkiej Brytanii i na Ukrainie.
Indeksowanie
Obecnie ADS otrzymuje streszczenia lub spisy treści z prawie dwustu czasopism. Serwis może otrzymywać dane dotyczące tego samego artykułu z wielu źródeł i tworzy jedno odniesienie bibliograficzne na podstawie najdokładniejszych danych z każdego źródła. Powszechne stosowanie TeX- a i LaTeX- a przez prawie wszystkie czasopisma naukowe znacznie ułatwia włączanie danych bibliograficznych do systemu w znormalizowanym formacie, a import artykułów internetowych zakodowanych w HTML jest również prosty. ADS wykorzystuje skrypty Python i Perl do importowania, przetwarzania i standaryzacji danych bibliograficznych.
Pozornie prozaiczne zadanie przekształcenia nazwiska autora w standardowy format Nazwisko , Początkowy format jest w rzeczywistości jednym z trudniejszych do zautomatyzowania ze względu na szeroką gamę konwencji nazewnictwa na całym świecie i możliwość, że imię takie jak Davis może być pierwszym imię , drugie imię lub nazwisko. Dokładna konwersja nazwisk wymaga szczegółowej znajomości nazwisk autorów zajmujących się astronomią, a ADS prowadzi obszerną bazę nazwisk autorów, która jest również wykorzystywana do przeszukiwania bazy danych (patrz poniżej).
W przypadku artykułów elektronicznych łatwo wyodrębnić listę odniesień podaną na końcu artykułu. W przypadku zeskanowanych artykułów ekstrakcja referencji opiera się na OCR. Referencyjną bazę danych można następnie „odwrócić”, aby wyświetlić listę cytowań dla każdego artykułu w bazie danych. Listy cytowań były używane w przeszłości do identyfikowania popularnych artykułów, których brakuje w bazie danych; w większości pochodziły one sprzed 1975 roku i zostały teraz dodane do systemu.
Zasięg
Baza danych zawiera obecnie ponad osiem milionów artykułów. W przypadku głównych czasopism astronomicznych ( Astrophysical Journal , Astronomical Journal , Astronomy and Astrophysics , Publications of the Astronomical Society of the Pacific i Monthly Notices of the Royal Astronomical Society ) pokrycie jest kompletne, a wszystkie numery są indeksowane od numeru 1 do teraz. Te czasopisma stanowią około dwóch trzecich artykułów w bazie danych, a reszta składa się z artykułów opublikowanych w ponad 100 innych czasopismach z całego świata, a także w materiałach konferencyjnych.
Chociaż baza danych zawiera pełną zawartość wszystkich głównych czasopism, a także wielu mniejszych, jej zakres odniesień i cytowań jest znacznie mniej kompletny. Odnośniki i cytaty artykułów w głównych czasopismach są dość kompletne, ale odniesienia takie jak „komunikacja prywatna”, „w druku” lub „w przygotowaniu” nie mogą być dopasowane, a błędy autorów w wykazach odnośników również wprowadzają potencjalne błędy. Artykuły astronomiczne mogą cytować i być cytowane przez artykuły w czasopismach, które wykraczają poza zakres ADS, takich jak czasopisma chemiczne , matematyczne lub biologiczne .
Wyszukiwarka
Od samego początku ADS opracował wysoce złożoną wyszukiwarkę do przeszukiwania baz danych abstraktów i obiektów. Wyszukiwarka jest dostosowana do wyszukiwania abstraktów astronomicznych, a silnik i jego interfejs użytkownika zakładają, że użytkownik jest dobrze zorientowany w astronomii i jest w stanie zinterpretować wyniki wyszukiwania, które mają na celu zwrócenie czegoś więcej niż tylko najbardziej odpowiednich artykułów. Bazę danych można przeszukiwać pod kątem nazwisk autorów, obiektów astronomicznych , słów tytułowych i słów w tekście streszczenia, a wyniki można filtrować według wielu kryteriów. Działa poprzez gromadzenie synonimów i upraszczanie wyszukiwanych terminów, jak opisano powyżej, a następnie generowanie „pliku odwróconego”, który jest listą wszystkich dokumentów pasujących do każdego wyszukiwanego terminu. Wybrana przez użytkownika logika i filtry są następnie stosowane do tej odwróconej listy w celu wygenerowania ostatecznych wyników wyszukiwania.
Zapytania o nazwisko autora
System indeksuje nazwiska autorów według nazwiska i inicjałów oraz uwzględnia możliwe różnice w pisowni nazwisk za pomocą listy odmian. Jest to powszechne w przypadku nazw zawierających akcenty, takie jak umlauty i transliteracje z alfabetu arabskiego lub cyrylicy . Przykład wpisu na liście synonimów autora to:
- AFANASJEV, V
- AFANAS'EV, V
- AFANAS'IEV, V
- AFANASEV, V
- AFANASYEV, V
- AFANS'IEV, V
- AFANSEV, V
Wyszukiwanie nazw obiektów
Możliwość wyszukiwania artykułów na temat określonych obiektów astronomicznych jest jednym z najpotężniejszych narzędzi ADS. System wykorzystuje dane z SIMBAD , Extragalactic Database NASA/IPAC , International Astronomical Union Circulars oraz Lunar and Planetary Institute do identyfikowania dokumentów odnoszących się do danego obiektu, a także może wyszukiwać według pozycji obiektu, wymieniając dokumenty dotyczące obiektów w obrębie Promień 10 minut łuku dla danego rektascensji i deklinacji . Te bazy danych łączą wiele oznaczeń katalogowych, jakie może mieć obiekt, tak więc wyszukiwanie Plejad spowoduje również znalezienie artykułów, które wymieniają słynną gromadę otwartą w Byku pod dowolnymi innymi oznaczeniami katalogowymi lub popularnymi nazwami, takimi jak M45, Siedem Sióstr lub Melota 22.
Wyszukiwanie tytułów i abstraktów
Wyszukiwarka najpierw filtruje wyszukiwane hasła na kilka sposobów. M, po którym następuje spacja lub łącznik , usuwa spację lub łącznik, dzięki czemu wyszukiwanie obiektów katalogu Messiera jest uproszczone, a wprowadzenie przez użytkownika M45, M 45 lub M-45 skutkuje wykonaniem tego samego zapytania; podobnie NGC i popularne hasła wyszukiwania, takie jak Shoemaker Levy i T Tauri , są pozbawione spacji. Nieistotne słowa, takie jak AT, OR i TO, są usuwane, chociaż w niektórych przypadkach rozróżnialność wielkości liter , tak że podczas gdy nd jest ignorowane, A nd jest konwertowane na „ Andromedae ”, a H er na „ Herculis ”, ale jest ignorowana.
Zastąpienie synonimu
Po wstępnym przetworzeniu wyszukiwanych terminów baza danych jest przeszukiwana ze zmienionym wyszukiwanym terminem, a także jego synonimami. Oprócz prostego synonimów , takiego jak wyszukiwanie zarówno liczby mnogiej , jak i liczby pojedynczej , ADS wyszukuje również dużą liczbę konkretnie astronomicznych synonimów. Na przykład spektrograf i spektroskop mają zasadniczo to samo znaczenie, aw kontekście astronomicznym metaliczność i obfitość są również synonimami. Lista synonimów ADS została utworzona ręcznie, poprzez pogrupowanie listy słów w bazie danych według podobnych znaczeń.
Oprócz synonimów w języku angielskim , ADS wyszukuje również angielskie tłumaczenia wyszukiwanych terminów z zagranicy i odwrotnie, dzięki czemu wyszukiwanie francuskiego słowa soleil powoduje odniesienie do Sun , a artykuły w językach innych niż angielski mogą zostać zwrócone według wyszukiwanych haseł w języku angielskim.
można było wyszukać rzadki termin, który jest synonimem znacznie bardziej powszechnego terminu (takiego jak „ linia daty ” zamiast „ data ”).
Logika wyboru
Wyszukiwarka umożliwia logikę wyboru zarówno w obrębie pól, jak i pomiędzy polami. Wyszukiwane hasła w każdym polu można łączyć za pomocą OR, AND, prostej logiki lub logiki boolowskiej , a użytkownik może określić, które pola muszą być dopasowane w wynikach wyszukiwania. Pozwala to na tworzenie złożonych wyszukiwań; na przykład użytkownik może wyszukiwać artykuły dotyczące NGC 6543 LUB NGC 7009 , których tytuły zawierają (promień LUB prędkość) I NIE (obfitość LUB temperatura).
Filtrowanie wyników
Wyniki wyszukiwania można filtrować według wielu kryteriów, w tym zakresu lat, takich jak „1945 do 1975”, „2000 do dnia dzisiejszego” lub „przed 1900”, a także rodzaju czasopisma, w którym pojawia się artykuł – nie - recenzowane artykuły, takie jak materiały konferencyjne , mogą zostać wykluczone lub specjalnie wyszukane, lub określone czasopisma mogą zostać włączone lub wyłączone z wyszukiwania.
Wyniki wyszukiwania
Chociaż został pomyślany jako sposób uzyskiwania dostępu do streszczeń i artykułów, ADS zapewnia znaczną ilość informacji pomocniczych wraz z wynikami wyszukiwania. Dla każdego przesłanego streszczenia podane są łącza do innych artykułów w bazie danych, do których się odwołuje i które cytują ten artykuł, oraz łącze do przedruku, jeśli taki istnieje. System generuje również odnośniki do artykułów „również przeczytanych” – czyli tych, które były najczęściej odwiedzane przez osoby czytające artykuł. W ten sposób użytkownik ADS może określić, które artykuły najbardziej interesują astronomów zainteresowanych tematyką danego artykułu.
Zwracane są również łącza do baz nazw obiektów SIMBAD i/lub NASA Extragalactic Database, dzięki którym użytkownik może szybko znaleźć podstawowe dane obserwacyjne dotyczące obiektów analizowanych w artykule i znaleźć dalsze artykuły na temat tych obiektów.
Wpływ na astronomię
ADS jest prawie powszechnie używany jako narzędzie badawcze wśród astronomów i istnieje kilka badań, w których oszacowano ilościowo, o ile bardziej wydajny ADS uczynił astronomię; jeden oszacował, że ADS zwiększył efektywność badań astronomicznych o 333 pełnoetatowe lata badawcze rocznie, a inny stwierdził, że w 2002 r. jego efekt był równoważny 736 pełnoetatowym naukowcom lub wszystkim badaniom astronomicznym prowadzonym we Francji. ADS umożliwił przeszukiwanie literatury, które wcześniej zajęłoby kilka dni lub tygodni, w ciągu kilku sekund, i szacuje się, że ADS zwiększył czytelnictwo i wykorzystanie literatury astronomicznej około trzykrotnie od czasu jego powstania.
W kategoriach pieniężnych ten wzrost wydajności stanowi znaczną kwotę. Na całym świecie jest około 12 000 aktywnych naukowców zajmujących się astronomią, więc ADS odpowiada około 5% populacji astronomów pracujących. Globalny budżet badań astronomicznych szacuje się na 4000-5000 mln USD, więc wartość ADS dla astronomii wyniosłaby około 200-250 mln USD rocznie. Jego budżet operacyjny stanowi niewielki ułamek tej kwoty.
Wielkie znaczenie ADS dla astronomów zostało docenione przez Organizację Narodów Zjednoczonych , której Zgromadzenie Ogólne pochwaliło ADS za jej pracę i sukcesy, zwracając szczególną uwagę na jej znaczenie dla astronomów w krajach rozwijających się, w raportach Komitetu ONZ ds. Zastosowania przestrzeni kosmicznej . Tymczasem raport z 2002 roku sporządzony przez komitet wizytujący Centrum Astrofizyki stwierdził, że usługa ta „zrewolucjonizowała korzystanie z literatury astronomicznej” i była „prawdopodobnie najcenniejszym pojedynczym wkładem w badania astronomiczne, jaki CfA wniosła w swoim życiu ".
Badania socjologiczne z wykorzystaniem ADS
Ponieważ jest używany prawie powszechnie przez astronomów, ADS może ujawnić wiele informacji na temat dystrybucji badań astronomicznych na całym świecie. Większość użytkowników uzyskuje dostęp do systemu z uczelni wyższych, których adres IP można łatwo wykorzystać do określenia położenia geograficznego użytkownika. Badania pokazują, że najwięcej użytkowników ADS w przeliczeniu na mieszkańca mają astronomowie z Francji i Holandii, a podczas gdy kraje bardziej rozwinięte (mierzone PKB na mieszkańca ) korzystają z systemu częściej niż kraje słabiej rozwinięte; związek między PKB per capita a wykorzystaniem ADS nie jest liniowy. Zakres wykorzystania ADS na mieszkańca znacznie przekracza zakres PKB na mieszkańca, a badania podstawowe przeprowadzone w danym kraju, mierzone wykorzystaniem ADS, okazały się proporcjonalne do kwadratu PKB kraju podzielonego przez liczbę ludności.
Statystyki wykorzystania ADS sugerują również, że astronomowie w krajach bardziej rozwiniętych są zwykle bardziej produktywni niż astronomowie w krajach mniej rozwiniętych. Ilość przeprowadzanych badań podstawowych jest proporcjonalna do liczby astronomów w danym kraju pomnożonej przez PKB per capita. Statystyki wskazują również, że astronomowie w kulturach europejskich przeprowadzają około trzy razy więcej badań niż w kulturach azjatyckich , co być może sugeruje różnice kulturowe w znaczeniu, jakie przywiązuje się do badań astronomicznych.
ADS został również wykorzystany do wykazania, że od 1975 roku odsetek prac astronomicznych jednego autora znacznie się zmniejszył, a prace astronomiczne z ponad 50 autorami stały się bardziej powszechne od 1990 roku.
Zobacz też
- Lista akademickich baz danych i wyszukiwarek
- Bibcode
- INSPIRE-HEP
- Pozagalaktyczna baza danych NASA / IPAC (NED)
- Planetarny system danych NASA (PDS)
- PubMed
- SIMBAD
- Michaela J. Kurtza
Linki zewnętrzne
- Oficjalna strona internetowa
- NASA ADS: Query Form – tutaj rozpocznij wyszukiwanie artykułów.
- strony pomocy ADS