Znawca semantyki
Rodzaj witryny |
Wyszukiwarka |
---|---|
Stworzone przez | Allena Instytut Sztucznej Inteligencji |
Adres URL | |
Wystrzelony | 2 listopada 2015 |
Semantic Scholar to oparte na sztucznej inteligencji narzędzie do badania literatury naukowej, opracowane w Allen Institute for AI i udostępnione publicznie w listopadzie 2015 r. Wykorzystuje ono postępy w przetwarzaniu języka naturalnego do dostarczania streszczeń artykułów naukowych. Zespół Semantic Scholar aktywnie bada wykorzystanie sztucznej inteligencji w przetwarzaniu języka naturalnego , uczeniu maszynowym , interakcji człowiek-komputer i wyszukiwaniu informacji .
Semantic Scholar powstał jako baza danych obejmująca tematy z zakresu informatyki , nauk o Ziemi i neuronauki . Jednak w 2017 roku system zaczął włączać literaturę biomedyczną . Według stanu na wrzesień 2022 r. obejmują one obecnie ponad 200 mln publikacji ze wszystkich dziedzin nauki.
Technologia
Semantic Scholar zawiera jednozdaniowe podsumowanie literatury naukowej . Jednym z jego celów było sprostanie wyzwaniu, jakim jest czytanie wielu tytułów i obszernych streszczeń na urządzeniach mobilnych. Ma również na celu zapewnienie, że trzy miliony artykułów naukowych publikowanych rocznie docierają do czytelników, ponieważ szacuje się, że tylko połowa tej literatury jest kiedykolwiek czytana.
Sztuczna inteligencja jest wykorzystywana do uchwycenia istoty dokumentu, generując go za pomocą „abstrakcyjnej” techniki. Projekt wykorzystuje połączenie uczenia maszynowego , przetwarzania języka naturalnego i widzenia maszynowego , aby dodać warstwę analizy semantycznej do tradycyjnych metod analizy cytowań oraz wyodrębnić odpowiednie liczby, tabele , podmioty i miejsca z artykułów.
W przeciwieństwie do Google Scholar i PubMed , Semantic Scholar ma na celu podkreślenie najważniejszych i najbardziej wpływowych elementów artykułu. Technologia sztucznej inteligencji ma za zadanie identyfikować ukryte powiązania i powiązania między tematami badawczymi. Podobnie jak poprzednio cytowane wyszukiwarki, Semantic Scholar również wykorzystuje struktury grafowe, które obejmują Microsoft Academic Knowledge Graph , Springer Nature's SciGraph i Semantic Scholar Corpus.
Każda praca hostowana przez Semantic Scholar ma przypisany unikalny identyfikator o nazwie Semantic Scholar Corpus ID (w skrócie S2CID). Poniższy wpis jest przykładem:
Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (marzec 2020). „Liczba reprodukcyjna COVID-19 jest wyższa w porównaniu z koronawirusem SARS”. Dziennik Medycyny Podróży . 27 (2). doi : 10.1093/jtm/taaa021 . PMID 32052846 . S2CID 211099356 .
Semantic Scholar jest darmowy iw przeciwieństwie do podobnych wyszukiwarek (np. Google Scholar ) nie wyszukuje materiałów, które są za paywallem .
W jednym badaniu porównano możliwości wyszukiwania Semantic Scholar poprzez systematyczne podejście i stwierdzono, że wyszukiwarka ma 98,88% dokładności podczas próby odkrycia danych. W tym samym badaniu zbadano inne funkcje Semantic Scholar, w tym narzędzia do badania metadanych , a także kilka narzędzi do cytowania.
Liczba użytkowników i publikacji
Od stycznia 2018 r., po projekcie z 2017 r., który dodał artykuły biomedyczne i streszczenia tematów, korpus Semantic Scholar obejmował ponad 40 milionów artykułów z informatyki i biomedycyny . W marcu 2018 roku Doug Raymond, który opracował uczenia maszynowego dla platformy Amazon Alexa , został zatrudniony do kierowania projektem Semantic Scholar. Od sierpnia 2019 r. liczba metadanych dołączonych dokumentów (nie rzeczywistych plików PDF) wzrosła do ponad 173 milionów po dodaniu Microsoft Academic Graph dokumentacja. W 2020 roku partnerstwo między Semantic Scholar i University of Chicago Press Journals udostępniło wszystkie artykuły publikowane w ramach University of Chicago Press w korpusie Semantic Scholar. Pod koniec 2020 roku Semantic Scholar zindeksował 190 milionów artykułów.
W 2020 roku użytkownicy Semantic Scholar osiągnęli siedem milionów miesięcznie.
Zobacz też
- Analiza cytowań - Badanie częstotliwości, wzorców i wykresów cytowań w dokumentach
- Indeks cytowań – Indeks cytowań między publikacjami
- Ekstrakcja wiedzy – tworzenie wiedzy ze źródeł ustrukturyzowanych i nieustrukturyzowanych
- Lista akademickich baz danych i wyszukiwarek
- Naukometria - nauka o mierzeniu i analizowaniu nauki, technologii i innowacji