Otwórz dane
Otwarte dane to dane , które są powszechnie dostępne, wykorzystywane, edytowalne i udostępniane przez kogokolwiek w dowolnym celu. Otwarte dane są licencjonowane w ramach otwartej licencji .
Cele ruchu otwartych danych są podobne do innych ruchów „open(-source)”, takich jak oprogramowanie open-source, sprzęt , otwarta treść , otwarte specyfikacje , otwarta edukacja , otwarte zasoby edukacyjne , otwarty rząd , otwarta wiedza , otwarte dostęp , otwarta nauka i otwarta sieć. Wzrostowi ruchu otwartych danych towarzyszy wzrost praw własności intelektualnej. Filozofia otwartych danych jest od dawna ugruntowana (np Mertonowska tradycja naukowa ), ale termin „otwarte dane” sam w sobie jest nowy i zyskuje na popularności wraz z rozwojem Internetu i sieci WWW , a zwłaszcza wraz z uruchomieniem rządowych inicjatyw otwartych danych Data.gov , Data.gov. uk i Data.gov.in. _
Otwarte dane mogą być danymi powiązanymi – określanymi jako połączone otwarte dane .
Jedną z najważniejszych form otwartych danych są otwarte dane rządowe (OGD), czyli forma otwartych danych tworzonych przez rządzące instytucje rządowe. Znaczenie otwartych danych rządowych wynika z tego, że są one częścią codziennego życia obywateli, aż do najbardziej rutynowych/przyziemnych zadań, które pozornie są dalekie od spraw rządowych.
Skrót FAIR/O data jest czasami używany do wskazania, że dany zbiór danych lub baza danych jest zgodna z zasadami danych FAIR i posiada wyraźną otwartą licencję na dane .
Przegląd
Koncepcja otwartych danych nie jest nowa, ale sformalizowana definicja jest stosunkowo nowa. Otwarte dane jako zjawisko oznaczają, że dane rządowe powinny być dostępne dla każdego, z możliwością redystrybucji w dowolnej formie bez ograniczeń praw autorskich. Jeszcze jedną definicją jest otwarta definicja, którą można podsumować w następujący sposób: „fragment danych jest otwarty, jeśli każdy może go używać, ponownie wykorzystywać i redystrybuować – co najwyżej podlega jedynie wymogowi przypisania i/lub udostępniania na tych samych zasadach. " Inne definicje, w tym Open Data Institute „otwarte dane to dane, do których każdy może uzyskać dostęp, z nich korzystać lub je udostępniać”, mają przystępną krótką wersję definicji, ale odnoszą się do definicji formalnej. Otwarte dane mogą obejmować materiały nietekstowe, takie jak mapy , genomy , konektomy , związki chemiczne , wzory matematyczne i naukowe, dane medyczne i praktyki, nauki biologiczne i różnorodność biologiczna.
Główną barierą dla ruchu otwartych danych jest komercyjna wartość danych. Dostęp do danych lub ich ponowne wykorzystanie jest często kontrolowane przez organizacje publiczne lub prywatne. Kontrola może odbywać się poprzez ograniczenia dostępu, licencje , prawa autorskie , patenty i opłaty za dostęp lub ponowne wykorzystanie. Zwolennicy otwartych danych argumentują, że ograniczenia te szkodzą dobru wspólnemu i że dane powinny być dostępne bez ograniczeń i opłat.
Twórcy danych nie uwzględniają konieczności określania warunków własności, licencjonowania i ponownego wykorzystywania; zamiast tego zakładając, że brak dochodzenia praw autorskich powoduje, że dane stają się własnością publiczną . Na przykład wielu naukowców nie uważa danych opublikowanych wraz z ich pracą za ich kontrolę i uważa akt publikacji w czasopiśmie za dorozumiane udostępnienie danych do wspólnego użytku . Brak licencji utrudnia określenie statusu zbioru danych i może ograniczyć wykorzystanie danych oferowanych w duchu „otwartości”. Z powodu tej niepewności organizacje publiczne lub prywatne mogą agregować te dane, twierdzić, że są one chronione prawem autorskim, a następnie odsprzedawać je.
Kwestia wiedzy tubylczej (IK) stanowi duże wyzwanie w zakresie pozyskiwania, przechowywania i dystrybucji. Wiele społeczeństw w krajach trzeciego świata nie posiada technicznych procesów zarządzania IK.
W swojej prezentacji na konferencji XML 2005 Connolly przedstawił te dwa cytaty dotyczące otwartych danych:
- „Chcę z powrotem moje dane”. (Jon Bosak około 1997) [ potrzebne źródło ]
- „Od dawna wierzyłem, że klienci dowolnej aplikacji są właścicielami danych, które do niej wprowadzają”. (Ten cytat odnosi się do własnych danych dotyczących tętna Veena).
Główne źródła
Otwarte dane mogą pochodzić z dowolnego źródła. W tej sekcji wymieniono niektóre pola, które publikują (lub przynajmniej omawiają publikowanie) dużą ilość otwartych danych.
W nauce
Koncepcja otwartego dostępu do danych naukowych powstała wraz z utworzeniem systemu World Data Center , w ramach przygotowań do Międzynarodowego Roku Geofizycznego 1957–1958. Międzynarodowa Rada Związków Naukowych (obecnie Międzynarodowa Rada Nauki ) nadzoruje kilka Światowych Centrów Danych, których misją jest minimalizowanie ryzyka utraty danych i maksymalizacja dostępności danych.
Podczas gdy ruch danych otwartej nauki znacznie wyprzedził Internet, dostępność szybkich, łatwo dostępnych sieci znacznie zmieniła kontekst danych otwartej nauki , ponieważ publikowanie lub uzyskiwanie danych stało się znacznie mniej kosztowne i czasochłonne.
Human Genome Project był główną inicjatywą, która była przykładem potęgi otwartych danych. Został zbudowany na tak zwanych zasadach bermudzkich , stanowiących, że: „Wszystkie informacje o sekwencji ludzkiego genomu… powinny być ogólnodostępne i ogólnodostępne, aby zachęcać do badań i rozwoju oraz maksymalizować ich korzyści dla społeczeństwa”. Nowsze inicjatywy, takie jak Structural Genomics Consortium, pokazały, że podejście oparte na otwartych danych może być produktywnie wykorzystywane w kontekście przemysłowych badań i rozwoju.
W 2004 roku ministrowie nauki wszystkich krajów Organizacji Współpracy Gospodarczej i Rozwoju (OECD), do której należy większość rozwiniętych krajów świata, podpisali deklarację, zgodnie z którą wszystkie dane archiwalne finansowane ze środków publicznych powinny być udostępniane publicznie. Na prośbę i po intensywnej dyskusji z instytucjami wytwarzającymi dane w państwach członkowskich OECD opublikowała w 2007 r. Zasady i wytyczne OECD dotyczące dostępu do danych badawczych pochodzących z funduszy publicznych jako zalecenie miękkiego prawa .
Przykłady otwartych danych w nauce:
- data.uni-muenster.de – Otwarte dane o artefaktach naukowych z Uniwersytetu w Muenster w Niemczech. Rozpoczęty w 2011 roku.
- Dataverse Network Project – oprogramowanie repozytorium archiwalnego promujące udostępnianie danych , trwałe cytowanie danych i powtarzalne badania.
- linkedscience.org/data – Otwarte zbiory danych naukowych zakodowane jako Linked Data . Rozpoczęty w 2011 roku, zakończony w 2018 roku.
- systemanaturae.org – Otwarte naukowe zbiory danych dotyczące dzikiej przyrody sklasyfikowane według gatunków zwierząt. Uruchomiony w 2015 roku.
W rządzie
Istnieje szereg różnych argumentów przemawiających za otwartymi danymi rządowymi. Niektórzy zwolennicy twierdzą, że publiczne udostępnianie informacji rządowych jako otwartych danych do odczytu maszynowego może ułatwić rządową przejrzystość, odpowiedzialność i udział społeczeństwa. „Otwarte dane mogą być potężną siłą w zakresie odpowiedzialności publicznej – mogą sprawić, że istniejące informacje będą łatwiejsze do analizowania, przetwarzania i łączenia niż kiedykolwiek wcześniej, umożliwiając kontrolę publiczną na nowym poziomie”. Rządy, które umożliwiają publiczne przeglądanie danych, mogą pomóc obywatelom zaangażować się w sektory rządowe i „dodać wartość do tych danych”. Eksperci ds. otwartych danych zniuansowali wpływ, jaki otwarcie danych rządowych może mieć na przejrzystość i odpowiedzialność rządu. W szeroko cytowanym artykule uczeni David Robinson i Harlan Yu twierdzą, że rządy mogą tworzyć pozory przejrzystości, publikując dane do odczytu maszynowego, które w rzeczywistości nie czynią rządu bardziej przejrzystym ani odpowiedzialnym. Czerpiąc z wcześniejszych badań nad przejrzystością i przeciwdziałaniem korupcji, politolog Banku Światowego Tiago C. Peixoto rozszerzył argumentację Yu i Robinsona, podkreślając minimalny łańcuch zdarzeń niezbędnych do tego, aby otwarte dane doprowadziły do odpowiedzialności:
- ujawniono odpowiednie dane;
- dane są szeroko rozpowszechniane i rozumiane przez opinię publiczną;
- opinia publiczna reaguje na treść danych; I
- urzędnicy publiczni albo reagują na reakcję społeczeństwa, albo są sankcjonowani przez społeczeństwo za pomocą środków instytucjonalnych.
Niektórzy twierdzą, że otwarcie oficjalnych informacji może wspierać innowacje technologiczne i wzrost gospodarczy, umożliwiając stronom trzecim opracowywanie nowych rodzajów aplikacji i usług cyfrowych.
Kilka rządów krajowych stworzyło strony internetowe w celu rozpowszechniania części gromadzonych danych. Jest to koncepcja wspólnego projektu w samorządzie miejskim w celu stworzenia i zorganizowania kultury dla otwartych danych lub otwartych danych rządowych.
Ponadto inne szczeble rządowe utworzyły strony internetowe z otwartymi danymi. W Kanadzie istnieje wiele podmiotów rządowych zajmujących się Otwartymi Danymi . Data.gov wymienia strony łącznie 40 stanów USA oraz 46 miast i hrabstw USA, które zawierają strony internetowe udostępniające otwarte dane, np. stan Maryland , stan Kalifornia, USA i Nowy Jork .
Na poziomie międzynarodowym Organizacja Narodów Zjednoczonych posiada stronę internetową z otwartymi danymi, która publikuje dane statystyczne z państw członkowskich i agencji ONZ, a Bank Światowy opublikował szereg danych statystycznych dotyczących krajów rozwijających się. Komisja Europejska stworzyła dwa portale dla Unii Europejskiej : Portal Otwartych Danych UE który zapewnia dostęp do otwartych danych z instytucji, agencji i innych organów UE oraz Europejski Portal Danych, który udostępnia zbiory danych od lokalnych, regionalnych i krajowych organów publicznych w całej Europie. Oba portale zostały połączone w data.europa.eu 21 kwietnia 2021 r.
Włochy są pierwszym krajem, który udostępnił standardowe procesy i wytyczne na licencji Creative Commons do rozpowszechniania w administracji publicznej. Otwarty model nazywa się Open Data Management Cycle i został przyjęty w kilku regionach, takich jak Veneto i Umbria , główne miasta, takie jak Reggio Calabria i Genova , przyjęły ten model.
W październiku 2015 r. Open Government Partnership uruchomiło Międzynarodową Kartę Otwartych Danych , zestaw zasad i najlepszych praktyk w zakresie udostępniania rządowych otwartych danych, formalnie przyjętych przez siedemnaście rządów krajów, stanów i miast podczas Globalnego Szczytu OGP w Meksyku .
W organizacjach non-profit
Wiele organizacji non-profit oferuje otwarty dostęp do swoich danych, o ile nie narusza to praw do prywatności ich użytkowników, członków lub osób trzecich . W porównaniu do korporacji nastawionych na zysk , nie dążą do monetyzacji swoich danych. OpenNWT uruchomił serwis internetowy oferujący otwarte dane dotyczące wyborów. CIAT oferuje otwarte dane każdemu, kto chce przeprowadzić analizę dużych zbiorów danych w celu zwiększenia korzyści płynących z międzynarodowych badań rolniczych. DBLP , której właścicielem jest organizacja non-profit Dagstuhl , udostępnia swoją bazę publikacji naukowych z zakresu informatyki jako otwarte dane.
Usługi wymiany gościnności , w tym Bewelcome, Warm Showers i CouchSurfing (zanim stał się nastawiony na zysk), dały naukowcom dostęp do ich anonimowych danych w celu analizy, badań publicznych i publikacji.
Zasady i strategie
Na małym poziomie polityka i strategie firmy lub organizacji badawczej wobec otwartych danych będą się różnić, czasami znacznie. Jedną z powszechnie stosowanych strategii jest wykorzystanie danych wspólnych. Data commons to interoperacyjna platforma programowa i sprzętowa, która agreguje (lub kolokuje) dane, infrastrukturę danych oraz aplikacje do tworzenia i zarządzania danymi w celu lepszego umożliwienia społeczności użytkowników zarządzania, analizowania i udostępniania swoich danych innym osobom zarówno w krótkim, jak i długim horyzoncie czasowym. Idealnie byłoby, gdyby ta interoperacyjna cyberinfrastruktura była wystarczająco solidna „aby ułatwić przechodzenie między etapami cyklu życia zbioru” danych i zasobów informacyjnych, a jednocześnie nadal opierała się na wspólnych modelach danych i narzędziach obszaru roboczego umożliwiających i wspierających solidną analizę danych. Zasady i strategie leżące u podstaw danych wspólnych będą w idealnym przypadku obejmować wielu interesariuszy, w tym dostawcę usług wspólnych danych, dostawców danych i użytkowników danych.
Grossman i in. sugerują sześć głównych kwestii dotyczących strategii wspólnych danych, która lepiej umożliwia otwarte dane w przedsiębiorstwach i organizacjach badawczych. Taka strategia powinna uwzględniać potrzebę:
- stałe, trwałe identyfikatory cyfrowe, które umożliwiają kontrolę dostępu do zbiorów danych;
- trwałe, możliwe do wykrycia metadane powiązane z każdym identyfikatorem cyfrowym;
- interfejsie programowania aplikacji (API), powiązany z usługą uwierzytelniania i autoryzacji;
- przenośność danych;
- „peering” danych bez opłat za dostęp, wyjście i wejście; I
- racjonalne podejście do użytkowników przetwarzających dane na podstawie danych wspólnych.
Poza indywidualnymi firmami i ośrodkami badawczymi oraz na poziomie bardziej makro, kraje takie jak Niemcy uruchomiły własne oficjalne ogólnokrajowe strategie otwartych danych, szczegółowo określające, w jaki sposób systemy zarządzania danymi i wspólne dane powinny być rozwijane, wykorzystywane i utrzymywane dla większego dobra publicznego.
Argumenty za i przeciw
Otwarcie danych rządowych to tylko punkt na drodze do poprawy edukacji, usprawnienia administracji i budowania narzędzi do rozwiązywania innych rzeczywistych problemów. Chociaż wiele argumentów zostało przedstawionych kategorycznie [ potrzebne źródło ] , poniższe omówienie argumentów za i przeciw otwartym danym podkreśla, że argumenty te często zależą w dużym stopniu od rodzaju danych i ich potencjalnych zastosowań.
Argumenty wysuwane w imieniu otwartych danych obejmują:
- „Dane należą do rasy ludzkiej ”. Typowymi przykładami są genomy , dane dotyczące organizmów, nauki medyczne, dane dotyczące środowiska zgodnie z Konwencją z Aarhus .
- Pieniądze publiczne zostały wykorzystane do sfinansowania pracy, więc powinny być powszechnie dostępne.
- Został stworzony przez instytucję rządową lub w instytucji rządowej (jest to powszechne w amerykańskich laboratoriach narodowych i agencjach rządowych).
- Fakty nie mogą być prawnie chronione prawem autorskim.
- Sponsorzy badań nie otrzymują pełnej wartości, chyba że uzyskane dane są swobodnie dostępne.
- Ograniczenia dotyczące ponownego wykorzystywania danych tworzą antywspólnotę.
- Dane są niezbędne do sprawnego przebiegu wspólnych działań człowieka i są ważnym motorem rozwoju społeczno-gospodarczego (ochrona zdrowia, edukacja, produktywność gospodarcza itp.).
- W badaniach naukowych tempo odkryć przyspiesza lepszy dostęp do danych.
- Otwartość danych pomaga zwalczać „gnicie danych” i zapewnia zachowanie danych z badań naukowych w czasie.
- Znajomość statystyki korzysta z otwartych danych. Instruktorzy mogą korzystać z lokalnych zestawów danych, aby uczyć swoich uczniów koncepcji statystycznych.
Powszechnie uważa się, że dane faktyczne nie mogą być objęte prawami autorskimi. Wydawcy często dołączają do danych naukowych towarzyszących publikacji oświadczenia o prawach autorskich (często zabraniające ponownego wykorzystywania). Może być niejasne, czy dane faktyczne zawarte w pełnym tekście są objęte prawami autorskimi.
Podczas gdy abstrakcja faktów z publikacji papierowych przez ludzi jest zwykle akceptowana jako legalna, często istnieje domniemane ograniczenie maszynowego wydobywania przez roboty.
W przeciwieństwie do otwartego dostępu , w przypadku którego grupy wydawców wyraziły swoje obawy, otwarte dane są zwykle kwestionowane przez poszczególne instytucje. [ potrzebne źródło ] Ich argumenty były rzadziej omawiane w dyskursie publicznym i obecnie jest mniej cytatów, na których można polegać.
Argumenty przeciwko udostępnianiu wszystkich danych jako otwartych danych obejmują:
- Finansowanie rządowe nie może być wykorzystywane do powielania lub kwestionowania działań sektora prywatnego (np. PubChem ).
- Rządy muszą ponosić odpowiedzialność za efektywne wykorzystanie pieniędzy podatników: jeśli fundusze publiczne są wykorzystywane do agregowania danych i jeśli dane przyniosą korzyści komercyjne (prywatne) tylko niewielkiej liczbie użytkowników, użytkownicy powinni zwrócić rządom koszty podanie danych.
- Otwarte dane mogą prowadzić do wykorzystywania i szybkiego publikowania wyników opartych na danych dotyczących krajów rozwijających się przez bogate i dobrze wyposażone instytuty badawcze, bez dalszego zaangażowania i/lub korzyści dla lokalnych społeczności (badania nad helikopterami ) ; podobnie do historycznego otwartego dostępu do lasów tropikalnych, który doprowadził do sprzeniewierzenia („globalnej grabieży”) zasobów genetycznych roślin z krajów rozwijających się.
- Dochód uzyskany z publikowania danych może zostać wykorzystany do pokrycia kosztów generowania i/lub rozpowszechniania danych, tak aby rozpowszechnianie mogło trwać w nieskończoność.
- Przychody uzyskiwane z publikowania danych pozwalają organizacjom non-profit na finansowanie innych działań (np. publikowanie towarzystw naukowych wspiera społeczeństwo).
- Rząd daje określoną legitymację niektórym organizacjom do odzyskiwania kosztów ( NIST w USA, Ordnance Survey w Wielkiej Brytanii).
- Względy dotyczące prywatności mogą wymagać ograniczenia dostępu do danych do określonych użytkowników lub do podzbiorów danych.
- Gromadzenie, „czyszczenie”, zarządzanie i rozpowszechnianie danych to zazwyczaj procesy pracochłonne i/lub kosztowne – każdy, kto świadczy te usługi, powinien otrzymywać godziwe wynagrodzenie za świadczenie tych usług.
- Sponsorzy nie otrzymują pełnej wartości, jeśli ich dane nie są odpowiednio wykorzystywane – czasami wymaga to zarządzania jakością, rozpowszechniania i działań związanych z budowaniem marki, które najlepiej można osiągnąć poprzez pobieranie opłat od użytkowników.
- Często docelowi użytkownicy końcowi nie mogą korzystać z danych bez dodatkowego przetwarzania (analiza, aplikacje itp.) – jeśli ktoś ma dostęp do danych, nikt nie może mieć motywacji do inwestowania w przetwarzanie wymagane do uczynienia danych użytecznymi (typowe przykłady obejmują biologiczne, dane medyczne i środowiskowe).
- Nie ma kontroli nad wtórnym wykorzystaniem (agregacją) otwartych danych.
Związek z innymi otwartymi działaniami
Cele ruchu Open Data są podobne do celów innych ruchów „Open”.
- Otwarty dostęp dotyczy swobodnego udostępniania publikacji naukowych w Internecie. W niektórych przypadkach artykuły te obejmują również otwarte zbiory danych.
- Otwarte specyfikacje to dokumenty opisujące typy plików lub protokoły, w przypadku gdy dokumenty są objęte otwartą licencją. Te specyfikacje mają przede wszystkim na celu ulepszenie różnych programów obsługujących te same typy plików lub protokoły, ale monopoliści zmuszeni przez prawo do otwartych specyfikacji mogą to utrudnić.
- Otwarte treści dotyczą bezpłatnego udostępniania zasobów skierowanych do ludzkich odbiorców (takich jak proza, zdjęcia lub filmy).
- Otwarta wiedza . Open Knowledge International opowiada się za otwartością w wielu kwestiach, w tym między innymi w zakresie otwartych danych. Obejmuje (a) informacje naukowe, historyczne, geograficzne lub inne (b) treści takie jak muzyka, filmy, książki (c) informacje rządowe i inne informacje administracyjne. Otwarte dane są objęte zakresem definicji otwartej wiedzy, o której mowa w Science Commons dotyczącym wdrażania danych w otwartym dostępie.
- Nauka o otwartym notatniku odnosi się do zastosowania koncepcji otwartych danych do jak największej części procesu naukowego, w tym nieudanych eksperymentów i surowych danych eksperymentalnych.
- Oprogramowanie typu open source dotyczy licencji typu open source, na podstawie których można rozpowszechniać programy komputerowe, i zwykle nie dotyczy głównie danych.
- Otwarte zasoby edukacyjne to ogólnodostępne dokumenty i media na otwartej licencji, które są przydatne w nauczaniu, uczeniu się i ocenianiu, a także w celach badawczych.
- Otwarte badania / otwarta nauka / otwarte dane naukowe (połączona otwarta nauka) oznacza podejście do otwierania i łączenia zasobów naukowych, takich jak dane, metody i narzędzia, z połączonymi technikami danych, aby umożliwić przejrzyste, powtarzalne i interdyscyplinarne badania.
- Open-GLAM (galerie, biblioteki, archiwa i muzea) to inicjatywa i sieć wspierająca wymianę i współpracę między instytucjami kultury, które wspierają otwarty dostęp do ich zdigitalizowanych zbiorów. Inicjatywa GLAM-Wiki pomaga instytucjom kulturalnym dzielić się swoimi zasobami na otwartej licencji ze światem poprzez wspólne projekty z doświadczonymi redaktorami Wikipedii . Open Heritage Data jest kojarzony z Open GLAM, ponieważ dane na otwartej licencji w sektorze dziedzictwa są obecnie często wykorzystywane w badaniach, publikacjach i programowaniu, szczególnie w humanistyce cyfrowej .
Otwarte dane jako wspólne
Idee i definicje
Formalnie zarówno definicja otwartych danych, jak i dobra wspólne obracają się wokół koncepcji wspólnych zasobów z niską barierą dostępu. Zasadniczo cyfrowe dobra wspólne obejmują otwarte dane, ponieważ obejmują zasoby utrzymywane online, takie jak dane. Ogólnie rzecz biorąc, patrząc na zasady działania Otwartych Danych, można zauważyć w praktyce nakładanie się Otwartych Danych i (cyfrowych) dóbr wspólnych. Zasady Otwartych Danych różnią się czasami w zależności od rodzaju danych podlegających kontroli. Niemniej jednak w pewnym stopniu nakładają się na siebie, a ich głównym uzasadnieniem jest brak barier dla ponownego wykorzystania danych (zbiorów). Bez względu na ich pochodzenie, zasady w różnych typach otwartych danych wskazują na kluczowe elementy definicji dobra wspólnego. Są to na przykład dostępność, ponowne użycie, możliwość znalezienia, niezastrzeżone. Dodatkowo, choć w mniejszym stopniu, zagrożenia i szanse związane zarówno z Open Data, jak i dobrami wspólnymi są podobne. Syntetyzując, obracają się wokół (ryzyka i) korzyści związanych z (niekontrolowanym) wykorzystaniem wspólnych zasobów przez wielu różnych aktorów.
System
Zarówno dobra wspólne, jak i otwarte dane można zdefiniować na podstawie cech zasobów, które pasują do tych koncepcji, ale można je zdefiniować na podstawie cech systemów, do których dążą ich zwolennicy. Zarządzanie jest przedmiotem zainteresowania zarówno naukowców zajmujących się Otwartymi Danymi, jak i Commons. Kluczowymi elementami, które zarysowują wspólne cechy i cechy Otwartych Danych, są różnice (a być może sprzeciw) wobec dominującej logiki rynkowej ukształtowanej przez kapitalizm. Być może jest to cecha, która pojawia się w niedawnym wzroście koncepcji dobra wspólnego, związanego z bardziej społecznym spojrzeniem na technologie cyfrowe w określonych formach cyfrowych, a zwłaszcza danych wspólnych.
Przypadek z życia wzięty
Przykładem tego, w jaki sposób związek między otwartymi danymi a dobrami wspólnymi oraz w jaki sposób zarządzanie nimi może potencjalnie zakłócić logikę rynkową dominującą w przypadku dużych zbiorów danych, jest projekt prowadzony przez Human Ecosystem Relazioni w Bolonii (Włochy). Zobacz: https://www.he-r.it/wp-content/uploads/2017/01/HUB-report-impaginato_v1_small.pdf .
Projekt ten miał na celu ekstrapolację i identyfikację internetowych relacji społecznych związanych z „współpracą” w Bolonii. Dane zostały zebrane z sieci społecznościowych i platform internetowych do współpracy obywateli. Ostatecznie dane zostały przeanalizowane pod kątem treści, znaczenia, lokalizacji, ram czasowych i innych zmiennych. Ogólnie rzecz biorąc, relacje społeczne online pod kątem współpracy zostały przeanalizowane w oparciu o teorię sieci. Powstały zbiór danych został udostępniony online jako otwarte dane (zagregowane i zanonimizowane); niemniej jednak osoby fizyczne mogą odzyskać wszystkie swoje dane. Dokonano tego z myślą o uczynieniu danych wspólnymi. Ten projekt ilustruje związek między otwartymi danymi a dobrami wspólnymi oraz sposób, w jaki mogą one zakłócić logikę rynkową napędzającą wykorzystanie dużych zbiorów danych na dwa sposoby. Po pierwsze, pokazuje, w jaki sposób takie projekty, podążając w pewnym sensie za założeniami Open Data, mogą wywołać tworzenie skutecznych wspólnych danych. Sam projekt oferował różne rodzaje wsparcia użytkownikom platform społecznościowych w usuwaniu treści. Po drugie, otwarcie danych dotyczących interakcji w sieciach społecznościowych online może znacznie zmniejszyć monopolistyczną siłę platform sieci społecznościowych w zakresie tych danych.
Mandaty fundatorów
Kilka organów finansujących, które upoważniają do otwartego dostępu, upoważnia otwarte dane. Dobre sformułowanie wymagań (miejscami okrojone) podaje Canadian Institutes of Health Research (CIHR):
- zdeponowania danych bioinformatycznych, współrzędnych atomowych i molekularnych, danych eksperymentalnych w odpowiedniej publicznej bazie danych natychmiast po opublikowaniu wyników badań.
- do przechowywania oryginalnych zestawów danych przez co najmniej pięć lat po przyznaniu dotacji. Dotyczy to wszystkich danych, opublikowanych lub nie.
Inne organy zajmujące się promowaniem deponowania danych, jak również pełnego tekstu, to Wellcome Trust . W artykule naukowym opublikowanym w 2013 r. zalecano, aby program „ Horyzont 2020” (mechanizm finansowania nauki w UE) wymagał, aby finansowane projekty przekazywały swoje bazy danych jako „produkty dostarczane” na koniec projektu, aby można je było sprawdzić pod kątem użyteczności dla stron trzecich. wspólny.
Nieotwarte dane
Kilka mechanizmów ogranicza dostęp do danych lub ich ponowne wykorzystanie (powyżej podano kilka powodów takiego postępowania). Zawierają:
- udostępnianie danych za opłatą;
- kompilacja w bazach danych lub na stronach internetowych, do których dostęp mogą mieć tylko zarejestrowani członkowie lub klienci;
- korzystanie z zastrzeżonej lub zamkniętej technologii lub szyfrowania, które tworzą barierę dostępu;
- oświadczenia o prawach autorskich, które rzekomo zabraniają (lub zaciemniają) ponownego wykorzystywania danych, w tym stosowania wymogów „bez pochodnych ”;
- patent zabraniający ponownego wykorzystania danych (na przykład opatentowano trójwymiarowe współrzędne niektórych eksperymentalnych struktur białkowych);
- ograniczenie robotów do stron internetowych, z preferencją dla niektórych wyszukiwarek;
- agregowanie danych faktycznych w „bazy danych”, które mogą być objęte „ prawami do baz danych ” lub „dyrektywami dotyczącymi baz danych” (np. dyrektywa w sprawie ochrony prawnej baz danych );
- ograniczony czasowo dostęp do zasobów takich jak e-czasopisma (które w wersji tradycyjnej były dostępne dla nabywcy bezterminowo);
- „webstacles” lub dostarczanie pojedynczych punktów danych w przeciwieństwie do zapytań tabelarycznych lub masowego pobierania zestawów danych ; I
- naciski polityczne, handlowe lub prawne na działalność organizacji dostarczających Open Data (np. American Chemical Society lobbowało w Kongresie USA, aby ograniczyć finansowanie National Institutes of Health na dane Open PubChem ).
Zobacz też
- Lista otwartych danych
- Otwarta wiedza
- Otwórz zawartość
- Otwartość
- Licencja Creative Commons
- Opieka nad danymi
- Zarządzanie danymi
- Zarządzanie danymi
- Publikowanie danych
- Udostępnianie danych
- Transport reagujący na zapotrzebowanie
- Konserwacja cyfrowa
- Zasady danych FAIR
- Międzynarodowy Dzień Otwartych Danych
- Połączone dane i Połączone otwarte dane
- Otwarte bazy danych systemów energetycznych
- Otwórz Icecata
- Informatyka miejska
- Wikidane
- Lista zestawów danych do badań nad uczeniem maszynowym
Linki zewnętrzne
- Otwarte dane – wprowadzenie – od Open Knowledge Foundation
- Wideo zarchiwizowane 10 kwietnia 2011 r. W Wayback Machine Tima Bernersa-Lee na TED (konferencja) 2009 wzywające do „Raw Data Now”
- Sześciominutowe wideo zarchiwizowane 6 maja 2011 r. W Wayback Machine of Tim Berners-Lee na TED (konferencja) 2010 przedstawiające przykłady otwartych danych
- Karta Otwartych Danych G8
- Towards a Genealogy of Open Data – artykuł naukowy śledzący różne wątki historyczne przyczyniające się do obecnych koncepcji otwartych danych.