Cel (projekt)

Cel
Lokalizacja Uniwersytet w Groningen, Holandia
Przyjęty styczeń 2009
Finansowanie Finansowane przez Europejski Fundusz Rozwoju Regionalnego i partnerów
Strona internetowa dywan .nl /target

Target to nazwa wspólnego projektu badawczego specjalizującego się w przetwarzaniu dużych zbiorów danych i zarządzaniu nimi w północnej Holandii. Jest to współpraca publiczno-prywatna, zapoczątkowana w 2009 roku i wspierana dotacjami rządowymi. Jest prowadzony przez konsorcjum dziesięciu partnerów akademickich i przemysłu komputerowego, koordynowane przez Uniwersytet w Groningen , i zajmuje się zarządzaniem danymi projektów naukowych w dziedzinie astronomii, nauk przyrodniczych, sztucznej inteligencji i diagnostyki medycznej.

W projekcie Target współpracują różne wydziały Uniwersytetu w Groningen, jego centrum medyczne , IBM , Oracle , ASTRON oraz holenderskie firmy informatyczne Elkoog/ Heeii i Nspyre.

petabajtów pamięci masowej opartej na technologii pamięci masowej IBM GPFS, wysokowydajnego klastra obliczeniowego i klastra gridowego , która jest częścią Europejskiej Infrastruktury Gridowej .

Centrum danych Target jest obsługiwane przez Donald Smits Centre for Information Technology na Uniwersytecie w Groningen w Holandii

Historia

Projekt został zainicjowany w celu przeniesienia wiedzy astronomów z zakresu masowego przetwarzania danych do innych dziedzin nauki. Target opiera się na rozproszonym środowisku obliczeniowym o nazwie Astro-WISE. Sam Astro-WISE powstał jako inicjatywa Grupy Roboczej OPTICON Wide Field Imaging, która została utworzona w celu rozważenia znormalizowanego europejskiego systemu pomiarów w celu ułatwienia badań, redukcji danych i eksploracji danych przy użyciu danych z kamer szerokokątnych nowej generacji. projekt uruchomiony w 2009 roku po otrzymaniu 32 mln euro dofinansowania na okres 5 lat z Europejskiego Funduszu Rozwoju Regionalnego , holenderskie Ministerstwo Gospodarki (projekt „Pieken in de Delta”) oraz prowincje Groningen i Drenthe. Projekt jest realizowany pod auspicjami Sojuszu Prowincji Północnych Niderlandów (SNN) i gminy Groningen.

Znaleziska technologiczne

Na początku projektu jednym z celów było opracowanie jednego zintegrowanego systemu przetwarzania, składającego się z wielopetabajtowego systemu plików oraz kilku różnych typów klastrów gridowych i obliczeniowych. W ciągu pierwszych lat stało się jasne, że wymagania dla różnych e-nauki są różne. W niektórych obszarach ma miejsce masowe przesyłanie danych, jak w przypadku Lofar . W astronomii liczba obiektów danych może sięgać miliardów przy ograniczonej liczbie kolumn danych. W genomice , liczba wierszy jest niewielka, ale liczba kolumn może być ogromna, sięgająca setek tysięcy. Inne obszary, takie jak wizualne wyszukiwanie tekstu w wyszukiwarce Monk dla rękopisów historycznych, znajdują się na pośredniej pozycji z setkami milionów wierszy i tysiącami wymiarów. Ponadto zastosowania genomiki często wymagają ścisłej kontroli dostępu, podczas gdy inne dyscypliny nie mają problemów z prywatnością. W związku z tym różne podprojekty w Target przyjęły pragmatyczne podejście do tego, które aspekty technologii WISE i komponenty infrastruktury sprzętowej Target miały zastosowanie w ich dziedzinie.

Projektowanie

Target uczestniczy w wielu projektach naukowych z zakresu astronomii, wizualizacji Big Data (współpraca z centrum eScience w Amsterdamie), algorytmów rozpoznawania tekstu odręcznego , badań medycznych nad zdrowym starzeniem się, opracowywania narzędzi diagnostycznych dla choroby Parkinsona i nie tylko.

LOFAR Długoterminowe Archiwum

Target opracował i utrzymuje długoterminowe archiwum LOFAR .

Wiele danych z teleskopu LOFAR jest przechowywanych, udostępnianych i archiwizowanych w długoterminowym archiwum LOFAR, zaprojektowanym przez ASTRON i Target. Dane będą przechowywane w centrum danych Target i kilku innych europejskich centrach.

Mnich

Zrzut ekranu strony z Archiwum Gabinetu Królowej Holandii (KdK), na której Monk znalazł słowo Groningen.

Monk to system opracowany przez Schomakera i jego grupę w Instytucie Sztucznej Inteligencji (ALICE) na Uniwersytecie w Groningen . Wykorzystuje algorytmy rozpoznawania wzorców i uczenia maszynowego do rozpoznawania tekstu odręcznego w różnych istniejących archiwach. Obecnie do Monka wchłonięto wiele książek z holenderskich archiwów narodowych, a także ponad 70 międzynarodowych kolekcji historycznych, od zachodnich, średniowiecznych po ręcznie pisane chińskie rękopisy. Systemy wykorzystują ciągłe („24/7”) uczenie maszynowe przez Internet, uzyskując fundamentalne wyniki. [ niejasne ] System MONK wykorzystuje zasoby obliczeniowe i pamięciowe firmy Target. Niedawno stał się częścią współpracy, kierowanej przez prof. Popovica z Wydziału Teologii i Religioznawstwa Uniwersytetu w Groningen, który użyje kombinacji datowania węglowego, paleografii i technik rozpoznawania tekstu/obrazu, aby spróbować wskazać autorów popularne rękopisy zwojów znad Morza Martwego .

Linie Życia

LifeLines to długoterminowy projekt badań medycznych prowadzony przez Uniwersyteckie Centrum Medyczne w Groningen (UMCG) . Szereg danych genotypowych i fenotypowych będzie gromadzonych od 165 000 osób raz na pięć lat przez całkowity okres trzydziestu lat. Zgromadzone dane zostaną wykorzystane przez naukowców i specjalistów medycznych do uzyskania wglądu w procesy związane ze starzeniem się i zrozumienia, dlaczego degradacja zdrowia związana z wiekiem jest tak zróżnicowana. Target zapewnia LifeLines infrastrukturę do przechowywania, dostępu i przetwarzania danych. Dane z LifeLines, a także SURFsara oraz infrastruktura Target zostały wykorzystane w projekcie Genome of the Netherlands, prowadzonym przez konsorcjum UMCG , LUMC , Erasmus MC, UMCU , Free University of Amsterdam . Wyniki projektu wykorzystującego sekwencjonowanie całego genomu do określenia struktury populacji i historii demograficznej populacji holenderskiej zostały opublikowane w czerwcu w czasopiśmie Nature Genetics .

PRZEGLĄDY

Prowadzony przez K. Leendersa, profesora neurologii na UMCG , GLIMPS to projekt badawczy mający na celu znalezienie szybszych i bardziej niezawodnych narzędzi diagnostycznych dla choroby Parkinsona. GLIMPS bada możliwości wykorzystania złożonych algorytmów opartych na obrazach i skanów PET do wczesnego wykrywania choroby Parkinsona. [ potrzebne źródło ] Aby przetestować skuteczność takich algorytmów, GLIMPS buduje dużą bazę danych skanów PET dostarczanych przez liczne szpitale w Holandii. Target jest odpowiedzialny za budowę i utrzymanie bazy danych GLIMPS, a także zapewnienie sprawnego działania algorytmów opartych na obrazach w swoich zapleczach obliczeniowych.

Inni

Ponadto Target jest zaangażowany w zarządzanie danymi dla innych projektów astronomicznych, takich jak przegląd astronomiczny KiDs/VIKING przy użyciu OmegaCAM, instrumentu MUSE ESO (zamontowanego na Bardzo Dużym Teleskopie ) i MICADO (do zamontowania na E-ELT ). Ponadto podejście zorientowane na dane do zarządzania danymi zapoczątkowane przez Target zostało przyjęte przez ESA Euclid . Spółka spin-off projektu Target Holding BV zarządza również wieloma projektami komercyjnymi z prywatnymi firmami na północy Holandii.

Dotarcie do opinii publicznej i edukacja są również częścią zakresu projektu, a Target zorganizował wiele wydarzeń publicznych. Teatr Infoversum 3D jest pochodną projektu Target i zapewnia możliwość wizualizacji i objaśniania danych naukowych dla dużych grup.