Renesansowy Instytut Informatyczny
Przyjęty | 2004 |
---|---|
Dziedzina badań |
nauka o danych i cyberinfrastruktura; nauki o środowisku; biomedycyna i nauki o zdrowiu |
Dyrektor | Stanley C. Ahalt, dr |
Lokalizacja | Chapel Hill, Karolina Północna |
Przynależności | Uniwersytet Karoliny Północnej w Chapel Hill |
Strona internetowa | renci.org |
Renaissance Computing Institute (RENCI) powstał w 2004 roku w wyniku współpracy stanu Karolina Północna , Uniwersytetu Karoliny Północnej w Chapel Hill (UNC-CH), Uniwersytetu Duke i Uniwersytetu Stanowego Karoliny Północnej . RENCI ma strukturę organizacyjną jako instytut badawczy w UNC-CH, a jego główny kampus znajduje się w Chapel Hill w Karolinie Północnej , kilka mil od kampusu UNC-CH. RENCI ma centra zaangażowania na UNC-CH, Duke University (Durham) i North Carolina State University (Raleigh).
Założycielskim dyrektorem RENCI był Daniel A. Reed; Obecnym dyrektorem jest Stanley C. Ahalt. RENCI zatrudnia ponad 80 pracowników.
Deklaracja misji
Obecna misja RENCI to: „opracowywanie i wdrażanie zaawansowanych technologii, aby umożliwić odkrycia badawcze i praktyczne innowacje”. RENCI realizuje swoją misję poprzez współpracę z badaczami akademickimi, decydentami rządowymi i liderami branży w celu zaangażowania się w badania i rozwój mające na celu rozwiązanie kluczowych wyzwań w kilku obszarach tematycznych: nauka o danych i cyberinfrastruktura; nauki o środowisku; oraz nauki biomedyczne i o zdrowiu.
Historia
RENCI zostało założone w styczniu 2004 roku przez doktora Daniela A. Reeda przy wsparciu finansowym stanu Karolina Północna, UNC-CH, North Carolina State University i Duke University. Dr Reed poprzednio pełnił funkcję dyrektora Narodowego Centrum Zastosowań Superkomputerowych (NCSA), głównego architekta inicjatywy TeraGrid Narodowej Fundacji Nauki (NSF) oraz członka Komitetu Doradczego Prezydenta ds. Technologii Informatycznych. W maju 2004 r. Alan Blatecky dołączył do RENCI jako zastępca dyrektora. Pan Blatecky był wcześniej dyrektorem wykonawczym Centrum Superkomputerów w San Diego i szef inicjatywy NSF Middleware.
Początkowa misja RENCI brzmiała:
służyć jako multidyscyplinarny instytut łączący środowisko akademickie, handel i społeczeństwo, aby wzbogacać i wzmacniać potencjał ludzki, tworzyć partnerstwa wieloinstytucjonalne oraz rozwijać i wdrażać wiodącą na świecie infrastrukturę obliczeniową.
W grudniu 2005 r. spółka RENCI otrzymała od stanu Karolina Północna fundusze w wysokości 5,9 mln dolarów na lata 2005–2006 oraz 11,8 mln dolarów w formie funduszy okresowych na „wsparcie personelu, operacje komputerowe i sprzęt”. Finansowanie to miało kluczowe znaczenie dla RENCI, ponieważ rozwinęła ona infrastrukturę ogólnostanową w celu utworzenia organizacji wirtualnej i wykorzystania tej infrastruktury oraz wiedzy specjalistycznej personelu RENCI w celu zaangażowania się w projekty finansowane ze środków federalnych będących przedmiotem zainteresowania stanu. Początkowo projekt RENCI skupiał się na zastosowaniu technologii cybernetycznych i zaawansowanych analiz do planowania, łagodzenia skutków katastrof na wybrzeżach i reagowania na nie. Od tego czasu RENCI zaangażował się w różnorodne partnerstwa w całej Karolinie Północnej i całym kraju. Partnerstwa te zaowocowały licznymi dotacjami federalnymi, zapewniając w ten sposób organizacji dodatkowe źródło przychodów.
W 2007 r. w RENCI nastąpiła zmiana na kierownictwie wraz z odejściem dr. Reeda i mianowaniem pana Blatecky'ego na dyrektora tymczasowego. W tym czasie RENCI wdrożyło swój pierwszy w historii proces planowania strategicznego. Proces ten doprowadził do zmienionej deklaracji misji:
Renaissance Computing Institute, organizacja wieloinstytucjonalna, skupia multidyscyplinarnych ekspertów i zaawansowane możliwości technologiczne, aby zająć się palącymi problemami badawczymi i znaleźć rozwiązania złożonych problemów, które wpływają na jakość życia w Karolinie Północnej, naszym kraju i na świecie.
W 2009 roku na stanowisko dyrektora powołano dr Stanleya C. Ahalta. Dr Ahalt był wcześniej dyrektorem wykonawczym Ohio Supercomputer Center (OSC) i profesorem na Wydziale Inżynierii Elektrycznej i Komputerowej na Ohio State University (OSU). Po przybyciu do RENCI dr Ahalt otrzymał wspólną nominację na stanowisko profesora na wydziale informatyki UNC-CH.
Doktor Ashok Krishnamurthy został mianowany zastępcą dyrektora w lutym 2013 r. Dr Krishnamurthy był wcześniej dyrektorem ds. badań i rozwoju naukowego w OSC oraz profesorem nadzwyczajnym na Wydziale Informatyki i Inżynierii Elektrycznej OSU.
Pod przewodnictwem dr. Ahalt i Krishnamurthy, RENCI zwiększyła liczbę pracowników, partnerów zewnętrznych i zakres działań. Nawiązano kilka kluczowych partnerstw i inicjatyw. Pierwszym z nich jest partnerstwo ze Szkołą Medyczną UNC-CH w ramach Krajowego Instytutu Zdrowia (NIH) Nagroda Centrum Nauk Translacyjnych i Klinicznych, która doprowadziła do powstania Instytutu Nauk Translacyjnych i Klinicznych w Północnej Karolinie w 2008 roku (NC TraCS). dr. Ahalt i Krishnamurthy są odpowiednio dyrektorem i współdyrektorem Służby Informatyki Biomedycznej w NC TraCS. Drugim kluczowym działaniem było założenie Water Science Software Institute (WSSI), którego współzałożycielami byli RENCI i Krajowe Centrum Syntezy Społeczno-Środowiskowej (SESYNC) we wrześniu 2012 r. Trzecim kluczowym działaniem było utworzenie Krajowego Konsorcjum for Data Science (NCDS) w lutym 2013 r. Siedziba NCDS mieści się w RENCI i składa się z członków wywodzących się ze środowiska akademickiego, przemysłu i rządu. Wreszcie czwartym kluczowym działaniem było utworzenie konsorcjum iRODS w marcu 2013 r. Konsorcjum iRODS ma również siedzibę w RENCI i obejmuje zróżnicowanych członków międzynarodowych.
Obecne kierownictwo
- Stanley C. Ahalt, reżyser
- Ashok Krishnamurthy, zastępca dyrektora
- Jay Aikat, dyrektor operacyjny
- Ilya Baldin, dyrektor ds. badań sieciowych i infrastruktury
- Brian Blanton, dyrektor nauk o danych o Ziemi
- Terrell Russell, dyrektor ds. zarządzania danymi i dyrektor wykonawczy konsorcjum iRODS
- Rob Fowler, dyrektor ds. obliczeń o wysokiej wydajności
- Ray Idaszak, dyrektor DevOps
- Rick Luettich, główny naukowiec zajmujący się modelami wybrzeża
- Lea Shanley, współdyrektor wykonawczy South Big Data Hub
- Kirk C. Wilhelmsen, główny naukowiec zajmujący się genomiką i dyrektor inicjatyw w zakresie badań biomedycznych
Kluczowe obszary i technologie w zakresie badań i rozwoju
Analityka danych i cyberinfrastruktura
RENCI prowadzi szereg aktywnych programów badawczych, których celem jest rozwój i wdrażanie zaawansowanych możliwości obliczeniowych i sieciowych. Wiele powstałych technologii ma charakter open source. w ramach inicjatywy GENI finansowanej przez NSF opracowywane jest otwarte oprogramowanie ExoGENI (Exo-Global Environment for Network Innovation). ExoGENI działa jako stowarzyszona, oparta na chmurze platforma infrastruktury sieciowej jako usługi (NIaaS) do dynamicznego udostępniania zasobów sieciowych, pamięci masowej i obliczeniowych. NIEUGIĘTY (Adaptive Data-Aware Multi-Domain Application Network Topologies), również finansowany przez NSF, opiera się na ExoGENI. ADAMANT integruje Pegasus (zarządzanie przepływem pracy) i naukowy system przepływu pracy HT Condor z platformą ExoGENI NIaaS w celu koordynowania realizacji wielkoskalowych naukowych procesów w rozproszonej chmurze lub tradycyjnych, wysokowydajnych zasobach obliczeniowych. iRODS (zintegrowany system danych zorientowanych na reguły) został opracowany przez centra Data Intensive Cyber Environments (DICE) w UNC-CH i Uniwersytet Kalifornijski w San Diego i jest obecnie utrzymywany przez RENCI. iRODS to technologia oprogramowania pośredniego typu open source, zaprojektowana w celu zapewnienia opartej na zasadach kontroli nad dostępem do danych, ich przenoszeniem, wykorzystaniem i archiwizacją w lokalizacjach geograficznych, różnych technologiach przechowywania i wielu grupach użytkowników, z których każda ma różne zasady dotyczące dostępu do danych i ich wykorzystania. PROMIeń (Infrastruktura współpracy zorientowana na zasoby zorientowana na zasoby; cytat w Internecie) integruje ORCA (architektura otwartej kontroli zasobów) firmy GENI z iRODS w celu dynamicznego udostępniania rozproszonej infrastruktury opartej na chmurze dla wieloinstytucjonalnej współpracy badawczej opartej na danych. RADII osiąga to poprzez oprogramowanie zaprojektowane do modelowania danych badawczych oraz mapowania elementów danych, obliczeń i przechowywania na podstawową infrastrukturę fizyczną iRODS. Most danych ma na celu zapewnienie wielowymiarowego systemu sieci socjometrycznej do udostępniania zbiorów danych o długim ogonie. DataBridge to narzędzie do współpracy typu open source, które umożliwia naukowcom eksplorację dostępnych zbiorów danych i związanych z nimi algorytmów oraz definiowanie mostów semantycznych umożliwiających łączenie się z różnorodnymi zbiorami danych w sieci socjometrycznej i uzyskiwanie do nich dostępu.
Nauki o środowisku
Wiele projektów RENCI w dziedzinie nauk o środowisku koncentruje się na hydrologii , sztormach przybrzeżnych i zaawansowanym modelowaniu pomagającym w przygotowaniu się na wypadek katastrofy. ADCIRC to model oprogramowania typu open source, który stosuje zaawansowaną analizę do wielu źródeł i typów danych (np. zbiorów danych hydrologicznych, zbiorów danych atmosferycznych, danych prognozujących burze tropikalne, danych systemu informacji geograficznej itp.), aby umożliwić uzyskiwanie w czasie rzeczywistym wysokiej rozdzielczości przewidywanie skutków przybrzeżnych wezbrań sztormowych i powodzi po huraganach i zdarzeniach z nimi związanych. We współpracy z badaczami z Centrum Odporności Wybrzeża UNC i Krajowe Centrum ds. Huraganów ADCIRC jest rozwijane jako system prognozowania wybrzeża, mający pomóc w planowaniu katastrof oraz wspomaganiu decyzji na poziomie stanowym i federalnym. EarthCube to inicjatywa finansowana przez NSF, której celem jest „opracowanie w ciągu następnej dekady ram pomagających badaczom w zrozumieniu i przewidywaniu układu ziemskiego od Słońca do centrum Ziemi”. EarthCube został zaprojektowany jako otwarta, dynamiczna cyberinfrastruktura, aby umożliwić zarządzaną przez społeczność wymianę danych w naukach o Ziemi, w tym o oceanach , badania polarne, nauki o atmosferze, geokosmos, informatyka i inne dziedziny. Rozwiązanie HydroShare jest wspierane przez finansowane przez NSF CUAHSI (Konsorcjum Uniwersytetów na rzecz Rozwoju Nauk Hydrologicznych Inc.) i jest w fazie rozwoju jako cyberinfrastruktura otwartej współpracy dla hydrologii. HydroShare umożliwia naukowcom zajmującym się wodą identyfikowanie i pobieranie zbiorów danych związanych z wodą oraz powiązanych algorytmów i modeli, a następnie analizowanie i obliczanie danych przy użyciu rozproszonego środowiska obliczeniowego, które obejmuje chmurę opartą na siatce oraz możliwości przetwarzania i przechowywania o wysokiej wydajności
Nauki biomedyczne i o zdrowiu
Głównym obszarem prac RENCI w dziedzinie nauk biomedycznych i o zdrowiu jest genomika kliniczna. RENCI współpracuje z NC TraCS, Kompleksowym Centrum Onkologii Lineberger w UNC-CH oraz Działem Badań i Obliczeń Usług Informatycznych UNC w celu opracowania i wdrożenia technologii wspierających technologie sekwencjonowania genomu nowej generacji, takie jak sekwencjonowanie całego genomu (WGS) i sekwencjonowanie całego egzomu (WES). Technologie te obejmują GMW (Genetic Medical Workflow), który został częściowo sfinansowany przez NIH i zapewnia kompleksowe przechwytywanie, analizę, walidację i raportowanie danych WGS i WES. Silnik GMW zaprojektowano jako architekturę typu open source, która koordynuje przepływy pracy, podprocesy, próbki, dane i ludzi w celu wspierania wszystkich aspektów badań genomiki i zastosowań klinicznych, od pierwszej wizyty pacjenta po raportowanie wyników badań genomu pod kierunkiem lekarza. MapaSekw (Masively Parallel Sequencing) to oparta na wtyczkach architektura zorientowana na usługi (SOA) typu open source, która zapewnia bezpieczne zarządzanie i wykonywanie złożonych dalszych etapów obliczeniowych i analitycznych związanych z wysokoprzepustowym sekwencjonowaniem genomu i innymi aplikacjami intensywnie wykorzystującymi dane. MaPSeq i jego siostrzana technologia GATE (Grid Access Triage Engine) są zbudowane na bazie Apache Karaf i razem zapewniają rozszerzalne możliwości dalszej analizy danych genomowych i innych dużych zbiorów danych, w tym wykonywanie i zarządzanie potokiem przepływu pracy, meta-harmonogramowanie zadań przepływu pracy, oportunistycznego wykorzystania zasobów obliczeniowych, bezpiecznego przesyłania danych i dostępu klientów przez Internet. CANVAS (CAroliNa Variant Annotation Store) i AnnoBot (Annotation Bot) współpracują, aby zapewnić kontrolowane wersje adnotacji i metadanych dla danych wariantów genomowych, aby wspierać aktualną interpretację kliniczną wariantów genomowych, a tym samym kierować podejmowaniem decyzji klinicznych. CANVAS został zaprojektowany jako relacyjna baza danych PostgreSQL typu open source, która przechowuje dane wariantów genomowych wraz z powiązanymi adnotacjami i metadanymi. AnnoBot składa się z modułów Pythona i kodu sterownika oprogramowania skonfigurowanego w celu zapewnienia automatycznego monitorowania i wyszukiwania zewnętrznych źródeł danych w celu aktualizacji adnotacji. CZAT (Convergent Haplotype Association Tagging) to algorytm programowy, który pozwala na identyfikację umiarkowanie penetrujących wariantów genomowych przy użyciu struktur genetycznych obejmujących różne populacje. CHAT odwołuje się do algorytmu opartego na teorii grafów w celu określenia fazy haplotypu populacji niespokrewnionych osobników poprzez: identyfikację podzbiorów osobników, które mają wspólny region genomu poprzez pochodzenie; a następnie wygenerowanie haplotypu konsensusowego dla wspólnego regionu. SMW (Secure Medical Workspace) zapewnia bezpieczne środowisko dostępu do wrażliwych danych pacjentów na potrzeby opieki klinicznej lub Instytucjonalnej Komisji Rewizyjnej –zatwierdzone badania kliniczne. Architektura SMW o otwartym kodzie źródłowym wykorzystuje technologię wirtualizacji (tj. VMWare ) i technologię ochrony przed wyciekiem danych (DLP) (tj. WebSense ) w celu stworzenia bezpiecznej wirtualnej przestrzeni roboczej połączonej z możliwością zapobiegania (lub umożliwiania kwestionowania i audytowania przez personel technologii informatycznych) ) fizyczne usunięcie danych z centralnego, bezpiecznego środowiska przechowywania.
Instytuty i konsorcja
RENCI był pionierem w utworzeniu instytutu krajowego WSSI oraz dwóch głównych konsorcjów, konsorcjum iRODS i NCDS.
WSSI
Finansowany przez NSF projekt WSSI powstał we wrześniu 2012 r. w wyniku współpracy pomiędzy RENCI i SESYNC. Misją WSSI jest „umożliwianie i przyspieszanie nowych, transformacyjnych nauk o wodzie poprzez jednoczesne przekształcanie zarówno kultury oprogramowania, jak i kultury badawczej społeczności zajmującej się naukami o wodzie”. Kiedy WSSI osiągnie pełną funkcjonalność, zamierza działać w ramach modelu otwartego zaangażowania społeczności, który zintegruje wiele inicjatyw finansowanych przez NSF (centra syntezy, obserwatoria środowiska, instytuty zajmujące się zrównoważonym rozwojem oprogramowania itp.) w celu destylacji danych, pomysłów, teorii i metod i w ten sposób zapewnić syntetyczne informacje umożliwiające sprostanie wyzwaniom związanym z naukami o wodzie, którym nie można sprostać przy użyciu tradycyjnych metod dyscyplinarnych. Działalność WSSI koncentruje się na rozwoju otwartej społeczności oraz promowaniu otwartego i zwinnego tworzenia oprogramowania w celu przyspieszenia rewolucyjnych badań w zakresie nauk o wodzie. Oprócz RENCI i SESYNC do obecnych członków należą Instytut Środowiska UNC-CH, Uniwersytet Illinois Urbana-Champaign , Uniwersytet Michigan , Uniwersytet Maryland , NCSA, RedHat , National Oceanic and Atmospheric Administration oraz IBM .
NCDS
NCDS zostało założone przez RENCI w lutym 2013 r. jako partnerstwo publiczno-prywatne wiodących uniwersytetów, agencji rządowych i non-profit oraz przedsiębiorstw zajmujących się rozwojem nauki o danych, którą NCDS definiuje jako „systematyczne badanie organizacji i wykorzystania zasobów cyfrowych danych, aby przyspieszyć odkrywanie, usprawnić krytyczne procesy decyzyjne i umożliwić gospodarkę opartą na danych”. Misją NCDS jest „zapewnienie podstaw niezbędnych do rozwoju badań nad danymi, edukacji i możliwości gospodarczych”. NCDS realizuje tę misję, zapewniając intelektualne przywództwo i organizując liczne warsztaty, stypendium akademickie i branżowe, serię letnich krótkich kursów Data Matters, wydarzenia związane z karierą studencką, wykłady z udziałem zaproszonych osób i spotkania na szczycie. Ponadto NCDS sponsoruje Obserwatorium Danych, które zapewnia wspólną stowarzyszoną infrastrukturę do udostępniania danych i przetwarzania danych. NCDS współpracuje także z licznymi regionalnymi działaniami w dziedzinie nauki o danych, w tym z Datapalooza, Triangle Open Data Day, Pearl Hacks, Data4Decisions, Analytics Forward UnConference i innymi. Według stanu na czerwiec 2015 r. NCDS składa się z 15 organizacji członkowskich, z których 8 ma siedzibę w Północnej Karolinie, a 4 międzynarodowe firmy są silnie obecne na rynku Research Triangle Park , obszar Karoliny Północnej.
Konsorcjum iRODS
Konsorcjum iRODS zostało założone przez RENCI w marcu 2013 r., a jego siedziba znajduje się w RENCI, podobnie jak główny zespół programistów iRODS. Misją konsorcjum jest „zapewnienie trwałości zintegrowanego systemu danych zorientowanego na reguły (iRODS) oraz dalsze jego przyjęcie i ciągła ewolucja”. Aby osiągnąć swoją misję, konsorcjum pracuje nad opracowaniem standardów technologii open source iRODS i jej przyszłym rozwojem, promowaniem postępu w tej technologii i poszerzaniem bazy użytkowników. Konsorcjum wspiera także rozwój krytycznej dla firmy wersji produkcyjnej iRODS (obecnie v4.1). Konsorcjum iRODS składa się z różnorodnych członków organizacji użytkowników iRODS z całego świata. Obecni członkowie konsorcjum to RENCI, centra DICE w UNC-CH i Uniwersytet Kalifornijski w San Diego, DataDirect Networks , Seagate Technology , Wellcome Trust Sanger Institute , Cleversafe , EMC Corporation (EMC2), IBM i NASA’s Atmospheric Science Data Center.