Baza danych identyfikacyjnych proteomiki
PRIDE (baza danych PROteomics IDentifications) to publiczne repozytorium danych proteomicznych opartych na spektrometrii masowej (MS) , prowadzone przez Europejski Instytut Bioinformatyki w ramach Zespołu Proteomiki.
Pierwotnie zaprojektowany przez Lennarta Martensa w 2003 roku podczas pobytu w Europejskim Instytucie Bioinformatyki jako stypendysta Komisji Europejskiej Marie Curie w programie „Jakość życia” (numer umowy: QLRI-1999-50595), PRIDE powstał jako usługa produkcyjna w 2005 r. Oryginalny dokument wniosku o dotację z czerwca 2013 r. na rozpoczęcie budowy PRIDE został od tego czasu opublikowany w artykule przedstawiającym poglądy. Zbudowano kilka podobnych baz danych proteomicznych, w tym GPMDB, PeptideAtlas , Proteinpedia i NCBI Peptidome.
Baza danych PRIDE stanowi ustrukturyzowane repozytorium danych i przechowuje oryginalne dane eksperymentalne pochodzące od badaczy, bez kontroli redakcyjnej nad przesłanymi danymi.
W sumie PRIDE zawiera dane dotyczące około 60 gatunków, z których największa część pochodzi z próbek ludzkich (w tym dane z dwóch projektów ludzkich proteomów), a następnie muszki owocowej Drosophila melanogaster i myszy.
Formaty i proces składania
Ponieważ obecnie nie można pozyskać szczegółowych danych proteomicznych z istniejącej literatury, źródłem danych PRIDE są wyłącznie zgłoszenia badaczy akademickich.
PRIDE jest repozytorium publicznym zgodnym ze standardami, co oznacza, że jego własny, oparty na XML format wymiany danych dla zgłoszeń, PRIDE XML, został zbudowany w oparciu o standard mzData dla spektrometrii mas opracowany przez Proteomics Standards Initiative . Niedawno PRIDE został przystosowany do pracy z nowoczesnymi standardami mzML i mzIdentML Inicjatywy na rzecz Standardów Proteomicznych . Dodatkowy format, nazwany mzTab, może być stosowany jako uproszczony sposób przesyłania ilościowych danych proteomicznych.
Ponieważ na rynku dostępnych jest obecnie wiele rodzajów różnych przyrządów do spektrometrii mas i formatów oprogramowania, naukowcy pracujący w mokrych laboratoriach, nieposiadający dużego doświadczenia bioinformatycznego ani wsparcia informatycznego, mieli problemy z konwersją swoich danych do formatu PRIDE XML. Rozwój konwertera PRIDE pomógł stawić czoła tej sytuacji. Konwerter PRIDE to narzędzie napisane w języku programowania Java , które konwertuje 15 różnych wejściowych formatów danych spektrometrii mas do formatu PRIDE XML za pomocą graficznego interfejsu użytkownika przypominającego kreator. Jest ogólnodostępny i stanowi oprogramowanie typu open source w ramach liberalnej licencji Apache . Nowa wersja PRIDE Converter została wydana w 2012 roku jako PRIDE Converter 2. Ta nowa wersja stanowiła całkowitą przeróbkę, skupiającą się na łatwej adaptacji do różnych (i ewoluujących) źródeł danych.
Przeglądanie, wyszukiwanie i eksploracja danych PRIDE
Obecnie dane można przeszukiwać z PRIDE poprzez interfejs sieciowy PRIDE, poprzez niezależnego klienta Java PRIDE Inspector lub łączyć bezpośrednio z kilkoma wyszukiwarkami poprzez PeptideShaker. Co więcej, nowe API RESTful umożliwia wygodny programowy dostęp do archiwum PRIDE.
Szerokie wykorzystanie słowników kontrolowanych (CV) i ontologii do elastycznych, ale kontekstowych adnotacji do danych, wraz z możliwością wykonywania inteligentnych zapytań za pomocą tych adnotacji, to kluczowe cechy PRIDE.
Zaangażowanie w ProteomeXchange
Konsorcjum ProteomeXchange utworzono, aby zapewnić skoordynowane przesyłanie danych proteomicznych z państw członkowskich do głównych istniejących repozytoriów proteomicznych oraz zachęcać do optymalnego rozpowszechniania danych. Konsorcjum obejmuje kilka baz danych członkowskich, w tym PRIDE i PeptideAtlas . Najwcześniejsza koncepcja ProteomeXchange wywodzi się ze spotkania na HUPO 2005 w Monachium, podczas którego główne repozytoria danych proteomicznych w tamtym czasie zgodziły się co do zasady na wymianę swoich danych, zapewniając w ten sposób użytkownikowi możliwość znalezienia publicznych danych proteomicznych w dowolnym z uczestniczące bazy danych. Ze względu na szybki rozwój tej dziedziny i potrzebę opracowania odpowiednich standardów wymiany danych, od tego spotkania faktyczne wdrożenie tego systemu zajęło prawie dziesięć lat, a wysiłek ten został sfinansowany z dotacji na działanie koordynacyjne „ProteomeXchange” przyznanej przez Uniwersytet Siódmy program ramowy Komisji Europejskiej.
Odzyskiwanie danych po zaprzestaniu stosowania Peptidome
Baza danych NCBI Peptidome została wycofana w 2011 r., jednak wspólny wysiłek zespołów PRIDE i Peptidome zaowocował przeniesieniem wszystkich danych Peptidome do PRIDE.