Baza danych identyfikacyjnych proteomiki

PRIDE (baza danych PROteomics IDentifications) to publiczne repozytorium danych proteomicznych opartych na spektrometrii masowej (MS) , prowadzone przez Europejski Instytut Bioinformatyki w ramach Zespołu Proteomiki.

Pierwotnie zaprojektowany przez Lennarta Martensa w 2003 roku podczas pobytu w Europejskim Instytucie Bioinformatyki jako stypendysta Komisji Europejskiej Marie Curie w programie „Jakość życia” (numer umowy: QLRI-1999-50595), PRIDE powstał jako usługa produkcyjna w 2005 r. Oryginalny dokument wniosku o dotację z czerwca 2013 r. na rozpoczęcie budowy PRIDE został od tego czasu opublikowany w artykule przedstawiającym poglądy. Zbudowano kilka podobnych baz danych proteomicznych, w tym GPMDB, PeptideAtlas , Proteinpedia i NCBI Peptidome.

Baza danych PRIDE stanowi ustrukturyzowane repozytorium danych i przechowuje oryginalne dane eksperymentalne pochodzące od badaczy, bez kontroli redakcyjnej nad przesłanymi danymi.

W sumie PRIDE zawiera dane dotyczące około 60 gatunków, z których największa część pochodzi z próbek ludzkich (w tym dane z dwóch projektów ludzkich proteomów), a następnie muszki owocowej Drosophila melanogaster i myszy.

Formaty i proces składania

Ponieważ obecnie nie można pozyskać szczegółowych danych proteomicznych z istniejącej literatury, źródłem danych PRIDE są wyłącznie zgłoszenia badaczy akademickich.

PRIDE jest repozytorium publicznym zgodnym ze standardami, co oznacza, że ​​jego własny, oparty na XML format wymiany danych dla zgłoszeń, PRIDE XML, został zbudowany w oparciu o standard mzData dla spektrometrii mas opracowany przez Proteomics Standards Initiative . Niedawno PRIDE został przystosowany do pracy z nowoczesnymi standardami mzML i mzIdentML Inicjatywy na rzecz Standardów Proteomicznych . Dodatkowy format, nazwany mzTab, może być stosowany jako uproszczony sposób przesyłania ilościowych danych proteomicznych.

Ponieważ na rynku dostępnych jest obecnie wiele rodzajów różnych przyrządów do spektrometrii mas i formatów oprogramowania, naukowcy pracujący w mokrych laboratoriach, nieposiadający dużego doświadczenia bioinformatycznego ani wsparcia informatycznego, mieli problemy z konwersją swoich danych do formatu PRIDE XML. Rozwój konwertera PRIDE pomógł stawić czoła tej sytuacji. Konwerter PRIDE to narzędzie napisane w języku programowania Java , które konwertuje 15 różnych wejściowych formatów danych spektrometrii mas do formatu PRIDE XML za pomocą graficznego interfejsu użytkownika przypominającego kreator. Jest ogólnodostępny i stanowi oprogramowanie typu open source w ramach liberalnej licencji Apache . Nowa wersja PRIDE Converter została wydana w 2012 roku jako PRIDE Converter 2. Ta nowa wersja stanowiła całkowitą przeróbkę, skupiającą się na łatwej adaptacji do różnych (i ewoluujących) źródeł danych.

Przeglądanie, wyszukiwanie i eksploracja danych PRIDE

Obecnie dane można przeszukiwać z PRIDE poprzez interfejs sieciowy PRIDE, poprzez niezależnego klienta Java PRIDE Inspector lub łączyć bezpośrednio z kilkoma wyszukiwarkami poprzez PeptideShaker. Co więcej, nowe API RESTful umożliwia wygodny programowy dostęp do archiwum PRIDE.

Szerokie wykorzystanie słowników kontrolowanych (CV) i ontologii do elastycznych, ale kontekstowych adnotacji do danych, wraz z możliwością wykonywania inteligentnych zapytań za pomocą tych adnotacji, to kluczowe cechy PRIDE.

Zaangażowanie w ProteomeXchange

Konsorcjum ProteomeXchange utworzono, aby zapewnić skoordynowane przesyłanie danych proteomicznych z państw członkowskich do głównych istniejących repozytoriów proteomicznych oraz zachęcać do optymalnego rozpowszechniania danych. Konsorcjum obejmuje kilka baz danych członkowskich, w tym PRIDE i PeptideAtlas . Najwcześniejsza koncepcja ProteomeXchange wywodzi się ze spotkania na HUPO 2005 w Monachium, podczas którego główne repozytoria danych proteomicznych w tamtym czasie zgodziły się co do zasady na wymianę swoich danych, zapewniając w ten sposób użytkownikowi możliwość znalezienia publicznych danych proteomicznych w dowolnym z uczestniczące bazy danych. Ze względu na szybki rozwój tej dziedziny i potrzebę opracowania odpowiednich standardów wymiany danych, od tego spotkania faktyczne wdrożenie tego systemu zajęło prawie dziesięć lat, a wysiłek ten został sfinansowany z dotacji na działanie koordynacyjne „ProteomeXchange” przyznanej przez Uniwersytet Siódmy program ramowy Komisji Europejskiej.

Odzyskiwanie danych po zaprzestaniu stosowania Peptidome

Baza danych NCBI Peptidome została wycofana w 2011 r., jednak wspólny wysiłek zespołów PRIDE i Peptidome zaowocował przeniesieniem wszystkich danych Peptidome do PRIDE.

Linki zewnętrzne