SNED1

SNED1 (Domeny Sushi, Nidogen i EGF-like) jest białkiem macierzy zewnątrzkomórkowej (ECM) wyrażanym na niskim poziomie w wielu różnych tkankach. Gen kodujący SNED1 znajduje się w ludzkim chromosomie 2 w locus q37.3. Odpowiedni mRNA wyizolowany ze śledziony ma długość 6834 pz, a odpowiadające białko ma długość 1413 aminokwasów . Mysi ortolog SNED1 został sklonowany w 2004 roku z embrionalnej nerki przez Leimestera i in. SNED1 przedstawia domeny charakterystyczne dla białek ECM, w tym domenę NIDO na końcu aminowym, kilka domen podobnych do EGF wiążących wapń (EGF_CA), domena Sushi znana również jako domena białka kontrolującego dopełniacz (CCP) i trzy domeny fibronektyny typu III ( FN3 ) w regionie karboksy-końcowym.

Gen

Umiejscowienie

SNED1 znajduje się na nici dodatniej chromosomu 2 w locus 2q37.3. Numer identyfikacyjny Refseq to NM_001080437.3 Sekwencja genomowego DNA SNED1 zawiera 98 159 pz, a najdłuższy splicing mRNA, jak przewiduje AceView, ma 7048 pz i zawiera 31 eksonów. Istnieje 9 przewidywanych wariantów splicingowych SNED1, które wykazywały dopasowanie struktury białka przy użyciu bazy danych Phyre 2, która jest omówiona w części „Struktura trzeciorzędowa i czwartorzędowa”.

Popularne pseudonimy

SNED1 to skrót od Sushi, Nidogen, and EGF-like Domains 1. Przestarzałe aliasy SNED1 to Snep, SST3 i IRE-BP1.

Homologia/ewolucja

Homologie i filogeneza

SNED1 jest wysoce konserwatywny w całej historii ewolucji i wykazano, że wykazuje tę ochronę u kręgowców, w tym u ryb, gadów, płazów, ptaków i ssaków. Nie jest jasne, czy SNED1 jest konserwowany u bezkręgowców, ale domeny białkowe znalezione w SNED1 występują również u bezkręgowców. Warto zauważyć, że obfitość reszt cysteinowych, głównie zlokalizowanych w domenach podobnych do EGF, gdzie tworzą wiązania dwusiarczkowe, wydaje się być bardzo konserwatywna, co sugeruje, że bogactwo cysteiny jest bardzo ważną cechą tego białka.

Paralogi

SNED1 ma kilka paralogów w ludzkim genomie, które obejmują małe części całej sekwencji peptydowej. Geny kodujące białka dzielące domeny (podobne do EGF, Sushi) z SNED 1 obejmują białka neurogennego locus notch homolog (NOTCH), postrzępione białka, białka homologiczne z zamkniętymi oczami, białka homologiczne okruchów, receptory naskórkowego czynnika wzrostu podobne do delta i karbu, białko czynnika A sushi von Wilebranda (SVEP1) i trzy homologiczne białko szczeliny.

Białko

Rycina 3. Najdłuższa ORF SNED1 została znaleziona i przetłumaczona za pomocą narzędzia na stole warsztatowym biologii SDSC, a domeny będące przedmiotem zainteresowania znalezione w NCBI zostały opatrzone adnotacjami wraz z kilkoma strukturami drugorzędowymi i modyfikacjami potranslacyjnymi.

Sekwencja pierwotna

Baza danych wiedzy o białkach, UniProt, donosi, że pełnej długości białko SNED1 ma długość 1413 aminokwasów ( UniProt Q8TER0 ).

Dostęp do pełnej sekwencji uzyskanej przez przeszukiwanie NCBI BLAST można uzyskać za pomocą identyfikatora referencyjnego NP_001073906.1 . Jedną przypuszczalnie ważną cechą tego białka, na którą warto zwrócić uwagę, jest to, że jest ono wyjątkowo bogate w cysteinę, w sumie zawiera 107 cystein, co daje ogólny skład cysteiny na poziomie 13,2%.

Domeny i motywy

SNED1 jest wydzielanym białkiem macierzy pozakomórkowej. Zawiera peptyd sygnałowy (aminokwasy 1-24) kierujący białko na szlak wydzielniczy.

Precyzyjne przewidywanie granic domen można uzyskać za pomocą bazy danych domen InterPro lub SMART .

Istnieje wiele interesujących domen w tym białku. Pierwsza w opisanej powyżej sekwencji, pokazana na różowo, to domena NIDO , znajdująca się również w białku Nidogen-1, znanym również jako entaktyna . Poza SNED1, ta domena jest wspólna tylko dla czterech ludzkich białek: białek błony podstawnej nidogen-1, nidogen-2 i alfa-tektoryna; i mucyna-4, która, jak wykazano, odgrywa rolę w promowaniu przerzutów raka trzustki.

Drugie interesujące regiony zaznaczone podkreśleniem to domena EGF wiążąca wapń (EGF-CA). Istnieje wiele takich domen w sekwencji i często są one obecne w dużej liczbie białek związanych z błoną i zewnątrzkomórkowych. Te domeny EGF-CA mogą sugerować „lepki” charakter tego białka, ponieważ często macierzy zewnątrzkomórkowej (ECM) wymagają kationów wapnia do tworzenia homo- i heterodimerycznych kompleksów między innymi białkami ECM. Domena Sushi lub białko kontrolne dopełniacza Motyw (CCP) jest zaznaczony na rysunku kolorem zielonym, a domenę tę zidentyfikowano w wielu białkach zaangażowanych w układ dopełniacza. Inne aliasy dla tej domeny obejmują krótkie powtórzenia konsensusowe (SCR) i domenę Sushi , od której białko bierze swoją nazwę. Domena fibronektyny typu III (FN3) jest zaznaczona na niebiesko, a obecność tej domeny może sugerować jedną z właściwości tego białka jako zaangażowaną w adhezję komórek. SNED1 zawiera sekwencję RGD i LDV, ważną w wiązaniu innych białek ECM z integrynami które są białkami znajdującymi się w błonach komórkowych, pośredniczą w interakcjach komórka-ECM.

Modyfikacje potranslacyjne

W sekwencji SNED1 przewidziano 13 miejsc N-glikozylacji, a obecność miejsc N-glikozylacji określono eksperymentalnie. SNED1 ma również kilka przewidywanych miejsc przyłączania dla O-glikanów i glikozaminoglikanów, ale nie zostały one jeszcze potwierdzone eksperymentalnie w tym czasie.

Było tylko kilka miejsc fosforylacji zależnej od kinazy potranslacyjnej, które były warte odnotowania i dały wynik > 0,8 w programie NetPhosK w narzędziach proteomicznych pakietu ExPASy Bioinformatics. Strony te są oznaczone żółtym podświetleniem w powyższym tłumaczeniu koncepcyjnym. Przewiduje się, że wszystkie te miejsca będą fosforylowane przez kinazę białkową A (PKA) lub kinazę białkową C (PKC). Istnieją dowody eksperymentalne na fosforylację przy 12 resztach: 5 resztach seryny, 5 treoninie i 2 resztach tyrozyny.

Struktura drugorzędowa

Sekwencja aminokwasowa najdłuższego wariantu jest niewiarygodnie bogata w cysteinę, co prawdopodobnie prowadzi do powstania dużej ilości wiązań dwusiarczkowych. Arkusze beta są oznaczone fioletowym tekstem w tłumaczeniu pojęciowym, a helisy alfa są oznaczone czerwonym tekstem.

Odsetek zaburzeń wewnętrznych przetworzonego ludzkiego SNED1 (reszty 25–1413) przewidywany przez IUPred2A wynosi 15,3%. Duży odsetek kłębków losowych (73%) przewidziano w SNED1 wraz z 26% nici β i 1% helisy odpowiadającej sekwencji znalezionej w regionie końca aminowego SNED1

Struktura trzeciorzędowa i czwartorzędowa

[Ta sekcja wymaga odniesienia do rysunków i eksperymentalnej demonstracji] Program Phyre2 został użyty do skonstruowania przewidywań zarówno konserwatywnych regionów domen NIDO, CCP i FN3, jak i każdego z wariantów składania. Uzyskano kilka interesujących wyników zgodnych z proponowaną funkcją pozakomórkowego „lepkiego” białka, prawdopodobnie zaangażowanego w adhezję komórka-komórka lub w krzepnięcie. Dopasowania białek znalezione w Phyre2 obejmują szereg białek o funkcjach; krzepnięcie, hydroliza, aktywacja plazminogenu, hormon/czynnik wzrostu, wiązanie białek, adhezja komórkowa i białka ECM. Warianty składania a, b i e mają > 99% podobieństwa strukturalnego do białka neureksyny 1-alfa ( NRXN1 ). Neureksyny są cząsteczkami adhezyjnymi do komórek i często zawierają domeny wiążące EGF, wzmacniające tworzenie połączeń wewnątrzkomórkowych między komórkami. Proponuje się również, aby NRXN1 odgrywał rolę w angiogenezie. Alfa-neureksyny wchodzą w interakcje z neureksofilinami i prawdopodobnie działają w połączeniach synaptycznych układu nerwowego kręgowców. Alfa neureksyny często wykorzystują alternatywne promotory i miejsca składania, w wyniku czego powstaje wiele różnych transkryptów z jednego genu, co może być wyjaśnieniem obfitości alternatywnych transkryptów tego genu. Wariant składania d ma 100% dopasowanie strukturalne do białka związanego z receptorem lipoprotein o niskiej gęstości 4 (LRP4). Białko to bierze udział w hamowaniu tworzenia kości za pośrednictwem SOST i hamowaniu sygnalizacji Wnt. LRP4 odgrywa ważną rolę w tworzeniu połączeń nerwowo-mięśniowych. Warianty składania f i g mają >99% podobieństwa do fibryliny-1 , białka ECM, które jest strukturalnym składnikiem mikrofibryli wiążących wapń. Wariant składania i i konserwowana domena CCP są strukturalnie podobne w ponad 99% do aktywatora t-plazminogenu (PLAT). PLAT jest wydzielany przez komórki śródbłonka naczyń i działa jako proteaza serynowa, która przekształca plazminogen w plazminę. Plazmina jest fibrolitykiem enzym, który pomaga w rozpadzie skrzepów krwi i jest stosowany klinicznie dokładnie w tym celu. Konserwowana domena NIDO była >99% podobna do czynnika krzepnięcia IX, znanego również jako czynnik IX (F9). F9 jest wydzielanym czynnikiem krzepnięcia zaangażowanym w kaskadę krzepnięcia, która wymaga aktywacji przez wiele innych czynników krzepnięcia w ramach kaskady. Trzy kolejne konserwowane domeny FN3 razem są w 100% podobne ze 100% pokryciem do anosminy 1 . Anosmina-1 jest glikoproteiną ECM odpowiedzialną za prawidłowy rozwój neuronów mózgu, rdzenia kręgowego i nerek.

Białka oddziałujące

Przewidywanie obliczeniowe za pomocą kilku baz danych, skupiające się na białkach wydzielanych i białkach błonowych, zaowocowało przewidywaniem 114 unikalnych interakcji za pomocą co najmniej jednego algorytmu, w tym autointerakcji SNED1. Ponad połowa partnerów białkowych SNED1 została opisana jako białka błonowe w UniProtKB. Zidentyfikowano 47 białek zewnątrzkomórkowych jako partnerów wiążących SNED1, w tym 30 rdzeniowych białek matrisomu, 10 białek związanych z matrisomem i siedem białek wydzielanych. Wśród 30 białek matrisomów jest 6 kolagenów : COL6A3, znaleziony w błonach podstawnych i innych ECM, COL7A1 i kolageny związane z fibrylami z przerwanymi potrójnymi helisami (FACITS), wszystkie zawierające domenę trombospondyny, COL12A1, COL14A1, COL16A1, COL20A1); oraz szereg glikoprotein ECM: 4 tenascyny (TNC, TNN, TNR i TNXB), fibronektyna (FN1), utajone białko wiążące TGFβ 2 (LTBP2) i glikoproteiny błony podstawnej nidogeny 1 i 2 .

Niezależnie, baza danych STRING-Known and Predicted Protein Interaction została wykorzystana do określenia białek, które mogą wchodzić w interakcje, a następujące białka były kandydatami do interakcji: somatostatyna (SST), receptor somatostatyny 2 (SSTR2), a także szereg innych receptorów somatostatyny, syntaza sperminy (SMS) i TMEM132C. Wszystkie białka związane z somatostatyną biorą udział w hamowaniu hormonów. Niewiele wiadomo o TMEM132C, a wszystkie publikacje związane z tym białkiem to masowe badania genomu. Profile ekspresji białek TMEM132C i SNED1 są bardzo podobne do SNED1, z obfitością białka występującą w osoczu krwi, płytkach krwi i wątrobie. Wszystkie opisane białka oddziałujące ulegają ekspresji w tych trzech wspólnych obszarach.

Wyrażenie

SNED1 jest wszechobecnie wyrażany na niskim lub średnim poziomie w tkankach dorosłych, co sprawia, że z profili ekspresji RNA nie jest jasne, które komórki wydzielają SNED1 w tkankach. Dane eksperymentalne uzyskane na myszach wykazały, że Sned1 promotor jest szeroko aktywny podczas embriogenezy, szczególnie w pąkach kończyn, ogonie, sklerotomie, kręgowcach i żebrach, płucach, nerkach, nadnerczach, móżdżku, splocie naczyniówkowym i mezenchymie głowy. Profile ekspresji białek SNED1 przewidywane za pomocą bazy danych MOPED-Multi-Omics Profiling Expression Database i bazy danych PaxB-Protein Abundance Across Organisms wskazują, że białko znajduje się w surowicy krwi, osoczu krwi, limfocytach T krwi, płytkach krwi, nerkach Komórki Hek-293, wątroby i niski poziom w mózgu.

Warianty transkrypcji

Do przewidywania wariantów transkryptu zastosowano program Aceview, pokazany na rycinie 6. Istnieje 9 form złożonych i 3 formy nieskładane. Trzy warianty transkryptu, b, c i e, zawierają zielone regiony reprezentujące uORF , które wskazują, że zawierają elementy regulatorowe w regionie kodującym transkryptu. Wszystkie splicowane warianty transkryptu ai przeanalizowano za pomocą serwera Phyre2, aby przewidzieć strukturę białka. Zobacz „Struktura trzeciorzędowa i czwartorzędowa”. Istnienie wariantów składania nie zostało jeszcze potwierdzone eksperymentalnie.

Promotor

Promotor przewidywano i analizowano pod kątem miejsc wiązania czynnika transkrypcyjnego przy użyciu oprogramowania ElDorado w pakiecie oprogramowania Genomatix. Istniały alternatywne promotory poniżej wybranego promotora 845 bp.

Czynniki transkrypcyjne

Stwierdzono następujące czynniki transkrypcyjne z podobieństwem macierzy 1,00 i dopasowano całą domenę wiążącą w przewidywanym promotorze ElDorado.

Rodzina Matrixa	Szczegółowe informacje o rodzinie	Matryca	Szczegółowe informacje o matrycy	Pasmo	Podobieństwo macierzy	Sekwencja
BRAC	Gen Brachyury, czynnik rozwojowy mezodermy	TBX20.01	Czynnik transkrypcyjny T-box TBX20	(-)	1.00	gcatcgcggAGGTgtgcgggcgg
TF2B	Czynnik transkrypcyjny II polimerazy RNA II B	BRE.01	Element rozpoznający czynnik transkrypcyjny II B (TFIIB).	(-/+)	1.00	ccgCGCC
XCPE	Element promotora rdzenia zależnego od aktywatora, mediatora i TBO do transkrypcji polimerazy RNA II z promotora bez TATA	XCPE1.01	Element promotora rdzenia genu X 1	(-)	1.00	ggGCGGgaccg
ZF02	Czynniki transkrypcyjne palca cynkowego C2H2 2	ZKSCAN3.01	Palec cynkowy z domenami KRAB i SCAN 3	(+)	1.00	catggCCCCaccacagggcgcgc
SP1F	Współczynniki GC-Box SP1/GC	SP1.03	Pobudzające białko 1, wszechobecny czynnik transkrypcyjny palca cynkowego	(-)	1.00	cggggGGGCggggccat
PLAG	Gen gruczolaka pleomorficznego	PLAG1.02	Gen gruczolaka pleomorficznego 1	(+)	1.00	aaGGGGgcagcacggaacgggtt

Funkcje białek i znaczenie kliniczne

Wybrane przypadki w GeoProfiles NCBI uwydatniły niektóre istotne klinicznie dane dotyczące ekspresji dotyczące poziomów ekspresji SNED1 w odpowiedzi na określone warunki. W gruczolaku produkującym aldosteron w porównaniu z kontrolną tkanką płuc, ekspresja SNED1 zmniejszyła się około 25-krotnie w tkance gruczolaka. W badaniu rozwojowym dotyczącym przejścia od prekursorów oligodendrocytów do dojrzałych oligodendrocytów ekspresja zmniejszyła się prawie 100-krotnie po różnicowaniu w dojrzałe oligodendrocyty. Interesujące może być zbadanie ekspresji w zaburzeniach krzepnięcia lub innych chorobach związanych z krwią. Przełomowe badanie opublikowane w 2014 roku wykazało, że SNED1 był promotorem przerzutów raka piersi.

Najnowsza generacja modelu myszy z nokautem Sned1 rzuca również światło na wiele ról SNED1 w rozwoju i fizjologii. Globalny nokaut Sned1 prowadzi do wczesnej śmiertelności poporodowej i poważnych anomalii twarzoczaszki i szkieletu, co wskazuje, że Sned1 jest niezbędnym genem.