SOGA2

Identyfikatory
MTCL1
, CCDC165, KIAA0802, SOGA2, czynnik sieciowania mikrotubul 1
Identyfikatory zewnętrzne
ortologi
Gatunek Człowiek Mysz
Entrez
Ensembl
UniProt
RefSeq (mRNA)

RefSeq (białko)

Lokalizacja (UCSC)
PubMed search
Wikidane
Wyświetl/edytuj człowieka Wyświetl/edytuj mysz

SOGA2 , znany również jako supresor związanej z autofagią glukozy 2 lub CCDC165 , jest białkiem , które u ludzi jest kodowane przez gen SOGA2 . SOGA2 ma dwóch ludzkich paralogów , SOGA1 i SOGA3 . U ludzi sekwencja kodująca gen ma długość 151 349 par zasad, mRNA ma 6092 par zasad, a sekwencja białkowa ma 1586 aminokwasów. Gen SOGA2 jest konserwowany u goryla, pawiana, galago, szczura, myszy, kota i innych. Istnieje odległa ochrona obserwowana w organizmach, takich jak zięby zebry i anole. SOGA2 ulega wszechobecnej ekspresji u ludzi, ze szczególnie wysoką ekspresją w mózgu (zwłaszcza móżdżku i hipokampie), jelicie grubym, przysadce mózgowej, jelicie cienkim, rdzeń kręgowy , jądra i mózg płodu.

Gen

Umiejscowienie

SOGA2 znajduje się od 8717369 do 8832775 na krótkim ramieniu chromosomu 18 (18p11.22).

Homologia i ewolucja

Paralogi

Istnieją dwa główne paralogi SOGA2: ludzkie białko SOGA1 i ludzkie białko SOGA3 . Wykazano, że SOGA1 bierze udział w supresji glukozy przez autofagię. Szybkość, z jaką ortologi odbiegają od człowieka SOGA2 (mierzona jako % identyczności), określa przybliżone zdarzenie duplikacji SOGA1 z SOGA2 na ~ 254,1 MYA, a zdarzenie duplikacji SOGA3 z SOGA2 ~ 329,1 MYA.

nazwa białka numer dostępowy długość sekwencji (aa) identyczność sekwencji z ludzkim białkiem notatki
SOGA3 NP_001012279.1 947 58% konserwowane w ~ 500 N-końcowych aa
SOGA1 izoforma 2 NP_954650.2 1016 aa 65% konserwowane w pierwszych ~ 900 aa
SOGA1 izoforma 1 NP_542194.2 1661 41% konserwowane na całej długości sekwencji z wyjątkiem ~ 950-1150

ortologi

U eukariontów zidentyfikowano wiele ortologów.

Nazwa zwyczajowa nazwa białka rozbieżność z linii ludzkiej (MYA) numer dostępowy długość sekwencji (aa) identyczność sekwencji z ludzkim białkiem różnice w domenach białkowych
goryl białko SOGA2 8.8 XP_004059220.1 1586 99%
pawian białko SOGA2 29 XP_003914218 1587 98%
galago białko SOGA3 74 XP_003801047.1 1583 88% Brak DUF4201
szczur CCDC165 92,3 XP_237548.6 2060 81% Brak DUF4201
mysz SOGA2 92,3 NP_001107570.1 1893 80%
kot domowy białko SOGA2 94,2 XP_003995077.1 1700 84% Brak DUF4201
krowa CCDC166 94,2 XP_581047.5 1525 74% Brak DUF4201
Słoń afrykański CCDC167-podobny 98,7 XP_003406836.1 1544 73%
zebry Finch białko SOGA2 296 XP_002193121.1 1598 69% Brak DUF4201
Ptactwo Czerwonej Dżungli CCDC165 296 XP_423729.3 1600 70% Brak DUF4201
Anol Karolina niescharakteryzowane białko podobne do KIAA0802 296 XP_003225723.1 1839 67% Brak DUF4201
Wykres identyczności sekwencji z ludzkim SOGA2 w funkcji czasu rozbieżności ortologów ludzkiego SOGA2.

Odległe homologi

Nazwa zwyczajowa nazwa białka rozbieżność z linii ludzkiej (MYA) numer dostępowy długość sekwencji (aa) identyczność sekwencji z ludzkim białkiem różnice w domenach białkowych
Tropikalna żaba szponiasta niescharakteryzowane białko podobne do C20orf117 371,2 XP_002942331.1 1584 39%
fioletowy jeżowiec niescharakteryzowane białko LOC578090 742,9 XP_783370.2 1587 47% Brak DUF4201
wszy ciała Centromerowe białko E, domniemane 782,7 XP_002429877.1 2086 30% brak współdzielonych domen
południowy komar domowy hipotetyczne białko konserwowane 782,7 XP_001843754.1 1878 32% brak współdzielonych domen
wieprzowina białko z rodziny powtórzeń antygenu powierzchniowego 937,5 XP_003380263.1 2030 36% brak współdzielonych domen

Domeny homologiczne

SOGA2 jest konserwowana najdalej wstecz w swoim regionie N-końcowym, gdzie zawiera trzy domeny o nieznanej funkcji.

Porównanie dopasowania wielu sekwencji regionów N-końcowych z regionami C-końcowymi daleko spokrewnionych ortologów SOGA2. Tutaj wykazano, że region N-końcowy jest dobrze konserwowany w organizmach, takich jak żaba szponiasta (FROG_SOGA2), ale region C-końcowy nie. Lokalizacja 19 jest przykładem jednej z 7 reszt leucyny, która jest konserwowana we wszystkich ortologach.

Białko

Skład wewnętrzny białka

SOGA2 jest bogaty w glicynę (stosunek składu SOGA2 do przeciętnego białka ludzkiego wynosi 1,723), glutaminian (r = 1,647) i argininę (r = 1,357). Ma również niższy niż zwykle skład tyrozyny (r = 0,3406), izoleucyny (r = 0,4430), fenyloalaniny (r = 0,5808) i waliny (r = 0,6161).

Struktura pierwotna i izoformy

SOGA2 ma 4 izoformy: Q9Y4B5-1, Q9Y4B5-2, Q9Y4B5-3, Q9Y4B5-4.

Grafika przedstawiająca 4 różne izoformy SOGA2. Izoforma 1 jest kanoniczna. Klucz modyfikacji: * E → ELRGPPVLPEQSVSIEELQGQLVQAARLHQEETETFTNKIHK **Q → QNCCGYPRINIEEETLGFTRLPAGSTVKTLKSLGLQRLE *** NQTVLLTAPWGL → ELPCSALAPS...LHGLSQYNSL

Domeny i motywy

SOGA2 zawiera domenę nieznanej funkcji 4201 (DUF4201) z aa 16-235. Ta domena jest specyficzna dla rodziny białek zawierających domenę zwiniętej cewki u eukariontów. Zawiera również dwie kopie Domain of Unknown Function 3166 (DUF3166): jedną z aa 140-235 i jedną z aa 269-364.

Modyfikacje potranslacyjne

Oczekuje się, że SOGA2 przejdzie szereg modyfikacji potranslacyjnych. Modyfikacje ludzkiego SOGA2, które są wspólne dla ortologów, obejmują:

  • Sumoilacja przy aminokwasach 87, 152, 235, 392 i 1379.
  • Sulfinowanie przy tyrozynach 14 i 1249.
  • Fosforylacja w wielu miejscach, zaznaczona na poniższej grafice:
Miejsca fosforylacji w SOGA2 przewidywane przez netPhos. Wyróżnione miejsca są chronione już od afrykańskich żab szponiastych.

Struktura drugorzędowa

Konsensus oprogramowania prognostycznego PELE, GOR4 i SOSUICoil jest taki, że drugorzędowa struktura SOGA2 jest zdominowana przez helisy alfa z przeplatanymi obszarami zwoju losowego. GOR4 wskazał, że SOGA2 jest zdominowany przez alfa-helisy; przewidział zaledwie 5,61% reszt w konformacji wydłużonej nici (równoległej lub antyrównoległej arkusza Beta), w przeciwieństwie do 47,79% helisy alfa i 46,6% zwojów losowych.

Struktura drugorzędowa ludzkiego SOGA2 przewidziana przez narzędzie GOR4. h odpowiada helisom alfa, c odpowiada przypadkowym zwojom, a e odpowiada rozciągniętej nici

Struktura trzeciorzędowa

SOGA2 ma wspólne cechy sekwencji w swoim wysoce konserwatywnym regionie N-końcowym. Ta homologia umożliwia przewidywanie jego trzeciorzędowej struktury na podstawie homologii do opublikowanych struktur 3D za pośrednictwem struktury Phyre2 i NCBI.

Struktura 3D SOGA2 przewidziana przez Phyre2. Struktura jest oparta na strukturze krystalicznej tropomiozyny przy rozdzielczości 7 angstremów, z 12% identycznością. Pasuje 283 reszt w regionie N-końcowym zawierającym CCDC.
1I84 S, Podfragment Ciężkiej Meromyozyny Żołądka Kurczaka Miozyny Mięśni Gładkich Z Regulacyjnym Łańcuchem Lekkim W Struktury 3d Stanu Defosforylowanego. Podświetlony region jest zachowany w SOGA2.

Ekspresja genu

Promotor

Poniżej przedstawiono promotor ludzkiego SOGA2.

Promotor ludzkiego genu SOGA2.

Dane dotyczące ekspresji genów

Profil EST pokazuje, że u ludzi SOGA2 ulega silnej ekspresji w wielu miejscach w całym ciele, w tym w kościach, mózgu, uchu, oku i wielu innych. Istnieje duża liczba transkryptów w próbkach raka wątroby. Dane z ludzkich mikromacierzy pokazują, że ekspresja SOGA2 jest umiarkowana, ze szczególnie wysoką ekspresją w mózgu (szczególnie w móżdżku i hipokampie), okrężnicy, przysadce mózgowej, jelicie cienkim, rdzeniu kręgowym, jądrach i mózgu płodu . Dane mikromacierzy specyficzne dla tkanki mózgowej pokazują, że SOGA2 ma wysoką ekspresję w tylnym płacie półkul móżdżku i tylnym płacie robaka w mózgu myszy . W większości innych obszarów mózgu ekspresja jest niska.

Warianty transkrypcji

U ludzi gen SOGA2 wytwarza 17 różnych transkryptów, z których 8 tworzy produkt białkowy (jeden ulega rozpadowi, w którym pośredniczy nonsens). Głównym transkryptem u ludzi jest transkrypt ID ENST00000359865 lub SOGA2-001.

Funkcjonować

Możliwe czynniki transkrypcyjne

Możliwe czynniki transkrypcyjne dla ludzkiego SOGA2 obejmują:

  • Współczynnik rozpoznawania modulatora 2
  • Białko wiążące element reagujący na cAMP 1
  • alternatywny wariant splicingu FOXP1
  • Gen podobny do MDS1/EVI1 1
  • Ikaros 2, możliwy regulator różnicowania limfocytów

Interakcje

z koimmunoprecypitacją kompleksu białkowego ( Co-IP ) ujawniły białka oddziałujące, takie jak regulatory śmierci komórkowej , transportery kasety wiążącej ATP (ABC) i białka wiążące kinazę białkową A.

540 oddziałujących białek obejmuje ABCF1 , ACTB , ACTL6A , BCLAF1 , BCLAF1 , CHEK1 i MAGEE2.

Analiza K-najbliższego sąsiada przeprowadzona przez wilka pSort wskazuje, że u ludzi SOGA2 skupia się głównie w jądrze, cytoplazmie i przestrzeni cytojądrowej. Istnieje niewielka szansa, że ​​lokalizuje się w aparacie Golgiego.

Za pośrednictwem bazy danych STRING zidentyfikowano również szereg interakcji białkowych, w tym MARK2 , MARK4 i PPP2R2B .

Znaczenie kliniczne

SOGA2 nie ma obecnie znanych skojarzeń ani mutacji chorobowych.

Dalsza lektura