C15orf52
Chromosom 15 otwarta ramka odczytu 52 jest ludzkim białkiem kodowanym przez gen C15orf52, jego funkcja jest słabo poznana.
Gen
C15orf52 to gen zlokalizowany na odwrotnej nici chromosomu 15 u gatunku Homo sapiens w locus 15q15.1. Gen ma długość 9516 par zasad, w tym introny i eksony . Gen zawiera 12 różnych intronów, 11 eksonów, wytwarza 7 różnych mRNA i 6 wariantów o alternatywnym splicingu.
Promotor
promotorowy powyżej genu zawiera kilka czynników transkrypcyjnych, które regulują ekspresję genu C15orf52 .
mRNA
Liniowy mRNA ma długość 5344 par zasad. mRNA zawiera krótki region nieulegający translacji 5' o długości 15 par zasad i długi region nieulegający translacji 3' o długości 3782 par zasad. W długim nieulegającym translacji regionie 3' znaleziono trzy specyficzne miejsca wiązania miRNA dla miRNA has-miR-147b, hsa-miR-203a-3p.1 i has-miR-214-5p.
Białko
Właściwości ogólne
Białko zawiera domenę o nieznanej funkcji (DUF4594 od aminokwasu 185 do 350). Białko, C15orf52, jest białkiem o długości 534 aminokwasów i masie 57,325 kDa , występującym u Homo sapiens .
Struktura
Podstawowy
Porównanie składu aminokwasowego z „Homo sapiens” ujawniło, że niektóre aminokwasy mają inną częstotliwość niż inne białka u ludzi. Fenyloalanina , tyrozyna i asparagina zostały znalezione w niższych częstotliwościach niż inne białka u ludzi. Glicynę i argininę stwierdzono u ludzi z wyższymi częstotliwościami niż inne białka. Punkt izoelektryczny białka wynosi 9,457, co wskazuje na białko zasadowe przy normalnym fizjologicznym pH 7,4.
Wtórny
C15orf52 ma zwiniętą domenę obejmującą aminokwasy 60-97 zawierającą helisy alfa .
Trzeciorzędowy
Trzeciorzędowa struktura tego białka jest nadal nieznana społeczności naukowej i często jest przedmiotem debaty.
Lokalizacja subkomórkowa
W białku C15orf52 nie wykryto żadnych sekwencji transbłonowych . Przewiduje się również, że C15orf52 jest rozpuszczalnym białkiem niecytoplazmatycznym , które prawdopodobnie występuje jako białko jądrowe .
Modyfikacje potranslacyjne
Białko zaobserwowano eksperymentalnie z fosforylacją seryny w dwóch miejscach, S201 i S392. N-końcowe acetylacje, C-glikozylacje, glikacje, bogate w leucynę eksportu jądrowego , sumoilacja i motywy PEST zostały przewidziane w ortologach tego białka.
Białka oddziałujące
, że dwa białka, podjednostka kompleksu THO 1 ( THOC1 ) i podjednostka kompleksu THO 7 (THOC7), oddziałują z C15orf52 za pomocą koimmunoprecypitacji anty-tag. THOC1 jest składnikiem cubcomplexu THO kompleksu TREX, o którym uważa się, że łączy transkrypcję, przetwarzanie i eksport jądrowy mRNA. Bierze również udział w szlaku apoptozy charakteryzującym się aktywacją kaspazy-6 . THOC7 jest również częścią tego samego subkompleksu i jest wymagany do wydajnego eksportu poliadenylowanego RNA. Białko 2 palca serdecznego ( RNF2 ) i podjednostka 2 kompleksu represyjnego SUZ12 polycomb ( SUZ12 ) również wskazano jako białka oddziałujące. RNF2 jest częścią grupy białek polycomb, które są ważne dla represji transkrypcji różnych genów. Posiada również ubikwitynowej . SUZ12 jest również białkiem z grupy polycomb i częścią kompleksu, który metyluje lizyny histonów, a także bierze udział w represji genów.
Homologia
Paralogi
Nie są znane kompletne paralogi dla białka C15orf52. Istnieje homologiczna domena znaleziona w Coiled Coil Domain Containing Protein 9 (CCDC9), która jest paralogiczna do białka C15orf52 od aminokwasu 9 do 55 CCDC9. Ta domena występuje u naczelnych do mięczaków . Ta domena CCDC9 nie występuje w żadnych organizmach jednokomórkowych ani organizmach wielokomórkowych bardziej odległych niż mięczaki.
ortologi
Ortologi białka C15orf52 prześledzono wstecz do ryb chrzęstnoszkieletowych . Żadnego nie znaleziono w organizmach wielokomórkowych bardziej odległych niż ryby chrzęstne lub organizmy jednokomórkowe.
Nazwa zwyczajowa | Rodzaj i gatunek | Data odejścia od ludzi (MYA) | Numer dostępowy | Długość sekwencji | Tożsamość sekwencji dla ludzi | Podobieństwo sekwencji do ludzi |
---|---|---|---|---|---|---|
Człowiek | Homo sapiens | 0 | NP_997263.2 | 534 | 100% | 100% |
kij Brandta | Myotis brandtii | 97,5 | XP_005860303.2 | 564 | 76% | 79% |
Bydło | Bos Byk | 97,5 | XP_015328613.1 | 577 | 75% | 77% |
Muflon | Ovis Musimon | 97,5 | XP_014962253.1 | 513 | 69% | 74% |
Mysz domowa | Mus musculus | 90,5 | NP_001001982.2 | 545 | 63% | 71% |
Gekko | Gekko japonicus | 320,5 | XP_015282702.1 | 591 | 41% | 55% |
Zięba zebry | Taeniopygia guttata | 320,5 | XP_012429790.1 | 625 | 41% | 57% |
Anol Karolina | Anolis carolinensis | 320,5 | XP_008115041.1 | 496 | 39% | 55% |
Żółw zielony | Chelonia mydas | 320,5 | XP_007069465.1 | 743 | 39% | 57% |
Kurczak | Gallus gallus | 320,5 | XP_004941352.2 | 637 | 38% | 54% |
Złoty Orzeł | Aquila chrysaetos canadensis | 320,5 | XP_011595804.1 | 647 | 38% | 53% |
Zachodnia żaba szponiasta | Xenopus tropicalis | 355,7 | XP_004917355.1 | 507 | 37% | 54% |
Pospolity wąż do pończoch | Thamnophis sirtalis | 320,5 | XP_013925154.1 | 586 | 37% | 52% |
meksykańska tetra | Astyanax mexicanus | 429,6 | XP_007230442.1 | 354 | 37% | 52% |
Cętkowany gar | Lepisosteus oculatus | 429,6 | XP_015206400.1 | 674 | 37% | 52% |
Szpak pospolity | Sturnus vulgaris | 320,5 | XP_014734365.1 | 646 | 37% | 53% |
Chiński aligator | Aligator sinensis | 320,5 | XP_014372849.1 | 504 | 37% | 54% |
pyton birmański | Bivittatus Pythona | 320,5 | XP_007429068.1 | 587 | 37% | 53% |
Zebry | Danio Rerio | 429,6 | XP_001337385.3 | 516 | 32% | 51% |
Australijski rekin widmo | Callorhinchus milii | 482,9 | XP_007891400.1 | 692 | 29% | 45% |
Rozdymka tygrysia | Takifugu rubripe | 429,6 | XP_011614636.1 | 525 | 35% | 51% |
Rozbieżność
Poniżej przedstawiono porównanie skorygowanych odległości C15orf52 z szybko mutującym białkiem fibrynogenu alfa i wolno mutującym białkiem cytochromu C. Domena paralogiczna w CCDC9 jest również pokazana poniżej. Ogólnie rzecz biorąc, C15orf52 zmienia się dość szybko jako całość, jednak domena paralogiczna nie, co może wskazywać na funkcjonalność, ponieważ ta domena jest dobrze konserwowana.
Wyrażenie
Pochodzenie cDNA C15orf52 pokazuje, że gen ulega ekspresji w wielu miejscach, takich jak pierwotne i wtórne narządy trawienne (trzustka, żołądek, wątroba itp.), układ nerwowy (mózg, siatkówka, soczewki), skóra, narządy rozrodcze, kości i wiele innych tkanek, co sugeruje raczej niewyspecjalizowaną funkcję. Jednak białko C15orf52 jest stosunkowo nadeksprymowane w okrężnicy, komórkach jednojądrzastych krwi obwodowej, jądrach i odbytnicy. Zastosowanie RNA-seq do profili zewnątrzkomórkowego RNA w osoczu wskazało, że C15orf52 jest najobficiej występującym mRNA, prawdopodobnie wskazując na pewną rolę poza komórką. U myszy stwierdzono, że wzór ekspresji C15orf52, a także dwóch innych badanych genów TCEA3 i FHOD3 jest podobny do dobrze scharakteryzowanych genów, o których wiadomo, że są związane z rozwojem serca, takich jak BVES i CXCL12. Jednak C15orf52 nie został wykryty przed embriologicznym dniem 9.5 w okolicy ogona, a jego dokładna funkcja nie jest jeszcze znana.
Znaczenie kliniczne
Choroby związane z C15orf52 obejmują raka jelita grubego , w którym białko ulegało nadekspresji w komórkach nowotworowych.