INAWA

Identyfikatory
INAVA
, chromosom 1 otwarta ramka odczytu 106, C1orf106, aktywator odporności wrodzonej
Identyfikatory zewnętrzne
ortologi
Gatunek Człowiek Mysz
Entrez
Ensembl
UniProt
RefSeq (mRNA)

RefSeq (białko)

Lokalizacja (UCSC)
PubMed search
Wikidane
Wyświetl/edytuj człowieka Wyświetl/edytuj mysz

INAVA , czasami określane jako hipotetyczne białko LOC55765 , jest białkiem o nieznanej funkcji, które u ludzi jest kodowane przez gen INAVA . Mniej powszechne aliasy genów to FLJ10901 i MGC125608.

Gen

Lokalizacja

Lokalizacja C1orf106 na chromosomie 1

U ludzi INAVA znajduje się na długim ramieniu chromosomu 1 w locus 1q32.1. Rozciąga się od 200 891 499 do 200 915 736 (24,238 kb) na nici dodatniej.

Okolice gen

Okolice gen

INAVA jest oflankowana przez sprzężony z białkiem G receptor 25 (w górę) i podobny do ciepła członek rodziny powtórzeń maestro 3 (MROH3P), przewidywany pseudogen w dół. Rybosomalne białko L34 pseudogen 6 (RPL34P6) znajduje się dalej w górę, a członek rodziny kinezyny 21B jest dalej w dół.

Promotor

Przewidywany region promotora C1orf106 z domniemanymi miejscami wiązania czynnika transkrypcyjnego

Istnieje siedem przewidywanych promotorów INAVA, a dowody eksperymentalne sugerują, że izoformy 1 i 2, najpowszechniejsze izoformy, są transkrybowane przy użyciu różnych promotorów. MatInspector, narzędzie dostępne za pośrednictwem Genomatix, zostało użyte do przewidywania czynnika transkrypcyjnego w potencjalnych regionach promotorowych. Czynniki transkrypcyjne, które mają być ukierunkowane na przewidywany promotor izoformy 1, ulegają ekspresji w szeregu tkanek. Najczęstszymi tkankami ekspresji są układ moczowo-płciowy, układ nerwowy i szpik kostny. Zbiega się to z danymi dotyczącymi ekspresji białka INAVA, które ulega silnej ekspresji w nerkach i szpiku kostnym. Diagram przewidywanego regionu promotora, z podświetlonymi miejscami wiązania czynnika transkrypcyjnego, pokazano po prawej stronie. Przewiduje się, że czynniki wiążące się z regionem promotora izoformy 2 różnią się, a dwanaście z dwudziestu przewidywanych czynników ulega ekspresji w komórkach krwi i/lub tkankach układu sercowo-naczyniowego.

Wyrażenie

C1orf106 ulega ekspresji w wielu różnych tkankach. Poniżej przedstawiono dane dotyczące ekspresji z profili GEO. Miejsca o największej ekspresji wymieniono w tabeli. Ekspresja jest umiarkowana w łożysku, prostacie, jądrach, płucach, gruczołach ślinowych i komórkach dendrytycznych. Jest niski w mózgu, większości komórek odpornościowych, nadnerczach, macicy, sercu i adipocytach. Dane dotyczące ekspresji, pochodzące z różnych eksperymentów, znalezione na profilach GEO sugerują, że ekspresja INAVA jest regulowana w górę w kilku nowotworach, w tym: płuc, jajnika, jelita grubego i piersi.

Dane wyrażenia C1orf106 z profili GEO
Tkanka Ranking procentowy
Limfocyty B 90
Tchawica 89
Skóra 88
Ludzkie komórki nabłonka oskrzeli 88
Gruczolakorak jelita grubego 87
Nerka 87
Język 85
Trzustka 84
Załącznik 82
Szpik kostny 80

mRNA

izoformy

Z genu INAVA wytwarzanych jest dziewięć domniemanych izoform, z których siedem prawdopodobnie koduje białka. Izoformy 1 i 2, pokazane poniżej, są najczęstszymi izoformami.

Najczęstsze izoformy C1orf106

Izoforma 1, która jest najdłuższa, jest akceptowana jako izoforma kanoniczna. Zawiera dziesięć eksonów, które kodują białko o długości 677 aminokwasów, w zależności od źródła. Niektóre źródła podają, że białko ma tylko 663 aminokwasy ze względu na użycie kodonu start, który ma czterdzieści dwa nukleotydy w dół. Według NCBI tę izoformę przewidziano jedynie obliczeniowo. Może to być spowodowane sekwencją Kozaka otaczający kodon start w dół jest bardziej podobny do konsensusowej sekwencji Kozaka, jak pokazano w tabeli poniżej. Do uzyskania sekwencji przewidywanej izoformy użyto Softberry. Izoforma 2 jest krótsza z powodu skróconego N-końca. Obie izoformy mają alternatywne miejsce poliadenylacji.

Surrounding sequence of start codons compared to Kozak consensus sequence

regulacja miRNA

Przewidywana docelowa sekwencja miRNA

miRNA-24 został zidentyfikowany jako mikroRNA , który może potencjalnie celować w mRNA INAVA. Pokazano miejsce wiązania, które znajduje się w nieulegającym translacji regionie 5' .

Białko

Właściwości ogólne

Białko C1of106 (izoforma 1)

Izoforma 1, przedstawiona na diagramie poniżej, zawiera domenę DUF3338, dwa regiony o niskiej złożoności i region bogaty w prolinę. Białko jest bogate w argininę i prolinę i ma niższą niż przeciętna ilość asparaginy i aminokwasów hydrofobowych, w szczególności fenyloalaniny i izoleucyny. Punkt izoelektryczny wynosi 9,58, a masa cząsteczkowa niezmodyfikowanego białka wynosi 72,9 kdal. Nie przewiduje się, aby białko miało N-końcowy peptyd sygnałowy, ale przewiduje się sygnały lokalizacji jądrowej (NLS) i bogaty w leucynę sygnał eksportu jądrowego .

modyfikacje

Przewiduje się, że INAVA będzie silnie fosforylowana. Miejsca fosforylacji przewidywane przez PROSITE przedstawiono w poniższej tabeli. Prognozy NETPhos przedstawiono na diagramie. Każda linia wskazuje przewidywane miejsce fosforylacji i łączy się z literą, która reprezentuje serynę (S), treoninę (T) lub tyrozynę (Y).

Phosphorylation sites predicted by PROSITE
Miejsca fosforylacji przewidziane przez NETPhos. Litera odpowiada serynie (S), treoninie (T) lub tyrozynie (Y).

Struktura

Przewiduje się, że cewki spiralne będą rozciągać się od pozostałości 130-160 i 200-260. Przewidywano, że skład drugorzędny to około 60% przypadkowych zwojów, 30% helis alfa i 10% arkuszy beta.

Interakcje

Białka, z którymi oddziałuje białko INAVA, nie są dobrze scharakteryzowane. Dowody eksploracji tekstu sugerują, że INAVA może wchodzić w interakcje z następującymi białkami: DNAJC5G, SLC7A13, PIEZO2, MUC19. Dowody eksperymentalne z dwóch hybrydowych badań przesiewowych drożdży sugerują, że białko INAVA oddziałuje z białkiem 14-3-3 sigma, które jest białkiem adaptorowym.

Homologia

INAVA jest dobrze konserwowana u kręgowców, jak pokazano w poniższej tabeli. Sekwencje uzyskano z BLAST i BLAT .

Sekwencja Rodzaj i gatunek Nazwa zwyczajowa przystąpienie NCBI Długość (aa) Tożsamość sekwencji Czas od rozbieżności (Mya)
* C1orf106 Homo sapiens Człowiek NP_060735.3 667 100% NA
* C1orf106 Macaca fascicularis Makak żywiący się krabami XP_005540414.1 703 97% 29.0
* LOC289399 Rattus norvegicus Norweski szczur NP_001178750.1 667 86% 92,3
* Przewidywany homolog C1orf106 Odobenus rosmarus divergens Mors XP_004392787.1 672 85% 94,2
* C1orf106-podobny Loxodonta africana Słoń XP_003410255.1 663 84% 98,7
* Przewidywany homolog C1orf106 Dasypus novemcinctus Dziewięciopasmowy pancernik XP_004478752.1 676 81% 104,2
* Przewidywany homolog C1orf106 Ochotona princeps pika amerykańska XP_004578841.1 681 78% 92,3
* Przewidywany homolog C1orf106 Monodelphis domestica Szary opos krótkoogoniasty XP_001367913.2 578 76% 162,2
* Przewidywany homolog C1orf106 Chrysemys picta bellii Malowany żółw XP_005313167.1 602 56% 296,0
* Przewidywany homolog C1orf106 Geospiza fortis Średnio mielona zięba XP_005426868.1 542 50% 296,0
* Przewidywany homolog C1orf106 Aligator mississippiensis Aligator XP_006278041.1 547 49% 296,0
* Przewidywany homolog C1orf106 Ficedula albicollis Muchołówka z kołnierzem XP_005059352.1 542 49% 296,0
Przewidywany homolog C1orf106 Latimeria chalumnae Coelacanth z Zachodniego Oceanu Indyjskiego XP_005988436.1 613 46% 414,9
* Przewidywany homolog C1orf106 Lepisosteus oculatus Cętkowany gar XP_006628420.1 637 44% 400.1
* Domena FERM zawierająca 4A Xenopus (Silurana) tropicalis Zachodnia żaba szponiasta XP_002935289.2 695 43% 371,2
* Przewidywany homolog C1orf106 Oreochromis niloticus Tilapia nilowa XP_005478188.1 576 40% 400.1
Przewidywany homolog C1orf106 Haplochromis burtoni Astatotilapia burtoni XP_005914919.1 576 40% 400.1
Przewidywany homolog C1orf106 Pundamilia nyererei Haplochromis nyererei XP_005732720.1 577 40% 400.1
* LOC563192 Danio Rerio Danio pręgowany NP_001073474.1 612 37% 400.1
LOC101161145 Oryzias latipes Japońska ryba ryżowa XP_004069287.1 612 33% 400.1

Wykres identyczności sekwencji w funkcji czasu od rozbieżności dla wpisów oznaczonych gwiazdką pokazano poniżej. Kolory odpowiadają stopniowi pokrewieństwa (zielony = blisko spokrewniony, fioletowy = daleko spokrewniony).

Procent identyczności sekwencji w stosunku do pokrewieństwa gatunkowego

Paralogi

Białka uważane za paralogi INAVA nie są spójne między bazami danych. Dokonano dopasowania wielu sekwencji (MSA) potencjalnie paralogicznych białek, aby określić prawdopodobieństwo prawdziwie paralogicznego związku. Sekwencje uzyskano z przeszukiwania BLAST u ludzi z białkiem C1orf106. MSA sugeruje, że białka mają wspólną domenę homologiczną, DUF3338, która występuje u eukariontów. Część dopasowania wielu sekwencji jest pokazana poniżej. Poza domeną DUF (zaznaczoną na zielono) ochrona była niewielka. Domena DUF3338 nie ma żadnych nadzwyczajnych właściwości fizycznych, jednak godnym uwagi odkryciem jest to, że przewiduje się, że każde z białek w MSA będzie miało dwa sygnały lokalizacji jądrowej. Przewiduje się, że wszystkie białka w MSA będą lokalizować się w jądrze. Porównanie właściwości fizycznych białek przeprowadzono również przy użyciu SAPS i przedstawiono w tabeli.

Konserwacja domeny DUF3338 u ludzi
Physical properties of potential paralogs

Znaczenie kliniczne

W regionie genu INAVA zidentyfikowano łącznie 556 polimorfizmów pojedynczego nukleotydu (SNP), z których 96 jest związanych ze źródłem klinicznym. Rivas i in. zidentyfikowali cztery SNP, pokazane w poniższej tabeli, które mogą być związane z chorobą zapalną jelit i chorobą Leśniowskiego-Crohna . Według GeneCards, inne powiązania chorobowe mogą obejmować stwardnienie rozsiane i wrzodziejące zapalenie jelita grubego .

Pozostałość Zmiana Notatki
333 (rs41313912) Tyrozyna ⇒ fenyloalanina Fosforylowana, umiarkowana konserwacja
376 Arginina ⇒ cysteina Umiarkowana konserwacja
397 Arginina ⇒ treonina Nie konserwowane
554 (RS61745433) Arginina ⇒ cysteina Umiarkowana konserwacja

Organizmy modelowe

W badaniu funkcji INAVA wykorzystano organizmy modelowe . Linia myszy z warunkowym nokautem o nazwie 5730559C18Rik tm2a (EUCOMM) Wtsi została wygenerowana w Wellcome Trust Sanger Institute . Samce i samice zwierząt poddano standaryzowanemu badaniu fenotypowemu w celu określenia skutków delecji. Wykonano dodatkowe badania przesiewowe: - Pogłębione fenotypowanie immunologiczne - Pogłębione fenotypowanie kości i chrząstki

Linki zewnętrzne