Niescharakteryzowany gen LOC644249
Niescharakteryzowany gen LOC644249 , znany również jako RP11-195B21.3, ma długość około 1058 par zasad i znajduje się u Homo sapiens na chromosomie 9q 12. Dokładniej, sekwencja jest zlokalizowana na chromosomie: 9; NC_000009.11(67977457..67987991 bp). białkowym tego genu jest białko 29 zawierające domenę typu coiled-coil, które ma długość 291 aminokwasów i może zawierać konserwatywną domenę z nadrodziny pfam 12001. W szczególności ta konserwowana domena zawiera domenę o nieznanej funkcji DUF3496, która jest około 110 aminokwasów, funkcjonalnie niescharakteryzowanych i znalezionych w eukarionty . Istnieją inne możliwe motywy produktu białkowego, ale DUF3496 pozostaje najbardziej prawdopodobny. Białko to może odgrywać rolę jako białko transbłonowe.
Gen
Lokalizacja genomowa
U ludzi gen ten znajduje się na chromosomie 9q 12 (67977457..67987991) bp.
Promotor
promotor ma długość około 601 pz i znajduje się około 100 pz w górę od miejsca startu transkrypcji pierwotnego transkryptu .
Transkrypcja
Przewiduje się, że ten gen ma 4 eksony, z bardzo małym 3'UTR, który jest zakończony ogonem poli A bardzo krótko po 4 eksonie.
Białko
Produktem białkowym jest białko 29 zawierające domenę typu coiled-coil, w skrócie CCDC29, o długości około 291 aminokwasów i zawierające motyw DUF3496. Przewiduje się również, że to białko może mieć miejsce transbłonowe na około 284 - 291 aa.
- Punkt izoelektryczny : 6,043
- Masa cząsteczkowa 33,6 kdala
Analiza rozkładu ładunku
1 0000000000 0--0-000-0 +0-00+0-00 0++0+0+0-- 000-+-0000 +00000+-00 61 0000-0000+ +00000-+0- - -++00+--0 000+000-00 +0-00+00-0 +0-0--+000 121 00-+0--000 0-0000-+00 -000+-0000 00+ +-000+- 0-0+00-0+0 00–000-0- 181 -0+-000000 +000000++0 0+00++0000 00+000-+-0 0+00000000 ++- 0-0000- 241 00000000++ 0000000+00 0000000000 +000000000 0000000000 0
Motyw
Motyw DUF3496 ma około 110 aa długości i jest konserwowany u eukariontów. Jak sama nazwa wskazuje, jego funkcja jest obecnie nieznana, ale można go znaleźć u różnych gatunków. Na CCDC 29 jego względne położenie to około 153 - 259 aa.
Wyrażenie
Ten profil GEO LOC644249 został włączony do profilu ekspresji genów, który przeprowadzono w badaniu analizującym tkanki tłuszczowe osób zagrożonych zespołem metabolicznym. Ten profil GEO może sugerować, że LOC644249 jest wszechobecny w tkance tłuszczowej, ale nie można dokonać bezpośredniej korelacji wpływu poziomów ekspresji LOC644249 z tkanką tłuszczową.
Wariant transkrypcji
Przewidywano, że mogą wystąpić tylko dwa warianty transkryptu. Jeden wariant transkryptu przewidywał utratę eksonu 4. Utrata eksonu 4 doprowadziłaby do utraty około połowy DUF3496 i całej utraty domeny transbłonowej. Drugi wariant transkryptu przewidywał utratę eksonu 2, co nie prowadziłoby do utraty DUF3496 i pozostawia ramkę odczytu względnie nienaruszoną.
Homologia
Wydaje się, że ortologi CCDC29 ograniczają się tylko do naczelnych, jak pokazano w poniższej tabeli. Paralog CCDC29, który nie ogranicza się tylko do naczelnych, białko 26 zawierające domenę powtórzeń Ankyrin, wykazał, że ten paralog jest zarezerwowany tylko dla kręgowców. Stwierdzono, że najbardziej odległym ortologiem białka 26 zawierającego domenę powtórzeń Ankyrin jest gatunek gallus gallus.
Nazwa naukowa | Nazwa zwyczajowa | Numer dostępowy | Długość sekwencji (aa) | Procent tożsamości | Procent podobieństwa |
---|---|---|---|---|---|
Homo sapiens | Człowiek | XP_003960494.1 | 291 | - | - |
Goryl goryl | Goryl | XP_004062636.1 | 223 | 86% | 94% |
Sus scrofa | szympans | XP_003954217.1 | 290 | 89% | 97% |
Nomascus leucogenys | Północny gibon białopoliczek | XP_004087823.1 | 273 | 89% | 97% |
Postmodyfikacja białka
N glikozylacja
Przewidywano jedno możliwe miejsce N- glikozylacji , ale nie wykryto peptydu sygnałowego . Zatem możliwe jest, że CCDC29 nie podlega tej konkretnej modyfikacji, mimo że ma możliwe miejsce.
Fosforylacja
W sumie przewidziano 13 prawdopodobnych miejsc fosforylacji : Ser: 5 Thr: 6 Tyr: 2
Wydaje się, że główne stężenie miejsc fosforylacji jest zlokalizowane w obrębie motywu DUF3496 i końca 3' białka.
Struktura białka
Uważa się, że CCDC29, jak sama nazwa wskazuje, ma motyw zwiniętej cewki . Oprogramowanie do przewidywania struktury białek potwierdza ten motyw z 97,6% pewnością.
Transbłonowy
Przewiduje się, że CCDC29 ma jedną helisę transbłonową zlokalizowaną na N-końcu 270.
Funkcjonować
Obecnie nieznany od 5/9/2013.