Grzbiet (biologia)
Grzbiety ( rejony o zwiększonej ekspresji genów ) są domenami genomu o wysokiej ekspresji genów ; przeciwieństwem grzbietów są przeciwprądy. Termin ten został po raz pierwszy użyty przez Carona i in. w 2001 r. Charakterystyka grzbietów to:
- Gęsty gen
- Zawierają wiele zasad nukleinowych C i G
- Geny mają krótkie introny
- Wysoka gęstość powtórzeń SINE
- Niska gęstość powtórzeń LINE
Odkrycie
Grupowanie genów u prokariotów było znane od dawna. Ich geny są zgrupowane w operonach , geny w operonach mają wspólną jednostkę promotora. Geny te są w większości funkcjonalnie powiązane. Genom prokariontów jest stosunkowo bardzo prosty i zwarty. U eukariontów genom jest ogromny i tylko niewielka jego część to funkcjonalnie geny, ponadto geny nie są ułożone w operony. Z wyjątkiem nicieni i trypanosomów ; chociaż ich operony różnią się od operonów prokariotycznych. U eukariontów każdy gen ma własne miejsce regulacji transkrypcji. Dlatego geny nie muszą znajdować się blisko siebie, aby ulegały koekspresji. Dlatego od dawna zakładano, że geny eukariotyczne są losowo rozmieszczone w genomie ze względu na wysoki wskaźnik rearanżacji chromosomów. Ponieważ jednak stała się dostępna kompletna sekwencja genomów, możliwe stało się dokładne zlokalizowanie genu i zmierzenie jego odległości od innych genów.
Pierwszym genomem eukariota, jaki kiedykolwiek zsekwencjonowano, był genom Saccharomyces cerevisiae , czyli pączkujących drożdży, w 1996 roku. Pół roku później Velculescu i in. (1997) opublikowali badanie, w którym zintegrowali SAGE z dostępną obecnie mapą genomu. Podczas cyklu komórkowego w komórce aktywne są różne geny. Dlatego wykorzystali dane SAGE z trzech momentów cyklu komórkowego (faza logarytmiczna, fazy S i G2 / M komórki zatrzymane w fazie). Ponieważ w drożdżach wszystkie geny mają własną jednostkę promotora, nie podejrzewano, że geny będą skupiać się blisko siebie, ale tak się stało. Klastry były obecne na wszystkich 16 chromosomach drożdży. Rok później Cho i wsp. podali również (choć bardziej szczegółowo), że niektóre geny są zlokalizowane blisko siebie w drożdżach.
Charakterystyka i funkcja
Współekspresja
Cho i in. byli pierwszymi, którzy ustalili, że geny skupione mają te same poziomy ekspresji. Zidentyfikowali transkrypty wykazujące okresowość zależną od cyklu komórkowego. Spośród tych genów 25% znajdowało się w bliskim sąsiedztwie innych genów, które były transkryptami w tym samym cyklu komórkowym. Cohen i in. (2000) również zidentyfikowali skupiska koeksprymowanych genów.
Caron i in. (2001) sporządzili mapę ludzkiego transkryptomu 12 różnych tkanek (komórek nowotworowych) i doszli do wniosku, że geny nie są losowo rozmieszczone w chromosomach. Zamiast tego geny mają tendencję do grupowania się w grupy składające się czasem z 39 genów w bliskiej odległości. Klastry były nie tylko gęste pod względem genów. Zidentyfikowali 27 klastrów genów o bardzo wysokim poziomie ekspresji i nazwali je RIDGE. Wspólny RIDGE liczy od 6 do 30 genów na centiray. Były jednak wielkie wyjątki, 40 do 50% RIDGE nie było tak gęstych genów; podobnie jak u drożdży te RIDGE były zlokalizowane w telomerowych .
Lercher i in. (2002) zwrócili uwagę na pewne słabości podejścia Carona. Klastry genów w bliskim sąsiedztwie i wysokim poziomie transkrypcji można łatwo wygenerować przez duplikaty tandemowe. Geny mogą generować swoje duplikaty, które są włączane do ich otoczenia. Te duplikaty mogą albo stać się funkcjonalną częścią szlaku ich genu macierzystego, albo (ponieważ nie są już faworyzowane przez dobór naturalny) uzyskać szkodliwe mutacje i przekształcić się w pseudogeny. Ponieważ te duplikaty są fałszywymi alarmami w poszukiwaniu klastrów genów, należy je wykluczyć. Lercher wykluczył sąsiednie geny o dużym podobieństwie do siebie, a następnie przeszukał przesuwane okno regionów z 15 sąsiadującymi genami.
Było jasne, że istnieją regiony o dużej gęstości genów. Istniała uderzająca korelacja między gęstością genów a wysoką zawartością CG. Niektóre klastry rzeczywiście miały wysoki poziom ekspresji. Ale większość regionów o wysokiej ekspresji składała się z genów porządkowych; geny, które ulegają silnej ekspresji we wszystkich tkankach, ponieważ kodują podstawowe mechanizmy. Tylko mniejszość klastrów zawierała geny ograniczone do określonych tkanek.
Versteeg i in. (2003) próbowali, z lepszą mapą ludzkiego genomu i lepszymi taqami SAGE, określić bardziej szczegółowe cechy charakterystyczne RIDGE. Nakładające się geny traktowano jako jeden gen, a geny bez intronów odrzucano jako pseudogeny. Ustalili, że RIDGE są bardzo gęste genowo, mają wysoką ekspresję genów, krótkie introny, dużą gęstość powtórzeń SINE i niską gęstość powtórzeń LINE. Klastry zawierające geny o bardzo niskim poziomie transkrypcji miały cechy przeciwne do RIDGE, dlatego te klastry nazwano antygrzbietami. Powtórzenia LINE to śmieciowe DNA, które zawiera miejsce cięcia endonukleazy (TTTTA). Ich niedobór w RIDGE można wytłumaczyć faktem, że dobór naturalny sprzyja niedoborowi powtórzeń LINE w ORF, ponieważ ich miejsca dla endonukleaz mogą powodować szkodliwe mutacje w genach. Nie wiadomo jeszcze, dlaczego powtórzeń SINE jest tak dużo.
Versteeg i in. doszli również do wniosku, że w przeciwieństwie do analizy Lerchersa, poziomy transkrypcji wielu genów w RIDGE (na przykład klastra na chromosomie 9) mogą się znacznie różnić między różnymi tkankami. Lee i in. (2003) przeanalizowali trend grupowania genów między różnymi gatunkami. Porównali Saccharomyces cerevisiae , Homo sapiens , Caenorhabditis elegans , Arabidopsis thaliana i Drosophila melanogaster i stwierdzili stopień skupienia, jako frakcję genów w luźnych klastrach, odpowiednio (37%), (50%), (74%), (52%) i (68%). Doszli do wniosku, że ścieżki, których geny są skupiskami u wielu gatunków, są rzadkie. Odkryli siedem uniwersalnie skupionych szlaków: glikolizę , biosyntezę aminoacylo-tRNA , syntazę ATP , polimerazę DNA , degradację heksachlorocykloheksanu , metabolizm kwasu cyjanoamino i fotosyntezę ( synteza ATP u gatunków innych niż rośliny). Nic dziwnego, że są to podstawowe szlaki komórkowe.
Lee i in. wykorzystywał bardzo zróżnicowane grupy zwierząt. W ramach tych grup zachowane jest skupienie, na przykład motywy skupienia Homo sapiens i Mus musculus są mniej więcej takie same.
Spellman i Rubin (2002) stworzyli mapę transkryptomu Drosophila . Spośród wszystkich badanych genów 20% było skupionych. Klastry składały się z 10 do 30 genów w grupie o wielkości około 100 kilozasad. Członkowie klastrów nie byli funkcjonalnie powiązani, a lokalizacja klastrów nie korelowała ze znanymi strukturami chromatyny.
Badanie to wykazało również, że w klastrach poziomy ekspresji średnio 15 genów były prawie takie same w wielu zastosowanych warunkach eksperymentalnych. Te podobieństwa były tak uderzające, że autorzy uznali, że geny w klastrach nie są indywidualnie regulowane przez ich osobistego promotora, ale że w grę wchodzą zmiany w strukturze chromatyny. Podobny wzorzec współregulacji został opublikowany w tym samym roku przez Roya i in. (2002) w C. elegans.
Wiele genów, które są zgrupowane w klastry, wykazuje te same profile ekspresji w ludzkich inwazyjnych przewodowych rakach piersi. Około 20% genów wykazuje korelację z sąsiadami. Klastry koeksprymowanych genów podzielono według regionów o mniejszej korelacji między genami. Te klastry mogą obejmować całe ramię chromosomu.
W przeciwieństwie do wcześniej omawianych doniesień Johnidis et al. (2005) odkryli, że (przynajmniej niektóre) geny w klastrach nie są współregulowane. Aire jest czynnikiem transkrypcyjnym, który ma wpływ na regulację w górę iw dół na różne geny. Działa w negatywnej selekcji tymocytów, które reagują na własne epitopy organizmu, przez komórki rdzeniaste.
Geny kontrolowane przez aire skupiły się. 53 z genów najbardziej aktywowanych przez aire miało aktywowanego przez aire sąsiada w promieniu 200 Kb lub mniej, a 32 geny najbardziej represjonowane przez aire miało sąsiada po represji w promieniu 200 Kb; to mniej niż oczekiwano po zmianie. Przeprowadzili te same badania przesiewowe dla regulatora transkrypcji CIITA.
Te regulatory transkrypcji nie miały takiego samego wpływu na wszystkie geny w tym samym klastrze. Geny, które zostały aktywowane i stłumione lub nienaruszone, były czasami obecne w tym samym klastrze. W tym przypadku niemożliwe jest, aby geny regulowane przez powietrze były skupione, ponieważ wszystkie były współregulowane.
Nie jest więc jasne, czy domeny są współregulowane, czy nie. Bardzo skutecznym sposobem na przetestowanie tego byłoby wstawienie syntetycznych genów do RIDGE, antiridges i/lub losowych miejsc w genomie i określenie ich ekspresji. Te poziomy ekspresji należy porównać ze sobą. Giermana i in. (2007) jako pierwsi udowodnili współregulację przy użyciu tego podejścia. Jako konstrukt insercyjny wykorzystali fluoryzujący GFP kierowany przez wszechobecny promotor ludzkiej kinazy fosfoglicerynianowej (PGK). Zintegrowali ten konstrukt w 90 różnych pozycjach w genomie ludzkich komórek HEK293 . Odkryli, że ekspresja konstruktu w Ridges była rzeczywiście wyższa niż ta wstawiona w antiridges (podczas gdy wszystkie konstrukty mają ten sam promotor).
Zbadali, czy te różnice w ekspresjach wynikają z genów w bezpośrednim sąsiedztwie konstruktów, czy też z domeny jako całości. Odkryli, że konstrukty obok genów o wysokiej ekspresji były nieco bardziej eksprymowane niż inne. Ale kiedy powiększyli rozmiar okna do otaczających 49 genów (poziom domeny), zobaczyli, że konstrukty zlokalizowane w domenach o ogólnie wysokim poziomie ekspresji miały ponad 2-krotnie wyższą ekspresję niż te zlokalizowane w domenach o niskim poziomie ekspresji.
Sprawdzili również, czy konstrukt był wyrażany na podobnych poziomach jak sąsiednie geny i czy ta ścisła koekspresja była obecna wyłącznie w obrębie RIDGE. Odkryli, że wyrażenia były silnie skorelowane w RIDGE i prawie nieobecne pod koniec i poza RIDGE.
Wcześniejsze obserwacje i badania Giermana i in. udowodnili, że aktywność domeny ma ogromny wpływ na ekspresję znajdujących się w niej genów. A geny w RIDGE ulegają koekspresji. Jednak konstrukty użyte przez Giermana i in. były regulowane przez wszystkich pełnoetatowych aktywnych promotorów. Geny badań Johnidisa i in. były zależne od obecności czynnika transkrypcyjnego aire. Dziwna ekspresja genów regulowanych przez aire mogła być częściowo spowodowana różnicami w ekspresji i konformacji samego czynnika transkrypcyjnego aire.
Relacja funkcjonalna
Wiadomo było przed erą genomiki, że skupione geny są zwykle funkcjonalnie powiązane. Abderrahim i in. (1994) wykazali, że wszystkie geny głównego kompleksu zgodności tkankowej były skupione na chromosomie 6p21. Roy i in. (2002) wykazali, że u nicieni C. elegans geny, które ulegają ekspresji wyłącznie w tkance mięśniowej w stadium larwalnym, mają tendencję do grupowania się w małe grupy po 2–5 genów. Zidentyfikowali 13 klastrów.
Yamashita i in. (2004) wykazali, że geny związane z określonymi funkcjami w narządach mają tendencję do grupowania się. Sześć domen związanych z wątrobą zawierało geny odpowiedzialne za metabolizm ksenobiotyków, lipidów i alkoholu. Pięć domen związanych z okrężnicą miało geny odpowiedzialne za apoptozę, proliferację komórek, transporter jonów i produkcję mucyny. Klastry te były bardzo małe, a poziomy ekspresji były niskie. Geny związane z mózgiem i piersiami nie skupiały się.
To pokazuje, że przynajmniej niektóre klastry składają się z funkcjonalnie powiązanych genów. Istnieją jednak wielkie wyjątki. Spellman i Rubin wykazali, że istnieją skupiska koeksprymowanych genów, które nie są funkcjonalnie powiązane. Wydaje się, że klastry pojawiają się w bardzo różnych formach.
Rozporządzenie
Cohen i in. odkryli, że z pary koeksprymowanych genów tylko jeden promotor ma sekwencję aktywującą w górę (UAS) związaną z tym wzorcem ekspresji. Zasugerowali, że UAS mogą aktywować geny, które nie są z nimi w bezpośrednim sąsiedztwie. To wyjaśnienie może wyjaśniać koekspresję małych klastrów, ale wiele klastrów zawiera zbyt wiele genów, które mają być regulowane przez pojedynczy UAS.
chromatyny są wiarygodnym wyjaśnieniem współregulacji obserwowanej w klastrach. Chromatyna składa się z nici DNA i histonów przyłączonych do DNA. Regiony, w których chromatyna jest bardzo ciasno upakowane, nazywane są heterochromatyną. Heterochromatyna składa się bardzo często z pozostałości genomów wirusowych, transpozonów i inne śmieciowe DNA. Ze względu na ciasne upakowanie DNA jest prawie nieosiągalne dla maszynerii transkrypcyjnej, pokrywanie szkodliwego DNA białkami jest sposobem, w jaki komórka może się chronić. Chromatyna, która składa się z funkcjonalnych genów, jest często strukturą otwartą, w której DNA jest dostępne. Jednak większość genów nie musi być eksprymowana przez cały czas.
DNA z genami, które nie są potrzebne, można pokryć histonami. Kiedy gen musi ulec ekspresji, specjalne białka mogą zmienić substancję chemiczną, która jest przyłączona do histonów (modyfikacje histonów), co powoduje, że histony otwierają strukturę. Kiedy chromatyna jednego genu jest otwarta, chromatyna sąsiednich genów jest również otwarta, dopóki ta modyfikacja nie napotka elementu granicznego. W ten sposób geny blisko siebie są wyrażane w tym samym czasie. Tak więc geny są skupione w „centrach ekspresji”. W porównaniu z tym modelem Gilbert i in. (2004) wykazali, że RIDGE występują głównie w otwartych strukturach chromatyny.
Jednak Johnidis i in. (2005) wykazali, że geny w tym samym klastrze mogą ulegać bardzo różnej ekspresji. Jak dokładnie działa regulacja genów eukariotycznych i związane z nią zmiany chromatyny, jest nadal bardzo niejasna i nie ma co do tego zgody. Aby uzyskać jasny obraz mechanizmu klastrów genów, najpierw należy oświetlić działanie chromatyny i regulację genów. Co więcej, większość prac, w których zidentyfikowano skupiska współregulowanych genów, skupiała się na poziomach transkrypcji, podczas gdy niewiele skupiało się na skupiskach regulowanych przez te same czynniki transkrypcyjne. Johnides i in. odkryli dziwne zjawiska, kiedy to zrobili.
Pochodzenie
Pierwsze modele, które próbowały wyjaśnić skupienia genów, skupiały się oczywiście na operonach, ponieważ odkryto je przed eukariotycznymi skupieniami genów. W 1999 roku Lawrence zaproponował model pochodzenia operonów. Ten samolubny model operonu sugeruje, że poszczególne geny zostały zgrupowane razem przez przeniesienie pionowe i poziome i zostały zachowane jako pojedyncza jednostka, ponieważ było to korzystne dla genów, a nie dla samego organizmu. Ten model przewiduje, że klastry genów musiały być konserwowane między gatunkami. Inaczej jest w przypadku wielu operonów i klastrów genów obserwowanych u eukariontów.
Według Eichlera i Sankoffa dwa średnie procesy ewolucji chromosomów eukariotycznych to 1) rearanżacje segmentów chromosomów i 2) zlokalizowana duplikacja genów. Grupowanie można wytłumaczyć rozumowaniem, że wszystkie geny w klastrze pochodzą od tandemowych duplikatów wspólnego przodka. Gdyby wszystkie koeksprymowane geny w klastrze wyewoluowały ze wspólnego genu przodka, można by się spodziewać, że są one koeksprymowane, ponieważ wszystkie mają porównywalne promotory. Jednak grupowanie genów jest bardzo powszechnym bieżnikiem w genomach i nie jest jasne, w jaki sposób ten model duplikacji mógłby wyjaśnić całe skupienie. Ponadto wiele genów obecnych w klastrach nie jest homologicznych.
Jak to się stało, że niezwiązane z ewolucją geny znalazły się w bliskiej odległości? Albo istnieje siła, która zbliża do siebie funkcjonalnie spokrewnione geny, albo geny zbliżyły się do siebie w wyniku zmiany. Singer i in. zaproponował, że geny zbliżyły się do siebie w wyniku losowej rekombinacji segmentów genomu. Gdy funkcjonalnie spokrewnione geny zbliżyły się do siebie, bliskość ta została zachowana. Określili wszystkie możliwe miejsca rekombinacji między genami ludzkimi i mysimi. Następnie porównali grupowanie mysiego i ludzkiego genomu i sprawdzili, czy rekombinacja wystąpiła w potencjalnie rekombinowanych miejscach. Okazało się, że rekombinacja genów tego samego klastra była bardzo rzadka. Tak więc, gdy tylko utworzy się funkcjonalny klaster, komórka tłumi rekombinację. Na chromosomach płciowych liczba klastrów jest bardzo niska zarówno u ludzi, jak iu myszy. Autorzy argumentowali, że wynika to z niskiego wskaźnika rearanżacji chromosomowych chromosomów płciowych.
Otwarte regiony chromatyny są regionami aktywnymi. Bardziej prawdopodobne jest przeniesienie genów do tych regionów. Geny z organelli i genomu wirusa są wstawiane częściej w tych regionach. W ten sposób niehomologiczne geny mogą być sprasowane razem w małej domenie.
Możliwe, że niektóre regiony genomu są lepiej przystosowane do ważnych genów. Dla komórki ważne jest, aby geny odpowiedzialne za podstawowe funkcje były chronione przed rekombinacją. U drożdży i robaków zaobserwowano, że podstawowe geny mają tendencję do skupiania się w regionach o małej szybkości replikacji.
Możliwe, że geny zbliżyły się w wyniku zmiany. Zaproponowano inne modele, ale żaden z nich nie może wyjaśnić wszystkich obserwowanych zjawisk. Oczywiste jest, że natychmiast po utworzeniu klastrów są one konserwowane przez dobór naturalny. Jednak nadal brakuje dokładnego modelu tego, w jaki sposób geny znalazły się w bliskiej odległości.
Większość obecnych klastrów musiała powstać stosunkowo niedawno, ponieważ tylko siedem klastrów funkcjonalnie powiązanych genów jest zachowanych między typami. Niektóre z tych różnic można wytłumaczyć faktem, że ekspresja genów jest bardzo różnie regulowana przez różne typy. Na przykład u kręgowców i roślin stosuje się metylację DNA, podczas gdy nie występuje ona u drożdży i much.