Dzienniki informacyjne

Infologi to niezależnie zaprojektowane syntetyczne geny pochodzące z jednego lub kilku genów, w których substytucje są systematycznie wprowadzane w celu maksymalizacji informacji. Infologi są zaprojektowane z myślą o idealnej dystrybucji różnorodności, aby zmaksymalizować wydajność wyszukiwania.

Typowe metody inżynierii białek polegają na badaniu przesiewowym dużej liczby (10 ⁶ -10 ¹² lub więcej) wariantów genów w celu zidentyfikowania osobników o zwiększonej aktywności przy użyciu zastępczego wysokoprzepustowego przeszukiwania (HTP) w celu identyfikacji początkowych trafień. Niestety, wyniki są definiowane przez to, co jest badane, dlatego „trafienie” z ekranu HTP często ma bardzo małą rzeczywistą aktywność w teście o niższej przepustowości, co bardziej wskazuje na ulepszoną funkcjonalność, dla której opracowywane jest białko. Dostosowując standardowe algorytmy inżynierii złożonych systemów do pracy z systemami biologicznymi, powstały proces umożliwia naukowcom dekonwolucję sposobu, w jaki substytucje w sekwencji białka modyfikują jego funkcję. Połączenie tych algorytmów ze zintegrowanym mechanizmem zapytań i rankingów pozwala na identyfikację odpowiednich podstawień sekwencji. Infolog odnosi się do zestawu zaprojektowanych genów, pojedyncze użycie Infolog opisuje indywidualny wariant.

Infologi pokazują pełne zróżnicowanie rozkładu przestrzeni

Pochodzenie

Homologia między sekwencjami białek lub DNA jest definiowana w kategoriach wspólnego pochodzenia. Dwa segmenty DNA mogą mieć wspólne pochodzenie z powodu zdarzenia specjacji (ortologi) lub zdarzenia duplikacji (paralogi).

Homologami są podobne geny i/lub białka, które są spokrewnione ze względu na pochodzenie.

Ortologi to „ten sam” gen, ale z różnych organizmów. Sekwencje homologiczne są ortologiczne, jeśli zostały rozdzielone przez zdarzenie specjacyjne: kiedy gatunek rozdziela się na dwa oddzielne gatunki, mówi się, że kopie pojedynczego genu w dwóch powstałych gatunkach są ortologiczne. Ortologi lub geny ortologiczne to geny różnych gatunków, które powstały w wyniku pionowego pochodzenia z pojedynczego genu ostatniego wspólnego przodka. Termin „ortolog” został ukuty w 1970 roku przez Waltera Fitcha.

Paralogi to pokrewne geny wywodzące się z jednego genu, który w wyniku duplikacji stał się dwoma genami, które z biegiem czasu wyewoluowały dla dwóch oddzielnych funkcji (lub, zgodnie z niedawnym artykułem Science, rozwiązłym genem początkowym, który duplikował się, a każda kopia ewoluowała w kierunku różnych funkcji). Paralogi zazwyczaj mają tę samą lub podobną funkcję, ale czasami nie: z powodu braku pierwotnej presji selekcyjnej na jedną kopię zduplikowanego genu, kopia ta może swobodnie mutować i nabywać nowe funkcje. Paralogi zwykle występują w obrębie tego samego gatunku.

Ksenologi to homologi powstałe w wyniku poziomego transferu genów między dwoma organizmami. Ksenologi mogą pełnić różne funkcje, jeśli nowe środowisko jest zupełnie inne dla genu poruszającego się poziomo. Ogólnie rzecz biorąc, ksenologowie zazwyczaj pełnią podobną funkcję w obu organizmach.

Infologi to podobne geny i / lub białka, które są spokrewnione przez syntetyczne pochodzenie, aby osiągnąć idealną dystrybucję różnorodności.

Cechy

Optymalizuj bezpośrednio pod kątem funkcji w końcowej aplikacji
Nie wymaga ekranów o dużej przepustowości (HTP).
Przeskanuj niewielką liczbę wariantów (50-200) bezpośrednio pod kątem żądanej funkcji
Zmniejszona liczba fałszywych alarmów: warianty zidentyfikowane przez ekrany HTP, które nie zachowują aktywności w „prawdziwym” teście
Zmniejszona utrata potencjalnych trafień pozytywnych z powodu błędu przesiewowego lub słabej korelacji między ekranem HTP a „prawdziwym” testem
Nie są wymagane kolekcje różnorodności biologicznej, wszystko jest syntetyzowane w razie potrzeby
Zależności sekwencja-funkcja stanowią podstawę silnych zastrzeżeń patentowych dotyczących składu materii.

Studium przypadku

Przekształcanie inżynierii białek za pomocą dzienników informacyjnych:

Korzystanie z niezależnie zaprojektowanych genów syntetycznych , w których substytucje są systematycznie wprowadzane (Infologs), prowadzi do jednolitego pobierania próbek, systematycznej wariancji i nieograniczonych bogatych w informacje wyników. S-transferazy glutationu pszenicy (GST) ze zdolnością do detoksykacji panelu powszechnych herbicydów został zaprojektowany przy użyciu tej opatentowanej metody bioinżynieryjnej. Względny funkcjonalny wkład 60 substytucji aminokwasów w stosunku do 14 herbicydów został określony ilościowo przy użyciu tylko 96 dzienników informacyjnych i radykalnie poprawiony przez mały zestaw (16) dzienników informacyjnych drugiej generacji. Ponadto stworzono wysoce przewidywalne modele funkcji sekwencji GST przeciwko dwóm komercyjnie istotnym herbicydom z ilościowym określeniem względnego udziału funkcjonalnego 60 podstawień aminokwasów w dwóch wymiarach.

Homologowie: Naturalnie występujące geny, które mają wspólne pochodzenie i cechy. Różnorodność jest stronnicza i niesystematyczna.

Infologi: Niezależnie zaprojektowane syntetyczne geny pochodzące z jednego lub kilku genów, w których substytucje są systematycznie wprowadzane w celu maksymalizacji informacji. Infologi są zaprojektowane z myślą o idealnej dystrybucji różnorodności, aby zmaksymalizować wydajność wyszukiwania.

Porównanie homologów i infologów

Racjonalne projektowanie białek

W racjonalnym projektowaniu białek naukowiec wykorzystuje szczegółową wiedzę na temat struktury i funkcji białka, aby wprowadzić pożądane zmiany. Ma to na ogół tę zaletę, że jest technicznie łatwe i niedrogie, ponieważ ukierunkowanej mutagenezy są dobrze rozwinięte. Jednak jego główną wadą jest to, że szczegółowa wiedza o strukturze białka jest często niedostępna, a nawet jeśli jest dostępna, przewidzenie skutków różnych mutacji może być niezwykle trudne.

Algorytmy obliczeniowego projektowania białek mają na celu identyfikację nowych sekwencji aminokwasowych, które mają niską energię po złożeniu do określonej struktury docelowej. Chociaż przestrzeń konformacji sekwencji, którą należy przeszukać, jest duża, największym wyzwaniem dla obliczeniowego projektowania białek jest szybka, ale dokładna funkcja energii, która może odróżnić optymalne sekwencje od podobnych suboptymalnych.

Zobacz też

Dalsza lektura

GRC Biocatalysis, 2014: Systematyczna eksploracja przestrzeni sekwencji dla plakatu inżynierii białek
Chen, Fei; Gaucher, Eric A.; Leal, Nicole A.; Hutter, Daniel; Havemann, Stephanie A.; Govindarajan, Sridhar; Ortlund, Eric A.; Benner, Steven A. (2010). „Zrekonstruowane ewolucyjne ścieżki adaptacyjne dają polimerazy akceptujące odwracalne terminatory do sekwencjonowania i wykrywania SNP” . Obrady Narodowej Akademii Nauk . 107 (5): 1948–53. Bibcode : 2010PNAS..107.1948C . doi : 10.1073/pnas.0908463107 . PMC 2804741 . PMID 20080675 .
Heinzelman, Pete; Śnieg, Christopher D.; Smith, Mateusz A.; Yu, Xinlin; Kannan, Arvind; Boulware, Kevin; Villalobos, Alan; Govindarajan, Sridhar; i in. (2009). „SCHEMA Rekombinacja grzybowej celulazy ujawnia pojedynczą mutację, która znacznie przyczynia się do stabilności” . Dziennik Chemii Biologicznej . 284 (39): 26229–33. doi : 10.1074/jbc.C109.034058 . PMC 2785310 . PMID 19625252 .
Heinzelman, Pete; Śnieg, Christopher D.; Wu, Indira; Nguyen, Katarzyna; Villalobos, Alan; Govindarajan, Sridhar; Minshul, Jeremy; Arnold, Frances H. (2009). „Rodzina termostabilnych celulaz grzybowych stworzonych przez rekombinację sterowaną strukturą” (PDF) . Obrady Narodowej Akademii Nauk . 106 (14): 5610–5. Bibcode : 2009PNAS..106.5610H . doi : 10.1073/pnas.0901417106 . JSTOR 40454838 . PMC 2667002 . PMID 19307582 .
Ehren, J.; Govindarajan, S.; Kretyn, B.; Minshul, J.; Khosla, C. (2008). „Inżynieria białkowa ulepszonych endopeptydaz prolilowych do terapii sprue celiakii” . Projektowanie i wybór inżynierii białek . 21 (12): 699–707. doi : 10.1093/białko/gzn050 . PMC 2583057 . PMID 18836204 .
Liao, czerwiec; Warmuth, Manfred K; Govindarajan, Sridhar; Ness, Jon E.; Wang, Rebecca P; Gustafsson, Claes; Minshul, Jeremy (2007). „Inżynieria proteinazy K przy użyciu uczenia maszynowego i genów syntetycznych” . BMC Biotechnologia . 7 : 16. doi : 10.1186/1472-6750-7-16 . PMC 1847811 . PMID 17386103 .
Minshul, Jeremy; Ness, Jon E.; Gustafsson, Claes; Govindarajan, Sridhar (2005). „Przewidywanie funkcji enzymu na podstawie sekwencji białek”. Aktualna opinia w biologii chemicznej . 9 (2): 202–9. doi : 10.1016/j.cbpa.2005.02.003 . PMID 15811806 .
Gustafsson, Claes; Govindarajan, Sridhar; Minshul, Jeremy (2003). „Przywracanie inżynierii do inżynierii białek: bioinformatyczne podejście do projektowania katalizatorów”. Aktualna opinia w biotechnologii . 14 (4): 366–70. doi : 10.1016/S0958-1669(03)00101-0 . PMID 12943844 .

Linki zewnętrzne