Dzienniki informacyjne

Infologi to niezależnie zaprojektowane syntetyczne geny pochodzące z jednego lub kilku genów, w których substytucje są systematycznie wprowadzane w celu maksymalizacji informacji. Infologi są zaprojektowane z myślą o idealnej dystrybucji różnorodności, aby zmaksymalizować wydajność wyszukiwania.

Typowe metody inżynierii białek polegają na badaniu przesiewowym dużej liczby (10 6 -10 12 lub więcej) wariantów genów w celu zidentyfikowania osobników o zwiększonej aktywności przy użyciu zastępczego wysokoprzepustowego przeszukiwania (HTP) w celu identyfikacji początkowych trafień. Niestety, wyniki są definiowane przez to, co jest badane, dlatego „trafienie” z ekranu HTP często ma bardzo małą rzeczywistą aktywność w teście o niższej przepustowości, co bardziej wskazuje na ulepszoną funkcjonalność, dla której opracowywane jest białko. Dostosowując standardowe algorytmy inżynierii złożonych systemów do pracy z systemami biologicznymi, powstały proces umożliwia naukowcom dekonwolucję sposobu, w jaki substytucje w sekwencji białka modyfikują jego funkcję. Połączenie tych algorytmów ze zintegrowanym mechanizmem zapytań i rankingów pozwala na identyfikację odpowiednich podstawień sekwencji. Infolog odnosi się do zestawu zaprojektowanych genów, pojedyncze użycie Infolog opisuje indywidualny wariant.

Infologi pokazują pełne zróżnicowanie rozkładu przestrzeni

Pochodzenie

Homologia między sekwencjami białek lub DNA jest definiowana w kategoriach wspólnego pochodzenia. Dwa segmenty DNA mogą mieć wspólne pochodzenie z powodu zdarzenia specjacji (ortologi) lub zdarzenia duplikacji (paralogi).

Homologami są podobne geny i/lub białka, które są spokrewnione ze względu na pochodzenie.

Ortologi to „ten sam” gen, ale z różnych organizmów. Sekwencje homologiczne są ortologiczne, jeśli zostały rozdzielone przez zdarzenie specjacyjne: kiedy gatunek rozdziela się na dwa oddzielne gatunki, mówi się, że kopie pojedynczego genu w dwóch powstałych gatunkach są ortologiczne. Ortologi lub geny ortologiczne to geny różnych gatunków, które powstały w wyniku pionowego pochodzenia z pojedynczego genu ostatniego wspólnego przodka. Termin „ortolog” został ukuty w 1970 roku przez Waltera Fitcha.

Paralogi to pokrewne geny wywodzące się z jednego genu, który w wyniku duplikacji stał się dwoma genami, które z biegiem czasu wyewoluowały dla dwóch oddzielnych funkcji (lub, zgodnie z niedawnym artykułem Science, rozwiązłym genem początkowym, który duplikował się, a każda kopia ewoluowała w kierunku różnych funkcji). Paralogi zazwyczaj mają tę samą lub podobną funkcję, ale czasami nie: z powodu braku pierwotnej presji selekcyjnej na jedną kopię zduplikowanego genu, kopia ta może swobodnie mutować i nabywać nowe funkcje. Paralogi zwykle występują w obrębie tego samego gatunku.

Ksenologi to homologi powstałe w wyniku poziomego transferu genów między dwoma organizmami. Ksenologi mogą pełnić różne funkcje, jeśli nowe środowisko jest zupełnie inne dla genu poruszającego się poziomo. Ogólnie rzecz biorąc, ksenologowie zazwyczaj pełnią podobną funkcję w obu organizmach.

Infologi to podobne geny i / lub białka, które są spokrewnione przez syntetyczne pochodzenie, aby osiągnąć idealną dystrybucję różnorodności.

Cechy

  • Optymalizuj bezpośrednio pod kątem funkcji w końcowej aplikacji
  • Nie wymaga ekranów o dużej przepustowości (HTP).
  • Przeskanuj niewielką liczbę wariantów (50-200) bezpośrednio pod kątem żądanej funkcji
  • Zmniejszona liczba fałszywych alarmów: warianty zidentyfikowane przez ekrany HTP, które nie zachowują aktywności w „prawdziwym” teście
  • Zmniejszona utrata potencjalnych trafień pozytywnych z powodu błędu przesiewowego lub słabej korelacji między ekranem HTP a „prawdziwym” testem
  • Nie są wymagane kolekcje różnorodności biologicznej, wszystko jest syntetyzowane w razie potrzeby
  • Zależności sekwencja-funkcja stanowią podstawę silnych zastrzeżeń patentowych dotyczących składu materii.

Studium przypadku

Przekształcanie inżynierii białek za pomocą dzienników informacyjnych:

Korzystanie z niezależnie zaprojektowanych genów syntetycznych , w których substytucje są systematycznie wprowadzane (Infologs), prowadzi do jednolitego pobierania próbek, systematycznej wariancji i nieograniczonych bogatych w informacje wyników. S-transferazy glutationu pszenicy (GST) ze zdolnością do detoksykacji panelu powszechnych herbicydów został zaprojektowany przy użyciu tej opatentowanej metody bioinżynieryjnej. Względny funkcjonalny wkład 60 substytucji aminokwasów w stosunku do 14 herbicydów został określony ilościowo przy użyciu tylko 96 dzienników informacyjnych i radykalnie poprawiony przez mały zestaw (16) dzienników informacyjnych drugiej generacji. Ponadto stworzono wysoce przewidywalne modele funkcji sekwencji GST przeciwko dwóm komercyjnie istotnym herbicydom z ilościowym określeniem względnego udziału funkcjonalnego 60 podstawień aminokwasów w dwóch wymiarach.

Homologowie: Naturalnie występujące geny, które mają wspólne pochodzenie i cechy. Różnorodność jest stronnicza i niesystematyczna.
Infologi: Niezależnie zaprojektowane syntetyczne geny pochodzące z jednego lub kilku genów, w których substytucje są systematycznie wprowadzane w celu maksymalizacji informacji. Infologi są zaprojektowane z myślą o idealnej dystrybucji różnorodności, aby zmaksymalizować wydajność wyszukiwania.
Porównanie homologów i infologów

Racjonalne projektowanie białek

W racjonalnym projektowaniu białek naukowiec wykorzystuje szczegółową wiedzę na temat struktury i funkcji białka, aby wprowadzić pożądane zmiany. Ma to na ogół tę zaletę, że jest technicznie łatwe i niedrogie, ponieważ ukierunkowanej mutagenezy są dobrze rozwinięte. Jednak jego główną wadą jest to, że szczegółowa wiedza o strukturze białka jest często niedostępna, a nawet jeśli jest dostępna, przewidzenie skutków różnych mutacji może być niezwykle trudne.

Algorytmy obliczeniowego projektowania białek mają na celu identyfikację nowych sekwencji aminokwasowych, które mają niską energię po złożeniu do określonej struktury docelowej. Chociaż przestrzeń konformacji sekwencji, którą należy przeszukać, jest duża, największym wyzwaniem dla obliczeniowego projektowania białek jest szybka, ale dokładna funkcja energii, która może odróżnić optymalne sekwencje od podobnych suboptymalnych.

Zobacz też

Dalsza lektura

Linki zewnętrzne