Wirtualny pokaz

Rysunek 1. Schemat przepływu wirtualnego badania przesiewowego

Wirtualne przeszukiwanie ( VS ) to technika obliczeniowa stosowana w odkrywaniu leków do przeszukiwania bibliotek małych cząsteczek w celu zidentyfikowania tych struktur, które z największym prawdopodobieństwem zwiążą się z celem leku , zwykle z receptorem białkowym lub enzymem .

Wirtualne badania przesiewowe zostały zdefiniowane jako „automatyczna ocena bardzo dużych bibliotek związków” przy użyciu programów komputerowych. Jak sugeruje ta definicja, VS był w dużej mierze grą liczbową skupiającą się na tym, jak ogromna przestrzeń chemiczna ponad 10 60 możliwe do wyobrażenia związki można filtrować do rozsądnej liczby, którą można zsyntetyzować, kupić i przetestować. Chociaż przeszukiwanie całego chemicznego wszechświata może być teoretycznie interesującym problemem, bardziej praktyczne scenariusze VS koncentrują się na projektowaniu i optymalizacji ukierunkowanych bibliotek kombinatorycznych oraz wzbogacaniu bibliotek dostępnych związków z wewnętrznych repozytoriów związków lub ofert dostawców. Ponieważ dokładność metody wzrosła, wirtualne badania przesiewowe stały się integralną częścią odkrywania leków proces. Wirtualne badanie przesiewowe można wykorzystać do wybrania związków do badań przesiewowych w domowej bazie danych, wybrania związków, które można kupić z zewnątrz, oraz do wybrania, który związek powinien zostać zsyntetyzowany w następnej kolejności.

Metody

Istnieją dwie szerokie kategorie technik przesiewowych: oparte na ligandach i oparte na strukturze. Pozostała część tej strony będzie odzwierciedlać Ryc. 1 Schemat blokowy wirtualnego badania przesiewowego.

Metody oparte na ligandach

Biorąc pod uwagę zestaw strukturalnie zróżnicowanych ligandów , które wiążą się z receptorem , model receptora można zbudować wykorzystując zbiorczą informację zawartą w takim zestawie ligandów. Różne techniki obliczeniowe badają strukturalny, elektroniczny, molekularny kształt i podobieństwa fizykochemiczne różnych ligandów, które mogą sugerować ich sposób działania przeciwko określonemu receptorowi molekularnemu lub liniom komórkowym. Kandydujący ligand można następnie porównać z modelem farmakoforowym, aby określić, czy jest z nim zgodny, a zatem prawdopodobnie wiąże się. Do przeskanowania baz danych w celu znalezienia aktywnych ligandów zastosowano różne metody dwuwymiarowej analizy podobieństw chemicznych. Inne popularne podejście stosowane w wirtualnym skriningu opartym na ligandach polega na wyszukiwaniu cząsteczek o kształcie podobnym do znanych substancji aktywnych, ponieważ takie cząsteczki będą pasować do miejsca wiązania celu, a zatem prawdopodobnie zwiążą się z celem. W literaturze można znaleźć wiele potencjalnych zastosowań tej klasy technik. Rozszerzenia farmakoforyczne tych metod 3D są również swobodnie dostępne jako serwery internetowe. Dużą popularność zyskały również wirtualne badania przesiewowe oparte na kształcie.

Metody oparte na strukturze

Podejście do wirtualnych badań przesiewowych opartych na strukturze obejmuje różne techniki obliczeniowe, które uwzględniają strukturę receptora, który jest celem molekularnym badanych aktywnych ligandów. Niektóre z tych technik obejmują dokowanie molekularne , przewidywanie farmakoforów oparte na strukturze i symulacje dynamiki molekularnej. Dokowanie molekularne jest najczęściej stosowaną techniką opartą na strukturze i stosuje funkcję punktacji oszacować dopasowanie każdego ligandu do miejsca wiązania receptora makrocząsteczkowego, pomagając wybrać ligandy o najwyższym powinowactwie. Obecnie istnieje kilka serwerów WWW zorientowanych na prospektywne wirtualne badania przesiewowe.

Metody hybrydowe

Opracowano również metody hybrydowe, które opierają się na podobieństwie strukturalnym i ligandowym, aby przezwyciężyć ograniczenia tradycyjnych metod VLS. Ta metodologia wykorzystuje oparte na ewolucji informacje o wiązaniu ligandów do przewidywania wiązań małocząsteczkowych i może wykorzystywać zarówno globalne podobieństwo strukturalne, jak i podobieństwo kieszonkowe. Podejście oparte na globalnym podobieństwie strukturalnym wykorzystuje zarówno strukturę eksperymentalną, jak i przewidywany model białka, aby znaleźć podobieństwo strukturalne z białkami w bibliotece holo-szablonów PDB. Po wykryciu znacznego podobieństwa strukturalnego, metryka współczynnika Tanimoto oparta na odciskach palców 2D jest stosowana do przeszukiwania małych cząsteczek, które są podobne do ligandów wyekstrahowanych z wybranych szablonów holo PDB. Przewidywania z tej metody zostały ocenione eksperymentalnie i wykazują dobre wzbogacenie w identyfikowaniu aktywnych małych cząsteczek.

Wyżej określona metoda zależy od globalnego podobieństwa strukturalnego i nie jest w stanie a priori wybrać konkretnego miejsca wiązania ligandu w białku będącym przedmiotem zainteresowania. Ponadto, ponieważ metody opierają się na ocenie podobieństwa ligandów w 2D, nie są one w stanie rozpoznać podobieństwa stereochemicznego małych cząsteczek, które są zasadniczo różne, ale wykazują podobieństwo kształtu geometrycznego. opracowano i oceniono eksperymentalnie nowe podejście skoncentrowane na kieszeniach, PoLi, zdolne do celowania w określone kieszenie wiążące w szablonach holo-białkowych.

Infrastruktura komputerowa

Obliczanie interakcji parami między atomami, które jest warunkiem działania wielu wirtualnych programów przesiewowych, jest to liczba system. Ze względu na skalowanie kwadratowe koszty obliczeniowe szybko rosną.

Podejście oparte na ligandach

Metody oparte na ligandach zwykle wymagają ułamka sekundy na pojedynczą operację porównania struktury. Czasami wystarczy jeden procesor, aby przeprowadzić duże skanowanie w ciągu kilku godzin. Jednak kilka porównań można wykonać równolegle, aby przyspieszyć przetwarzanie dużej bazy danych związków.

Podejście strukturalne

Rozmiar zadania wymaga równoległej infrastruktury obliczeniowej , takiej jak klaster systemów Linux , z uruchomionym procesorem kolejki wsadowej do obsługi pracy, takim jak Sun Grid Engine lub Torque PBS.

Potrzebny jest sposób obsługi danych wejściowych z dużych bibliotek złożonych. Wymaga to formy złożonej bazy danych, która może być przeszukiwana przez klaster równoległy, dostarczając związki równolegle do różnych węzłów obliczeniowych. Komercyjne silniki baz danych mogą być zbyt ciężkie, a szybki silnik indeksujący, taki jak Berkeley DB , może być lepszym wyborem. Ponadto przeprowadzanie jednego porównania na zadanie może nie być wydajne, ponieważ czas uruchamiania węzłów klastra może z łatwością przewyższyć ilość użytecznej pracy. Aby obejść ten problem, konieczne jest przetwarzanie partii związków w każdym zadaniu klastra, agregowanie wyników do pewnego rodzaju pliku dziennika. Drugi proces, mający na celu eksplorację plików dziennika i wyodrębnienie kandydatów o wysokiej punktacji, można następnie uruchomić po uruchomieniu całego eksperymentu.

Dokładność

Celem wirtualnych badań przesiewowych jest identyfikacja cząsteczek o nowej strukturze chemicznej, które wiążą się z docelowym makrocząsteczką . Tak więc sukces wirtualnego ekranu jest definiowany w kategoriach znalezienia nowych, interesujących rusztowań, a nie całkowitej liczby trafień. Interpretacje dokładności wirtualnego przesiewania należy zatem traktować z ostrożnością. Niskie wskaźniki trafień interesujących rusztowań są wyraźnie lepsze niż wysokie wskaźniki trafień już znanych rusztowań.

Większość testów wirtualnych badań przesiewowych w literaturze ma charakter retrospektywny. W tych badaniach wydajność techniki VS jest mierzona przez jej zdolność do odzyskania małego zestawu wcześniej znanych cząsteczek o powinowactwie do celu będącego przedmiotem zainteresowania (cząsteczek aktywnych lub tylko substancji aktywnych) z biblioteki zawierającej znacznie wyższy odsetek zakładanych nieaktywnych lub wabiki. Istnieje kilka różnych sposobów wybierania wabików poprzez dopasowanie właściwości odpowiedniej aktywnej cząsteczki, a ostatnio wabiki są również wybierane w sposób niezrównany pod względem właściwości. Omówiono również rzeczywisty wpływ wyboru wabików do celów szkoleniowych lub testowych.

Natomiast w prospektywnych zastosowaniach wirtualnego skriningu uzyskane trafienia poddaje się eksperymentalnemu potwierdzeniu (np. pomiarom IC50 ). Panuje zgoda co do tego, że retrospektywne testy porównawcze nie są dobrymi predyktorami przyszłych wyników, w związku z czym tylko badania prospektywne stanowią rozstrzygający dowód przydatności techniki do określonego celu.

Zastosowanie do odkrywania leków

Wirtualny skrining jest bardzo przydatną aplikacją, jeśli chodzi o identyfikację cząsteczek trafionych jako początek chemii medycznej. W miarę jak podejście do wirtualnych badań przesiewowych zaczyna stawać się bardziej żywotną i istotną techniką w branży chemii medycznej, podejście to szybko się rozrosło.

Metody oparte na ligandach

Nie znając struktury, próbuje przewidzieć, w jaki sposób ligandy będą wiązać się z receptorem. Za pomocą właściwości farmakoforu każdy ligand identyfikuje donora i akceptora. Funkcje zrównywania są nakładane, jednak biorąc pod uwagę, że jest mało prawdopodobne, aby istniało jedno poprawne rozwiązanie.

Modele farmakoforowe

Technikę tę stosuje się podczas łączenia wyników poszukiwań przy użyciu odmiennych związków odniesienia, tych samych deskryptorów i współczynników, ale różnych związków aktywnych. Ta technika jest korzystna, ponieważ jest bardziej wydajna niż użycie jednej struktury referencyjnej wraz z najdokładniejszym działaniem, jeśli chodzi o różne substancje aktywne.

Farmakofor to zespół cech sterycznych i elektronicznych, które są potrzebne do uzyskania optymalnej interakcji supramolekularnej lub interakcji z biologiczną strukturą docelową w celu wytrącenia jej odpowiedzi biologicznej. Wybierz przedstawiciela jako zestaw elementów aktywnych, większość metod będzie szukać podobnych powiązań. Korzystne jest, aby mieć wiele sztywnych cząsteczek, a ligandy powinny być zróżnicowane, innymi słowy, aby mieć różne cechy, które nie występują podczas fazy wiązania.

Wirtualne badanie przesiewowe oparte na kształcie

Podejścia do podobieństwa molekularnego oparte na kształcie zostały uznane za ważne i popularne techniki wirtualnego przeszukiwania. Obecnie wysoce zoptymalizowana platforma przesiewowa ROCS (Rapid Overlay of Chemical Structures) jest de facto uznawana za branżowy standard wirtualnego przeszukiwania opartego na kształcie i liganda. Wykorzystuje funkcję Gaussa do definiowania objętości cząsteczkowych małych cząsteczek organicznych. Wybór konformacji zapytania jest mniej ważny, dzięki czemu badanie przesiewowe oparte na kształcie jest idealne do modelowania opartego na ligandach: ponieważ dostępność konformacji bioaktywnej dla zapytania nie jest czynnikiem ograniczającym badanie przesiewowe — jest to bardziej wybór związku zapytania ), która ma decydujące znaczenie dla wydajności przesiewania.

Wirtualne badania przesiewowe w terenie

Jako ulepszenie metod podobieństwa opartych na kształcie, metody oparte na polach próbują wziąć pod uwagę wszystkie pola, które wpływają na interakcję ligand-receptor, będąc jednocześnie niezależnymi od struktury chemicznej użytej jako zapytanie. Przykładami innych pól stosowanych w tych metodach są pola elektrostatyczne lub hydrofobowe.

Ilościowy związek struktura-aktywność

zależności ilościowej od struktury i aktywności (QSAR) składają się z modeli predykcyjnych opartych na informacjach uzyskanych z zestawu znanych aktywnych i znanych nieaktywnych związków. SAR (Structure Activity Relationship), w którym dane są traktowane jakościowo i mogą być używane z klasami strukturalnymi i więcej niż jednym trybem wiązania. Modele nadają priorytet związkom do odkrycia ołowiu.

Algorytmy uczenia maszynowego

Algorytmy uczenia maszynowego są szeroko stosowane w podejściach do wirtualnych badań przesiewowych. Techniki uczenia nadzorowanego wykorzystują zestawy danych treningowych i testowych złożone ze znanych aktywnych i znanych nieaktywnych związków. Różne algorytmy ML zostały z powodzeniem zastosowane w wirtualnych strategiach przesiewania, takich jak partycjonowanie rekurencyjne, maszyny wektorów nośnych , k-najbliższych sąsiadów i sieci neuronowe . Modele te znajdują prawdopodobieństwo, że związek jest aktywny, a następnie klasyfikują każdy związek na podstawie jego prawdopodobieństwa.

Analiza podstrukturalna w uczeniu maszynowym

Pierwszym modelem uczenia maszynowego używanym na dużych zbiorach danych jest analiza podstruktury, która została utworzona w 1973 roku. Każda podstruktura fragmentu stanowi ciągły wkład w działanie określonego typu. Substructure to metoda, która pokonuje trudności związane z masową wymiarowością, jeśli chodzi o analizę struktur w projektowaniu leków. Wydajna analiza podkonstrukcji jest stosowana w przypadku konstrukcji przypominających wielopoziomowy budynek lub wieżę. Geometria służy do numerowania połączeń granicznych dla danej struktury na początku iw kierunku kulminacji. Po opracowaniu metody specjalnej kondensacji statycznej i procedur podstawień okazuje się, że metoda ta jest bardziej wydajna niż poprzednie modele analizy podbudowy.

Partycjonowanie rekurencyjne

Partycjonowanie rekurencyjne to metoda tworzenia drzewa decyzyjnego przy użyciu danych jakościowych. Zrozumienie, w jaki sposób reguły dzielą klasy z niskim błędem błędnej klasyfikacji, powtarzając każdy krok, aż nie będzie można znaleźć żadnego rozsądnego podziału. Jednak partycjonowanie rekurencyjne może mieć słabą zdolność przewidywania, potencjalnie tworząc dobre modele z tą samą szybkością.

Metody oparte na strukturze znane z dokowania ligandów białkowych

Ligand może wiązać się z miejscem aktywnym w białku za pomocą algorytmu wyszukiwania dokowania i funkcji punktacji w celu zidentyfikowania najbardziej prawdopodobnej przyczyny dla pojedynczego liganda podczas przypisywania kolejności priorytetów.

Zobacz też

Dalsza lektura

Linki zewnętrzne

  • VLS3D – lista ponad 2000 baz danych, online i autonomicznych narzędzi in silico