Anduril (silnik przepływu pracy)

Andurila
Deweloperzy Laboratorium Biologii Systemów Uniwersytetu w Helsinkach
Pierwsze wydanie 1 lipca 2010 ; 12 lat temu ( 01.07.2010 )
Wersja stabilna
2.0.0 ( 01.07.2016 ) / 1 lipca 2016 ; 6 lat temu ( 01.07.2016 )
Magazyn
Napisane w Jawa
System operacyjny Linux , Microsoft Windows , Mac OS X
Typ Silnik przepływu pracy
Licencja GPL (v.1.x), BSD (v.2.x)
Strona internetowa www .anduril .org

Anduril to oparta na komponentach struktura przepływu pracy typu open source do analizy danych naukowych, opracowana w Laboratorium Biologii Systemów Uniwersytetu Helsińskiego .

Anduril został zaprojektowany, aby umożliwić systematyczną, elastyczną i wydajną analizę danych, szczególnie w zakresie wysokowydajnych eksperymentów w badaniach biomedycznych. System przepływu pracy zapewnia obecnie komponenty do kilku rodzajów analiz, takich jak sekwencjonowanie , ekspresja genów , SNP , ChIP-on-chip , porównawcza hybrydyzacja genomowa i analiza mikromacierzy eksonów, a także cytometria i analiza obrazowania komórek .

Architektura i funkcje

Przepływ pracy to seria etapów przetwarzania połączonych ze sobą w taki sposób, że dane wyjściowe jednego kroku są używane jako dane wejściowe innego. Etapy przetwarzania realizują zadania analizy danych, takie jak import danych, testy statystyczne i generowanie raportów. W Anduril etapy przetwarzania są realizowane przy użyciu komponentów, które są wykonywalnym kodem wielokrotnego użytku, który można napisać w dowolnym języku programowania. Komponenty są połączone razem w przepływ pracy lub sieć komponentów, która jest wykonywana przez silnik przepływu pracy Anduril. Konfiguracja przepływu pracy odbywa się przy użyciu prostego, ale wydajnego języka skryptowego AndurilScript. Konfigurację i wykonywanie przepływu pracy można wykonać z Eclipse , popularnego uniwersalnego interfejsu GUI lub z wiersza poleceń.

Rdzeń silnika Anduril jest napisany w Javie, a komponenty są napisane w różnych językach programowania, w tym Java, R , MATLAB , Lua , Perl i Python . Komponenty mogą być również zależne od bibliotek innych firm, takich jak Bioconductor . Dostarczane są komponenty do obrazowania komórek i analizy mikromacierzy, ale użytkownicy mogą zaimplementować dodatkowe komponenty. Rdzeń Anduril został przetestowany na systemach Linux i Windows.

Anduril 1.0: język AndurilScript

Hello world w AndurilScript jest po prostu

   std  .  echo  (  "Witaj świecie!"  ) 

Komentowanie jest zgodne ze składnią języka Java:

  
  
   // Prosty komentarz  /* Kolejny prosty komentarz */  /** Opis, który zostanie zawarty w opisie komponentu */ 

Komponenty są wywoływane przez przypisanie ich wywołań do nazwanych instancji komponentów. Nazwy nie mogą być ponownie używane w ramach jednego przepływu pracy. Istnieją specjalne komponenty dla plików wejściowych, które zawierają pliki zewnętrzne do skryptu. Obsługiwane typy atomowe to liczby całkowite, zmiennoprzecinkowe, logiczne i łańcuchowe, a wpisywanie odbywa się niejawnie.

    
    
          in1  =  INPUT  (  ścieżka  =  "myFile.csv"  )  stała 1  =  1  elementInstancja1  =  Mój składnik  (  port wejściowy1  =  in1  ,  parametr_wejściowy1  =  stała1  ) 

Przepływy pracy są konstruowane poprzez przypisanie wyjść instancji komponentów do wejść kolejnych komponentów.

       składnikInstancja2  =  InnyKomponent  (  port wejściowy1  =  elementInstancja1  .  port wyjściowy1  ) 

Instancje komponentów można również opakować jako funkcje.

        
                          
                           
  
        
         
   function  MojaFunkcja  (  InType1  in1  ,  ...,  opcjonalnie  InTypeM  inM  ,  ParType1  param1  ,  ...,  ParTypeP  paramP  =  defaultP  )  ->  (  OutType1  out1  ,  ...,  OutTypeN  outN  )  {  ...  instrukcje  ...  zwracaj  rekord  (  out1  =  x1  ,  ...,  outN  =  xN  )  } 

Oprócz standardowych instrukcji if-else i switch-case, AndurilScript zawiera również pętle for.

  
    
      
        
   // Iteruje po 1, 2, ..., 10  array  =  record  ()  for  i  :  std  .  zakres  (  1  ,  10  )  {  tablica  [  i  ]  =  Jakiś Składnik  (  k  =  i  )  } 

Rozciągliwość

Anduril można rozbudowywać na wielu poziomach. Użytkownicy mogą dodawać nowe komponenty do istniejących pakietów komponentów. Jeśli jednak nowy komponent lub komponenty wykonują zadania niezwiązane z istniejącymi pakietami, użytkownicy mogą również tworzyć nowe pakiety.

Moksiskaan

Zdenerwowana twarz logo Moksiskaan

Moksiskaan to platforma integracji danych dla badań nad rakiem i biologii molekularnej . Ramy zapewniają relacyjną bazę danych, która reprezentuje wykres jednostek biologicznych, takich jak geny, białka, leki, szlaki, choroby, procesy biologiczne, składniki komórkowe i funkcje molekularne. Ponadto istnieje szeroki zestaw narzędzi analitycznych i akcesyjnych zbudowanych na podstawie tych danych. Zdecydowana większość tych narzędzi jest zaimplementowana jako komponenty i funkcje Anduril.

Moksiskaan jest używany głównie do interpretacji list kandydujących genów uzyskanych z badań genomicznych. Jego narzędzia mogą być używane do generowania wykresów jednostek biologicznych związanych z genami wejściowymi. Dokładny przebieg tych wykresów może różnić się od przewidywań celu leku do szeregów czasowych kaskad sygnalizacyjnych. Niektóre z celów tych narzędzi są ściśle związane z IPA .

Zobacz też

Dalsza lektura

Linki zewnętrzne