HTCondor
Deweloperzy | Uniwersytet Wisconsin-Madison |
---|---|
Wersja stabilna | 10.0.1 LTS / 5 stycznia 2023 r .
|
Wersja podglądu | 10.2.3 / 21 lutego 2023
|
System operacyjny | Microsoft Windows , Mac OS X , Linux , FreeBSD |
Typ | Obliczenia o dużej przepustowości |
Licencja | Licencja Apache 2.0 |
Strona internetowa |
HTCondor to wysokowydajna platforma obliczeniowa typu open source do gruboziarnistej rozproszonej równoległości zadań wymagających dużej mocy obliczeniowej. Może być używany do zarządzania obciążeniem na dedykowanym klastrze komputerów lub do przerzucania pracy na nieaktywne komputery stacjonarne – tak zwane cykliczne oczyszczanie . HTCondor działa w systemach operacyjnych Linux , Unix , Mac OS X , FreeBSD i Microsoft Windows . HTCondor może integrować zarówno dedykowane zasoby (klastry rackowe), jak i niededykowane komputery stacjonarne (cykliczne oczyszczanie) w jedno środowisko obliczeniowe.
HTCondor został opracowany przez zespół HTCondor z University of Wisconsin-Madison i jest dostępny bezpłatnie. HTCondor podąża za open source i jest licencjonowany na licencji Apache 2.0.
Podczas gdy HTCondor wykorzystuje niewykorzystany czas pracy komputera, pozostawienie włączonych komputerów do użytku z HTCondor zwiększy zużycie energii i związane z tym koszty. Począwszy od wersji 7.1.1, HTCondor może hibernować i wybudzać maszyny w oparciu o zasady określone przez użytkownika, funkcja ta była wcześniej dostępna tylko za pośrednictwem oprogramowania innych firm.
Historia
Rozwój HTCondor rozpoczął się w 1988 roku.
HTCondor był wcześniej znany jako Condor; nazwa została zmieniona w październiku 2012 r. w celu rozstrzygnięcia pozwu dotyczącego znaku towarowego.
HTCondor był oprogramowaniem do planowania używanym do dystrybucji zadań dla pierwszego szkicu zespołu ludzkiego genomu.
Przykład użycia
Pula NASA Advanced Supercomputing Facility (NAS) HTCondor składa się z około 350 stacji roboczych SGI i Sun zakupionych i używanych do tworzenia oprogramowania, wizualizacji, poczty elektronicznej, przygotowywania dokumentów i innych zadań. Każda stacja robocza uruchamia demona , który obserwuje operacje wejścia/wyjścia użytkownika i obciążenie procesora. Kiedy stacja robocza jest bezczynna przez dwie godziny, zadanie z kolejki wsadowej jest przypisywane do stacji roboczej i będzie działać, dopóki demon nie wykryje naciśnięcia klawisza, ruchu myszy lub wysokiego użycia procesora innego niż HTCCondor. W tym momencie zadanie zostanie usunięte ze stacji roboczej i ponownie umieszczone w kolejce wsadowej.
Cechy
HTCondor może wykonywać zarówno zadania sekwencyjne, jak i równoległe. Zadania sekwencyjne można uruchamiać w kilku różnych „wszechświatach”, w tym „waniliowym”, który zapewnia możliwość uruchamiania większości programów „gotowych do wsadu”, oraz „standardowym wszechświecie”, w którym aplikacja docelowa jest ponownie połączona z biblioteką HTCondor I/O który zapewnia zdalne operacje wejścia/wyjścia zadania i punkt kontrolny zadania. HTCondor zapewnia również „wszechświat lokalny”, który umożliwia uruchamianie zadań na „hoście przesyłania”.
W świecie zadań równoległych, HTCondor obsługuje standardowy Message Passing Interface i Parallel Virtual Machine (Goux, et al. 2000) oprócz własnej biblioteki Master Worker „MW” dla ekstremalnie równoległych zadań.
HTCondor-G umożliwia zadania HTCondor na korzystanie z zasobów, które nie są pod jego bezpośrednią kontrolą. Jest używany głównie do komunikacji z gridowymi i chmurowymi , takimi jak pre-WS i WS Globus , Nordugrid ARC , UNICORE i Amazon Elastic Compute Cloud . Ale może być również używany do komunikacji z innymi systemami wsadowymi, takimi jak Torque/PBS i LSF . Wsparcie dla Sun Grid Engine jest obecnie rozwijane w ramach projektu EGEE . [ potrzebne źródło ]
HTCondor obsługuje API zadań DRMAA . Pozwala to klientom zgodnym z DRMAA na przesyłanie i monitorowanie zadań HTCondor. SAGA C++ Reference Implementation zapewnia wtyczkę (adapter) HTCondor, która udostępnia wysyłanie i monitorowanie zadań HTCondor za pośrednictwem interfejsów API SAGA Python i C++.
Inne funkcje HTCondor obejmują „DAGMan”, który zapewnia mechanizm opisujący zależności między zadaniami.
Zobacz też
- Lista ochotniczych projektów komputerowych
- Silnik siatki słonecznej
- IBM Spectrum LSF
- Obliczenia o dużej przepustowości