IBM InfoSphere DataStage

IBM InfoSphere DataStage
Oryginalni autorzy Lee Schefflera
Wersja stabilna
11.x
Platforma Narzędzie ETL
Typ Integracja danych
Strona internetowa http://www.ibm.com

IBM InfoSphere DataStage to narzędzie ETL będące częścią pakietu IBM Information Platforms Solutions i IBM InfoSphere. Wykorzystuje notację graficzną do tworzenia rozwiązań integracji danych i jest dostępny w różnych wersjach, takich jak Server Edition, Enterprise Edition i MVS Edition. Wykorzystuje architekturę klient-serwer. Serwery mogą być wdrażane zarówno w systemach Unix, jak i Windows.

Jest to potężne narzędzie integracji danych, często wykorzystywane w projektach Hurtowni Danych do przygotowania danych do generowania raportów.

Historia

DataStage wywodzi się z VMark Software Inc , firmy, która opracowała dwa godne uwagi produkty: bazę danych UniVerse oraz narzędzie DataStage ETL. Pierwszy prototyp VMark ETL został zbudowany przez Lee Schefflera w pierwszej połowie 1996 roku. Peter Weyman był wiceprezesem ds. strategii VMark i zidentyfikował rynek ETL jako szansę. Na architekta wyznaczył Lee Schefflera i wymyślił markę produktu „Stage”, aby oznaczać modułowość i zorientowanie na komponenty. Ten znacznik był używany do nazwy DataStage, a następnie używany w powiązanych produktach QualityStage, ProfileStage, MetaStage i AuditStage. Lee Scheffler przedstawił przegląd produktu DataStage zarządowi VMark w czerwcu 1996 roku i został on zatwierdzony do dalszego rozwoju. Produkt był w fazie testów alfa w październiku, testów beta w listopadzie i był ogólnie dostępny w styczniu 1997 roku.

VMARK i Unidata połączyły się w październiku 1997 i zmieniły nazwę na Ardent Software . W 1999 roku firma Ardent Software została przejęta przez firmę Informix, dostawcę oprogramowania do baz danych. W kwietniu 2001 IBM przejął Informix i przejął tylko działalność związaną z bazami danych, pozostawiając narzędzia do integracji danych jako niezależną firmę programistyczną o nazwie Ascential Software . W listopadzie 2001 r. Ascential Software Corp. z Westboro w stanie Massachusetts nabyła prywatną firmę Torrent Systems Inc. z Cambridge w stanie Massachusetts za 46 milionów dolarów w gotówce. Ascential ogłosił zobowiązanie do zintegrowania możliwości przetwarzania równoległego Orchestrate bezpośrednio z platformą DataStageXE. W marcu 2005 IBM nabyła Ascential Software i uczyniła DataStage częścią rodziny WebSphere jako WebSphere DataStage. W 2006 roku produkt został wydany jako część IBM Information Server w ramach rodziny Information Management, ale nadal był znany jako WebSphere DataStage. W 2008 roku nazwa pakietu została zmieniona na InfoSphere Information Server, a nazwa produktu została zmieniona na InfoSphere DataStage.

Wydania

  • Enterprise Edition (PX): nazwa nadana wersji DataStage, która miała architekturę przetwarzania równoległego i równoległe zadania ETL.
  • Server Edition: nazwa oryginalnej wersji DataStage reprezentująca zadania serwera. Wczesne wersje DataStage zawierały tylko zadania serwera. DataStage 5 dodał zadania sekwencyjne, a DataStage 6 dodał zadania równoległe za pośrednictwem wersji Enterprise.
  • Wersja MVS: zadania mainframe , opracowane na platformie Windows lub Unix/Linux i przeniesione na mainframe jako skompilowane zadania mainframe.
  • DataStage for PeopleSoft: wersja serwerowa z gotowymi zadaniami PeopleSoft EPM w ramach umowy OEM z PeopleSoft i Oracle Corporation .
  • DataStage TX: do przetwarzania złożonych transakcji i komunikatów, wcześniej znany jako „Mercator”. Obecnie znany jako IBM Transformation Extender.
  • ISD (Information Services Director, np. DataStage RTI): Pakiet integracji w czasie rzeczywistym może przekształcić zadania serwera lub zadania równoległe w usługi SOA .

Przejęcie IBM

InfoSphere DataStage to potężne narzędzie do integracji danych. Został przejęty przez IBM w 2005 roku i stał się częścią IBM Information Server Platform. Wykorzystuje projekt klient/serwer, w którym zadania są tworzone i administrowane przez klienta Windows w centralnym repozytorium na serwerze. IBM InfoSphere DataStage jest w stanie integrować dane na żądanie z wielu źródeł danych i aplikacji docelowych o dużej objętości, korzystając z wysokowydajnej struktury równoległej. InfoSphere DataStage ułatwia również rozszerzone zarządzanie metadanymi i łączność korporacyjną

Główne wersje DataStage i cykl życia

Linki zewnętrzne