Integracja informacji korporacyjnych
Integracja informacji przedsiębiorstwa ( EII ) to możliwość obsługi ujednoliconego widoku danych i informacji dla całej organizacji. W wirtualizacji danych EII, proces integracji informacji , wykorzystujący abstrakcję danych w celu zapewnienia ujednoliconego interfejsu (znanego jako jednolity dostęp do danych ) do przeglądania wszystkich danych w organizacji oraz jednego zestawu struktur i konwencji nazewnictwa (tzw. jednolita reprezentacja informacji ) do reprezentowania tych danych; celem EII jest uzyskanie dużego zestawu heterogenicznych źródeł danych, aby wyglądały dla użytkownika lub systemu jako pojedyncze, jednorodne źródło danych.
Przegląd
Dane w przedsiębiorstwie mogą być przechowywane w heterogenicznych formatach, w tym w relacyjnych bazach danych (które same występują w wielu odmianach), plikach tekstowych, plikach XML , arkuszach kalkulacyjnych i różnych zastrzeżonych metodach przechowywania , z których każda ma własne metody indeksowania i dostępu do danych .
interfejsy API dostępu do danych , które oferują określony zestaw poleceń do pobierania i modyfikowania danych z ogólnego źródła danych. Istnieje wiele aplikacji, które implementują polecenia tych interfejsów API w różnych źródłach danych, w szczególności w relacyjnych bazach danych. Takie interfejsy API obejmują ODBC , JDBC , XQJ , OLE DB , a ostatnio ADO.NET .
Istnieją również standardowe formaty reprezentacji danych w pliku, które są bardzo ważne dla integracji informacji. Najbardziej znanym z nich jest XML, który stał się standardowym uniwersalnym formatem reprezentacji. Istnieją również bardziej szczegółowe „gramatyki” XML zdefiniowane dla określonych typów danych, takie jak Geography Markup Language do wyrażania cech geograficznych i Directory Service Markup Language do przechowywania informacji w stylu katalogowym. Ponadto istnieją formaty inne niż XML, takie jak iCalendar do reprezentowania informacji z kalendarza i vCard do informacji o wizytówkach .
Enterprise Information Integration (EII) stosuje komercyjną integrację danych . Pomimo problemów teoretycznych opisanych powyżej, sektor prywatny wykazuje większe zainteresowanie problemami integracji danych jako opłacalnego produktu. EII nie kładzie nacisku na poprawność ani wykonalność, ale na szybkość i prostotę.
- Łączenie różnych zestawów danych
- Każde źródło danych jest różne i jako takie nie jest zaprojektowane do obsługi EII. W związku z tym wirtualizacja danych, jak również federacja danych, polegają na przypadkowej wspólności danych w celu wspierania łączenia danych i informacji z różnych zestawów danych. Ze względu na brak wspólnych wartości danych w różnych źródłach zwracany zestaw może być niedokładny, niekompletny i niemożliwy do zweryfikowania.
- Jednym z rozwiązań jest przekształcenie odmiennych baz danych w celu zintegrowania tych baz danych bez potrzeby stosowania ETL . Przekształcone bazy danych obsługują ograniczenia wspólności, w przypadku których integralność referencyjna może być wymuszana między bazami danych. Przekształcone bazy danych zapewniają zaprojektowane ścieżki dostępu do danych ze wspólną wartością danych w różnych bazach danych.
- Prostota wdrażania
- Nawet jeśli jest uznawana za rozwiązanie problemu, EII od 2009 r. wymaga obecnie czasu i oferuje złożoność wdrażania. Proponowane rozwiązania bez schematów obejmują „Lean Middleware”.
- Obsługa informacji wyższego rzędu
- Analitycy mają trudności — nawet przy działającym systemie integracji informacji — z określeniem, czy źródła w bazie danych spełnią wymagania danej aplikacji. Odpowiadanie na tego rodzaju pytania dotyczące zestawu repozytoriów wymaga informacji semantycznych, takich jak metadane i/lub ontologie.
Aplikacje
Produkty EII umożliwiają luźne powiązanie między jednorodnymi aplikacjami i usługami klienckimi zużywającymi dane oraz heterogenicznymi magazynami danych. Takie aplikacje i usługi klienckie obejmują Desktop Productivity Tools (arkusze kalkulacyjne, edytory tekstu , oprogramowanie do prezentacji itp.), środowiska programistyczne i frameworki ( Java EE , .NET , Mono , SOAP lub RESTful Web services itp.), Business Intelligence (BI) , oprogramowanie do monitorowania działalności biznesowej (BAM), oprogramowanie do planowania zasobów przedsiębiorstwa (ERP), zarządzanie relacjami z klientami (CRM), oprogramowanie do zarządzania procesami biznesowymi (BPM i/lub BPEL) oraz oprogramowanie do zarządzania treścią internetową (CMS).
Technologie dostępu do danych
- Service Data Objects (SDO) dla klientów Java, C++ i .Net oraz dowolnego typu źródła danych
- XQuery i XQuery API dla Javy
Zobacz też
- ^ Alon Y. Halevy; i in. (2005). „Integracja informacji przedsiębiorstwa: sukcesy, wyzwania i kontrowersje” (PDF) . SIGMOD 2005 . s. 778–787. doi : 10.1145/1066157.1066246 .
- Bibliografia _ i in. (2005). „Szczupłe oprogramowanie pośrednie”. SIGMOD 2005 . s. 788–791. doi : 10.1145/1066157.1066247 .