Architektura danych

Architektura danych składa się z modeli, zasad, zasad i standardów, które określają, jakie dane są gromadzone oraz w jaki sposób są przechowywane, porządkowane, integrowane i wykorzystywane w systemach danych i organizacjach. Dane to zwykle jedna z kilku domen architektury , które tworzą filary architektury korporacyjnej lub architektury rozwiązania .

Przegląd

Architektura danych ma na celu ustanowienie standardów danych dla wszystkich swoich systemów danych jako wizja lub model ewentualnych interakcji między tymi systemami danych. Na przykład integracja danych powinna zależeć od standardów architektury danych, ponieważ integracja danych wymaga interakcji danych między dwoma lub więcej systemami danych. Architektura danych częściowo opisuje struktury danych używane przez firmę i jej oprogramowanie komputerowe . Architektury danych dotyczą danych przechowywanych, danych w użyciu i danych w ruchu; opisy magazynów danych, grup danych i elementów danych; oraz mapowania tych artefaktów danych do jakości danych, aplikacji, lokalizacji itp.

Niezbędna do realizacji stanu docelowego architektura danych opisuje, w jaki sposób dane są przetwarzane, przechowywane i wykorzystywane w systemie informatycznym . Dostarcza kryteriów przetwarzania danych , aby umożliwić projektowanie przepływów danych , a także sterowanie przepływem danych w systemie.

Architekt danych jest zwykle odpowiedzialny za zdefiniowanie stanu docelowego, dostosowanie podczas opracowywania, a następnie monitorowanie, aby upewnić się, że ulepszenia są wprowadzane w duchu oryginalnego planu.

Podczas definiowania stanu docelowego architektura danych rozkłada podmiot na poziom atomowy, a następnie buduje go z powrotem do pożądanej postaci. Architekt danych dzieli temat, przechodząc przez trzy tradycyjne etapy architektury:

  • Koncepcyjne — reprezentuje wszystkie podmioty gospodarcze .
  • Logiczny — reprezentuje logikę powiązań między jednostkami.
  • Fizyczne - realizacja mechanizmów danych dla określonego rodzaju funkcjonalności.

Kolumna „dane” w Zachman Framework dla architektury korporacyjnej -

Warstwa Pogląd Dane (co) Interesariusz
1 Zakres/kontekst Lista rzeczy i standardów architektonicznych ważnych dla biznesu Planista
2 Model biznesowy/koncepcyjny Model semantyczny lub koncepcyjny / korporacyjny model danych Właściciel
3 Model systemu/logiczny Enterprise/ Logiczny model danych Projektant
4 Model technologiczny/fizyczny Fizyczny model danych Budowniczy
5 Szczegółowe reprezentacje Rzeczywiste bazy danych Deweloper

W tym drugim, szerszym znaczeniu, architektura danych obejmuje pełną analizę relacji między funkcjami organizacji, dostępnymi technologiami i typami danych .

Architektura danych powinna zostać zdefiniowana w fazie planowania projektu nowego systemu przetwarzania i przechowywania danych. Główne rodzaje i źródła danych niezbędnych do obsługi przedsiębiorstwa powinny być zidentyfikowane w sposób kompletny, spójny i zrozumiały. Podstawowym wymaganiem na tym etapie jest zdefiniowanie wszystkich odpowiednich jednostek danych, a nie określenie sprzętu komputerowego . Jednostka danych to dowolna rzeczywista lub abstrakcyjna rzecz, o której organizacja lub osoba fizyczna chce przechowywać dane.

Fizyczna architektura danych

Fizyczna architektura danych systemu informatycznego jest częścią planu technologicznego . Plan technologii koncentruje się na rzeczywistych elementach materialnych , które mają być wykorzystane w realizacji projektu architektury danych . Fizyczna architektura danych obejmuje architekturę bazy danych. Architektura bazy danych to schemat rzeczywistej technologii bazy danych, która wspierałaby projektowaną architekturę danych.

Elementy architektury danych

Pewne elementy muszą zostać zdefiniowane w fazie projektowania schematu architektury danych. Na przykład należy opisać strukturę administracyjną, która ma zostać utworzona w celu zarządzania zasobami danych. Należy również zdefiniować metodologie, które mają być stosowane do przechowywania danych. Ponadto należy wygenerować opis technologii bazy danych, która ma być zastosowana, a także opis procesów, które mają manipulować danymi. Istotne jest również zaprojektowanie interfejsów do danych przez inne systemy, a także zaprojektowanie infrastruktury , która ma wspierać wspólne operacje na danych (tj. procedury awaryjne, importy danych , kopie zapasowe danych , zewnętrzne transfery danych ).

Bez wskazówek w postaci odpowiednio wdrożonego projektu architektury danych wspólne operacje na danych mogą być realizowane na różne sposoby, co utrudnia zrozumienie i kontrolowanie przepływu danych w takich systemach. Ten rodzaj fragmentacji jest niepożądany ze względu na potencjalny wzrost kosztów i związane z tym rozłączanie danych. Tego rodzaju trudności mogą napotkać szybko rozwijające się przedsiębiorstwa, a także przedsiębiorstwa obsługujące różne branże .

Prawidłowo przeprowadzona faza architektury danych w planowaniu systemu informacyjnego zmusza organizację do określenia i opisania zarówno wewnętrznych, jak i zewnętrznych przepływów informacji. Są to wzorce, na których konceptualizację organizacja mogła wcześniej nie poświęcić czasu. Dlatego na tym etapie możliwe jest zidentyfikowanie kosztownych braków informacji, rozdźwięków między działami i systemami organizacyjnymi, które mogły nie być widoczne przed analizą architektury danych.

Ograniczenia i wpływy

Różne ograniczenia i wpływy będą miały wpływ na projekt architektury danych. Obejmują one wymagania przedsiębiorstwa, czynniki technologiczne, ekonomię, zasady biznesowe i potrzeby w zakresie przetwarzania danych.

Wymagania przedsiębiorstwa
Na ogół obejmują one takie elementy, jak ekonomiczna i efektywna rozbudowa systemu, akceptowalny poziom wydajności (zwłaszcza szybkość dostępu do systemu), niezawodność transakcji oraz przejrzyste zarządzanie danymi . Ponadto konwersja nieprzetworzonych danych, takich jak zapisy transakcji i pliki obrazów, na bardziej użyteczne formy informacyjne za pomocą takich funkcji, jak hurtownie danych , jest również powszechnym wymogiem organizacyjnym , ponieważ umożliwia to podejmowanie decyzji zarządczych i inne procesy organizacyjne. Jedną z technik architektury jest podział na zarządzanie danymi transakcji i (głównymi) danymi referencyjnymi . Innym jest oddzielenie systemów przechwytywania danych od systemów odzyskiwania danych (tak jak ma to miejsce w hurtowni danych).
Sterowniki technologiczne
Są one zwykle sugerowane przez ukończone projekty architektury danych i architektury baz danych. Ponadto niektóre czynniki technologiczne będą wynikać z istniejących ram i standardów integracji organizacyjnej, ekonomii organizacji i istniejących zasobów witryny (np. wcześniej zakupione licencje na oprogramowanie ). W wielu przypadkach integracja wielu starszych systemów wymaga użycia wirtualizacji danych .
Ekonomia
Są to również ważne czynniki, które należy wziąć pod uwagę w fazie architektury danych. Możliwe, że niektóre rozwiązania, choć z założenia optymalne, mogą nie być potencjalnymi kandydatami ze względu na ich koszt. Czynniki zewnętrzne, takie jak cykl koniunkturalny , stopy procentowe, warunki rynkowe i względy prawne, mogą mieć wpływ na decyzje dotyczące architektury danych.
Zasady biznesowe
Zasady biznesowe, które również wpływają na projektowanie architektury danych, obejmują wewnętrzne zasady organizacyjne, zasady organów regulacyjnych , standardy zawodowe i obowiązujące przepisy rządowe , które mogą się różnić w zależności od odpowiedniej agencji . Niniejsze polityki i zasady opisują sposób, w jaki przedsiębiorstwo chce przetwarzać swoje dane.
Potrzeby przetwarzania danych
Obejmują one dokładne i powtarzalne transakcje przeprowadzane w dużych ilościach, hurtownie danych w celu wsparcia systemów informacji zarządczej (i potencjalnej eksploracji danych ), powtarzalne raporty okresowe , raporty ad hoc oraz wsparcie różnych inicjatyw organizacyjnych zgodnie z wymaganiami (tj. , rozwój nowych produktów ).

Zobacz też

Dalsza lektura

  • Bass, L.; John, B.; & Kates, J. (2001). Osiągnięcie użyteczności dzięki architekturze oprogramowania , Carnegie Mellon University.
  • Lewis, G.; Comella-Dorda, S.; Miejsce, P.; Plakosh, D.; & Seacord, R., (2001). Przewodnik po architekturze danych systemu informacyjnego przedsiębiorstwa Carnegie Mellon University.
  • Adleman, S.; Mech, L.; Abai, M. (2005). Strategia danych Addison-Wesley Professional.

Linki zewnętrzne