Specyfikacja definicji danych

W informatyce specyfikacja definicji danych (DDS) jest wytyczną zapewniającą wszechstronną i spójną definicję danych. Reprezentuje atrybuty wymagane do kwantyfikowania definicji danych. Kompleksowa specyfikacja definicji danych obejmuje dane przedsiębiorstwa, hierarchię zarządzania danymi , zalecane egzekwowanie wytycznych i kryteria określania zgodności.

Przegląd

Specyfikację definicji danych można opracować dla dowolnej organizacji lub wyspecjalizowanej dziedziny, poprawiając jakość jej produktów poprzez spójność i przejrzystość. Eliminuje redundancję (ponieważ wszystkie obszary uczestniczące odwołują się do tej samej specyfikacji) i zapewnia standaryzację, ułatwiając i wydajniej tworząc, modyfikując, weryfikując, analizując i udostępniając informacje w całym przedsiębiorstwie.

Aby zrozumieć, jak działa specyfikacja definicji danych w przedsiębiorstwie, musimy przyjrzeć się elementom DDS. Pisanie definicji danych, definiowanie terminów (lub reguł) biznesowych w kontekście konkretnego środowiska zapewnia strukturę architektury danych organizacji . Podczas opracowywania tych definicji użyte słowa muszą być identyfikowalne z jasno określonymi danymi.

Specyfikacja definicji danych może być wykorzystana w następujących czynnościach:

Kryteria

Specyfikacja definicji danych wymaga, aby definicje danych były:

  • Atomic – liczba pojedyncza, opisująca tylko jedno pojęcie. Należy zdefiniować powszechnie używane i niejednoznaczne terminy. Chociaż termin odnosi się do jednego pojęcia, w jednym terminie można użyć kilku słów:
  • Plik — pojęcie identyfikowalne jednym słowem
  • Rozszerzenie pliku — pojęcie, które można zidentyfikować za pomocą więcej niż jednego słowa
  • Identyfikowalne — odwzorowane na określony element danych. W biznesie termin można powiązać z jednostką (na przykład klientem) lub atrybutem (takim jak imię i nazwisko klienta). Termin może być wartością w zbiorze danych (taką jak płeć) lub oznaczać sam zbiór danych. Identyfikowalność wskazuje relacje w hierarchii danych .
  • Spójny — używany w standardowej składni ; jeśli jest używany w określonym kontekście, kontekst jest odnotowywany
  • Dokładny — precyzyjny, poprawny i jednoznaczny, określający, czym termin jest, a czym nie jest
  • Jasne — zrozumiałe dla czytelnika
  • Kompletny — z terminem, jego opisem i odniesieniami kontekstowymi
  • Zwięzły — aby uniknąć okrągłych odniesień

Aplikacje

Dane przedsiębiorstwa

Specyfikacja definicji danych została opracowana przez Open Mobile Alliance w celu udokumentowania danych ładowania. Dokument, scentralizowany katalog elementów danych zdefiniowanych dla interfejsów, określa odwzorowanie tych elementów danych na pola protokołów w interfejsach. Stworzony do wymiany danych finansowych, Market Data Definition Language (MDDL) to XML zaprojektowana

aby umożliwić wymianę informacji niezbędnych do rozliczania, analizowania i handlu instrumentami finansowymi na światowych rynkach. Definiuje oparty na XML format wymiany i wspólny słownik danych w polach potrzebnych do opisania: (1) instrumentów finansowych, (2) zdarzeń korporacyjnych wpływających na wartość i zbywalność oraz (3) wskaźników rynkowych, ekonomicznych i przemysłowych. Podstawową funkcją MDDL jest umożliwienie podmiotom wymiany danych rynkowych poprzez ujednolicenie formatów i definicji. MDDL zapewnia wspólny format danych rynkowych, dzięki czemu można je wydajnie przekazywać z jednego systemu przetwarzania do drugiego, oraz zapewnia wspólne rozumienie treści danych rynkowych poprzez standaryzację terminologii i normalizację wzajemnych relacji między różnymi elementami danych… Od z perspektywy użytkownika, celem MDDL jest umożliwienie użytkownikom integracji danych z wielu źródeł poprzez standaryzację zarówno kanałów wejściowych używanych do hurtowni danych (tj. , zapewnić kompatybilność sposobu pobierania danych do i z aplikacji).”

Zgłoszenia kliniczne

Konsorcjum ds . Standardów Wymiany Danych Klinicznych , globalna, multidyscyplinarna organizacja non-profit, ustanowiła standardy wspierające pozyskiwanie, wymianę, przesyłanie i archiwizację danych i metadanych badań klinicznych. Standardy CDISC są niezależne od dostawców, niezależnych od platformy i bezpłatnie dostępne na stronie internetowej CDISC. Wersja robocza 2.0 specyfikacji tabelarycznej opisu przypadku (define.xml), najstarsza specyfikacja definicji danych, jest częścią ewolucji wytycznych FDA z 1999 r. dotyczących elektronicznego przesyłania danych (eSub) i elektronicznych dokumentów wspólnego dokumentu technicznego (eCTD), określających, że dokument opisujące treść i strukturę zawartych danych, które powinny znaleźć się w zgłoszeniu. Define.xml został opracowany w celu zautomatyzowania procesu recenzji poprzez wygenerowanie czytelnego maszynowo dokumentu definicji danych. Define.xml ujednolicił przesyłanie do Agencji ds. Żywności i Leków , skracając czas recenzji z ponad dwóch lat do kilku miesięcy.

Dane archiwalne

Specyfikacja definicji danych jest podstawą metadanych do archiwizacji danych naukowych . Metadata Encoding and Transmission Standard (METS) wykorzystuje jedną zasadę DDS: spójne stosowanie kluczowych terminów do katalogowania obiektów cyfrowych do użytku globalnego. Schemat METS jest elastycznym mechanizmem kodowania metadanych opisowych, administracyjnych i strukturalnych dla biblioteki cyfrowej oraz wyrażania złożonych powiązań między metadanymi i może zapewnić użyteczny standard wymiany obiektów biblioteki cyfrowej między repozytoriami.

Podobny wysiłek ma na celu zachowanie złożonych danych związanych z archiwizacją gier wideo. Firma Preserving Virtual Worlds próbowała zaradzić niedociągnięciom formatu archiwalnego, powołując się na brak odpowiedniej dokumentacji interaktywnej fikcji i gier na poziomie bitów : w szczególności brak „informacji o reprezentacji” potrzebnych do mapowania nieprzetworzonych bitów na konstrukcje danych wyższego poziomu. Preserving Virtual Worlds 2 to projekt badawczy będący rozwinięciem początkowych wysiłków w tej dziedzinie.

Zobacz też