Specyfikacja definicji danych
W informatyce specyfikacja definicji danych (DDS) jest wytyczną zapewniającą wszechstronną i spójną definicję danych. Reprezentuje atrybuty wymagane do kwantyfikowania definicji danych. Kompleksowa specyfikacja definicji danych obejmuje dane przedsiębiorstwa, hierarchię zarządzania danymi , zalecane egzekwowanie wytycznych i kryteria określania zgodności.
Przegląd
Specyfikację definicji danych można opracować dla dowolnej organizacji lub wyspecjalizowanej dziedziny, poprawiając jakość jej produktów poprzez spójność i przejrzystość. Eliminuje redundancję (ponieważ wszystkie obszary uczestniczące odwołują się do tej samej specyfikacji) i zapewnia standaryzację, ułatwiając i wydajniej tworząc, modyfikując, weryfikując, analizując i udostępniając informacje w całym przedsiębiorstwie.
Aby zrozumieć, jak działa specyfikacja definicji danych w przedsiębiorstwie, musimy przyjrzeć się elementom DDS. Pisanie definicji danych, definiowanie terminów (lub reguł) biznesowych w kontekście konkretnego środowiska zapewnia strukturę architektury danych organizacji . Podczas opracowywania tych definicji użyte słowa muszą być identyfikowalne z jasno określonymi danymi.
Specyfikacja definicji danych może być wykorzystana w następujących czynnościach:
- Wywiad biznesowy
- Modelowanie procesów biznesowych
- Zarządzanie regułami biznesowymi
- Analiza i modelowanie danych
- Architektura informacji
- Modelowanie metadanych
- Generowanie raportów
Kryteria
Specyfikacja definicji danych wymaga, aby definicje danych były:
- Atomic – liczba pojedyncza, opisująca tylko jedno pojęcie. Należy zdefiniować powszechnie używane i niejednoznaczne terminy. Chociaż termin odnosi się do jednego pojęcia, w jednym terminie można użyć kilku słów:
- Plik — pojęcie identyfikowalne jednym słowem
- Rozszerzenie pliku — pojęcie, które można zidentyfikować za pomocą więcej niż jednego słowa
- Identyfikowalne — odwzorowane na określony element danych. W biznesie termin można powiązać z jednostką (na przykład klientem) lub atrybutem (takim jak imię i nazwisko klienta). Termin może być wartością w zbiorze danych (taką jak płeć) lub oznaczać sam zbiór danych. Identyfikowalność wskazuje relacje w hierarchii danych .
- Spójny — używany w standardowej składni ; jeśli jest używany w określonym kontekście, kontekst jest odnotowywany
- Dokładny — precyzyjny, poprawny i jednoznaczny, określający, czym termin jest, a czym nie jest
- Jasne — zrozumiałe dla czytelnika
- Kompletny — z terminem, jego opisem i odniesieniami kontekstowymi
- Zwięzły — aby uniknąć okrągłych odniesień
Aplikacje
Dane przedsiębiorstwa
Specyfikacja definicji danych została opracowana przez Open Mobile Alliance w celu udokumentowania danych ładowania. Dokument, scentralizowany katalog elementów danych zdefiniowanych dla interfejsów, określa odwzorowanie tych elementów danych na pola protokołów w interfejsach. Stworzony do wymiany danych finansowych, Market Data Definition Language (MDDL) to XML zaprojektowana
aby umożliwić wymianę informacji niezbędnych do rozliczania, analizowania i handlu instrumentami finansowymi na światowych rynkach. Definiuje oparty na XML format wymiany i wspólny słownik danych w polach potrzebnych do opisania: (1) instrumentów finansowych, (2) zdarzeń korporacyjnych wpływających na wartość i zbywalność oraz (3) wskaźników rynkowych, ekonomicznych i przemysłowych. Podstawową funkcją MDDL jest umożliwienie podmiotom wymiany danych rynkowych poprzez ujednolicenie formatów i definicji. MDDL zapewnia wspólny format danych rynkowych, dzięki czemu można je wydajnie przekazywać z jednego systemu przetwarzania do drugiego, oraz zapewnia wspólne rozumienie treści danych rynkowych poprzez standaryzację terminologii i normalizację wzajemnych relacji między różnymi elementami danych… Od z perspektywy użytkownika, celem MDDL jest umożliwienie użytkownikom integracji danych z wielu źródeł poprzez standaryzację zarówno kanałów wejściowych używanych do hurtowni danych (tj. , zapewnić kompatybilność sposobu pobierania danych do i z aplikacji).”
Zgłoszenia kliniczne
Konsorcjum ds . Standardów Wymiany Danych Klinicznych , globalna, multidyscyplinarna organizacja non-profit, ustanowiła standardy wspierające pozyskiwanie, wymianę, przesyłanie i archiwizację danych i metadanych badań klinicznych. Standardy CDISC są niezależne od dostawców, niezależnych od platformy i bezpłatnie dostępne na stronie internetowej CDISC. Wersja robocza 2.0 specyfikacji tabelarycznej opisu przypadku (define.xml), najstarsza specyfikacja definicji danych, jest częścią ewolucji wytycznych FDA z 1999 r. dotyczących elektronicznego przesyłania danych (eSub) i elektronicznych dokumentów wspólnego dokumentu technicznego (eCTD), określających, że dokument opisujące treść i strukturę zawartych danych, które powinny znaleźć się w zgłoszeniu. Define.xml został opracowany w celu zautomatyzowania procesu recenzji poprzez wygenerowanie czytelnego maszynowo dokumentu definicji danych. Define.xml ujednolicił przesyłanie do Agencji ds. Żywności i Leków , skracając czas recenzji z ponad dwóch lat do kilku miesięcy.
Dane archiwalne
Specyfikacja definicji danych jest podstawą metadanych do archiwizacji danych naukowych . Metadata Encoding and Transmission Standard (METS) wykorzystuje jedną zasadę DDS: spójne stosowanie kluczowych terminów do katalogowania obiektów cyfrowych do użytku globalnego. Schemat METS jest elastycznym mechanizmem kodowania metadanych opisowych, administracyjnych i strukturalnych dla biblioteki cyfrowej oraz wyrażania złożonych powiązań między metadanymi i może zapewnić użyteczny standard wymiany obiektów biblioteki cyfrowej między repozytoriami.
Podobny wysiłek ma na celu zachowanie złożonych danych związanych z archiwizacją gier wideo. Firma Preserving Virtual Worlds próbowała zaradzić niedociągnięciom formatu archiwalnego, powołując się na brak odpowiedniej dokumentacji interaktywnej fikcji i gier na poziomie bitów : w szczególności brak „informacji o reprezentacji” potrzebnych do mapowania nieprzetworzonych bitów na konstrukcje danych wyższego poziomu. Preserving Virtual Worlds 2 to projekt badawczy będący rozwinięciem początkowych wysiłków w tej dziedzinie.
Zobacz też
- Konsorcjum standardów wymiany danych klinicznych (CDISC)
- Zarządzanie danymi
- ISO/IEC 11179
- Standard kodowania i przesyłania metadanych (METS)
- OAZA