Siatka danych
Siatka danych to socjotechniczne podejście do budowania zdecentralizowanej architektury danych poprzez wykorzystanie zorientowanego na domenę, samoobsługowego projektu (z perspektywy rozwoju oprogramowania) i zapożycza teorię projektowania opartego na domenie Erica Evansa oraz teorię Manuela Paisa i Matthew Skeltona topologii zespołu. Siatka danych dotyczy głównie samych danych, traktując jezioro danych i potoki jako drugorzędną kwestię. Główną propozycją jest skalowanie danych analitycznych poprzez decentralizację dziedzinową. W przypadku siatki danych odpowiedzialność za dane analityczne jest przenoszona z centralnego zespołu ds. danych do zespołów domenowych, wspieranych przez zespół platformy danych , który zapewnia platformę danych niezależną od domeny.
Historia
Termin data mesh został po raz pierwszy zdefiniowany przez Zhamak Dehghani w 2019 roku, kiedy pracowała jako główny konsultant w firmie technologicznej Thoughtworks . Dehghani wprowadził ten termin w 2019 r., a następnie przedstawił bardziej szczegółowe informacje na temat jego zasad i architektury logicznej w 2020 r. Przewidywano, że proces ten będzie „wielkim rywalem” dla firm w 2022 r. Siatki danych zostały wdrożone przez firmy takie jak Zalando , Netflix , Intuit , VistaPrint , JPMorgan Chase , PayPal i inne.
W 2022 roku Dehghani opuścił Thoughtworks , aby założyć NextData Technologies, aby skupić się na zdecentralizowanych danych.
Zasady
Siatka danych opiera się na czterech podstawowych zasadach:
- Własność domeny
- Dane jako produkt
- Samoobsługowa platforma danych
- Federacyjne zarządzanie obliczeniowe
Oprócz tych zasad Dehghani pisze, że produkty danych tworzone przez każdy zespół domeny powinny być wykrywalne, adresowalne, godne zaufania, posiadać samoopisującą się semantykę i składnię, być interoperacyjne, bezpieczne i podlegać globalnym standardom i kontroli dostępu. Innymi słowy, dane należy traktować jako produkt gotowy do użycia i niezawodny.
Zobacz też
- Zarządzanie danymi
- Platforma danych
- Modelowanie przechowalni danych , metoda modelowania danych z przechowywaniem danych z różnych systemów operacyjnych i śledzeniem pochodzenia danych, ułatwiająca audyt, szybkość ładowania i odporność
- Hurtownia danych , dobrze ugruntowany typ systemu baz danych do organizowania danych w sposób tematyczny
- ETL i ELT
- ^ Evans, Eric (2004). Projektowanie oparte na domenie: radzenie sobie ze złożonością w sercu oprogramowania . Boston: Addison-Wesley. ISBN 0-321-12521-5 . OCLC 52134890 .
- ^ Skelton, Mateusz (2019). Topologie zespołów: organizowanie zespołów biznesowych i technologicznych w celu zapewnienia szybkiego przepływu . Manuela Paisa. Portland, Oregon. ISBN 978-1-942788-84-3 . OCLC 1108538721 .
- ^ Machado, Inês Araújo; Costa, Carlos; Santos, Maribel Yasmina (2022-01-01). „Data Mesh: koncepcje i zasady zmiany paradygmatu w architekturach danych” . Procedia Informatyka . Międzynarodowa Konferencja Systemów Informatycznych Przedsiębiorstw / ProjMAN - Międzynarodowa Konferencja Zarządzanie Projektami / HCist - Międzynarodowa Konferencja Systemy i Technologie Informacyjne Zdrowia i Opieki Społecznej 2021. 196 : 263–271. doi : 10.1016/j.procs.2021.12.013 . ISSN 1877-0509 . S2CID 245864612 .
- ^ „Architektura siatki danych” . datamesh-architecture.com . Źródło 2022-06-13 .
- ^ Dehghani, Zhamak (2022). Siatka danych . Sewastopol, Kalifornia. ISBN 978-1-4920-9236-0 . OCLC 1260236796 .
- ^ „Jak wyjść poza monolityczne jezioro danych do rozproszonej siatki danych” . martinfowler.com . Źródło 28 stycznia 2022 r .
- ^ Baer (dbInsight), Tony. „Data Mesh: czy powinieneś spróbować tego w domu?” . ZDNet . Źródło 2022-02-10 .
- Bibliografia _ „Szybsze uzyskiwanie szczegółowych informacji dzięki siatce danych” . RTInsights . Źródło 2022-03-01 .
- ^ „Rozwiązania, które zdefiniują zarządzanie danymi i bezpieczeństwo operacyjne w 2022 r.” . Pomoc Net Security . 2021-12-28 . Źródło 2022-03-01 .
- Bibliografia _ „Post Rady: Dokąd zmierza transformacja przemysłowa w 2022 roku?” . Forbesa . Źródło 2022-03-01 .
- ^ Schultze, Maks; Szerszy, Arif (2021). Siatka danych w praktyce . ISBN 978-1-09-810849-6 .
- ^ Siatka danych Netflix: Przetwarzanie danych z możliwością komponowania — Justin Cunningham , pobrane 29.04.2022
- ^ Baker, Tristan (22.02.2021). „Strategia siatki danych firmy Intuit” . Intuicyjna Inżynieria . Źródło 2022-04-29 .
- ^ „Jak JPMorgan Chase zbudował architekturę siatki danych, aby uzyskać znaczącą wartość w celu ulepszenia platformy danych przedsiębiorstwa | AWS Big Data Blog” . aws.amazon.com . 2021-05-05 . Źródło 2023-01-10 .
- ^ „Następna generacja platform danych to Data Mesh” . 2022-08-03 . Źródło 2023-02-08 .
- ^ „Dlaczego zaczęliśmy Nextdata” . 2022-01-16 . Źródło 2023-02-08 .
- ^ Dehghani, Zhamak (2022). Siatka danych . Sewastopol, Kalifornia. ISBN 978-1-4920-9236-0 . OCLC 1260236796 .
- ^ „Zdefiniowana siatka danych | Blog Jamesa Serry” . 16 lutego 2021 . Źródło 28 stycznia 2022 r .
- ^ „Analityka w 2022 r. Oznacza opanowanie polityki rozproszonych danych” . Nowy stos . 2021-12-29 . Źródło 2022-03-03 .
- ^ „Rozwiązania, które zdefiniują zarządzanie danymi i bezpieczeństwo operacyjne w 2022 r.” . Pomoc Net Security . 2021-12-28 . Źródło 2022-03-01 .