GEDCOM

GEDCOM
Rozszerzenie nazwy pliku
.ged , .gdz
Rodzaj mediów internetowych
application/vnd.familysearch.gedcom application/vnd.familysearch.gedcom+zip
Opracowany przez LDS FHD
Pierwsze wydanie 1984 ; 39 lat temu ( 1984 )
Najnowsze wydanie

7.0.11 1 listopada 2022 ; 3 miesiące temu ( 2022-11-01 )
Typ formatu Wymiana danych genealogicznych
Standard De facto
Otwarty format ? Tak
Wolny format? NIE
Strona internetowa gedcom .io github .com /familysearch /GEDCOM

GEDCOM ( / oraz ɛ d k ɒ m / JED -kom ), pełna nazwa FamilySearch GEDCOM , jest de facto otwartą specyfikacją formatu plików do przechowywania danych genealogicznych importowania lub eksportowania ich między kompatybilnym oprogramowaniem genealogicznym . GEDCOM to akronim oznaczający genealogiczną komunikację danych. GEDCOM został opracowany przez Kościół Jezusa Chrystusa Świętych w Dniach Ostatnich (Kościół LDS) jako pomoc w badaniach genealogicznych . Większość programów genealogicznych obsługuje importowanie i eksportowanie do formatu GEDCOM.

Od wersji 7.0 plik GEDCOM jest zdefiniowany jako zwykły tekst zakodowany w UTF-8 . Ten plik zawiera informacje genealogiczne o osobach, takie jak imiona, wydarzenia i relacje; metadane łączą te rekordy razem. GEDCOM 7.0 to pierwsza wersja wykorzystująca wersjonowanie semantyczne i najnowsza pomniejsza wersja specyfikacji.

Poprzednik 7.0, GEDCOM 5.5.1, został wydany jako wersja robocza w 1999 roku. W ciągu następnych 20 lat otrzymał tylko drobne aktualizacje. Brak aktualizacji standardu i braki w jego możliwościach zaczęły powodować, że niektóre programy genealogiczne dodawały do ​​formatu zastrzeżone rozszerzenia, które nie zawsze są rozpoznawane przez inne programy genealogiczne, takie jak specyfikacja GEDCOM 5.5 EL (Extended Locations). Inne standardy, takie jak GEDCOM X, zostały zaproponowane jako kompletne zamienniki dla GEDCOM.

GEDCOM 5.5.1 final, wydany w 2019 roku, pozostaje branżowym standardem formatu wymiany danych genealogicznych. Jednak wraz z wydaniem GEDCOM 7.0 w 2021 r. trwają starania o przyjęcie wersji 7.0. FamilySearch zamierza być kompatybilny z GEDCOM 7.0 w trzecim kwartale 2022 r., a Ancestry.com ma w swoim harmonogramie kompatybilność z 7.0, ale nie określił jeszcze daty wdrożenia. FamilySearch GEDCOM ma repozytorium GitHub

Model

GEDCOM wykorzystuje model danych powiązany z pochodzeniem, z naciskiem na powiązania z rodziną nuklearną i jednostkami (dziećmi) produkowanymi przez tę rodzinę. Te historyczne cele są opisane w dokumencie specyfikacji 7.0: „ FAM był pierwotnie skonstruowany tak, aby reprezentował rodziny, w których MĘŻCZYZNA ( mąż lub ojciec) i ŻONA (żona lub matka) rodzą DZIECI (dzieci)”.

Dokument mówi dalej, że te typy rekordów mogą być używane bardziej elastycznie, aby odzwierciedlić różne koncepcje rodziny. „ FAM może być również używany do analogii kulturowych do tego, w tym rodzin nuklearnych, małżeństwa, konkubinatu, rodziny zastępczej, adopcji i tak dalej, niezależnie od płci partnerów… Osoby wskazane przez MĘŻA i ŻONĘ są zwanych łącznie „partnerami”, „rodzicami” lub „małżonkami”.

Struktura plików

Plik GEDCOM składa się z sekcji nagłówka , rekordów i sekcji końcowej . W tych sekcjach zapisy reprezentują osoby (zapisy INDI), rodziny (zapisy FAM), źródła informacji (zapisy SOUR) i inne różne zapisy, w tym notatki. Każda linia pliku GEDCOM zaczyna się od numeru poziomu, gdzie wszystkie rekordy najwyższego poziomu (HEAD, TRLR, SUBN oraz każdy INDI, FAM, OBJE, NOTE, REPO, SOUR i SUBM) zaczynają się od linii z poziomem 0, podczas gdy inne liczby poziomów są dodatnimi liczbami całkowitymi .

Chociaż możliwe jest ręczne napisanie pliku GEDCOM, format został zaprojektowany do użytku z oprogramowaniem i dlatego nie jest szczególnie przyjazny dla człowieka. Walidator GEDCOM, którego można użyć do sprawdzenia poprawności struktury pliku GEDCOM, jest częścią PhpGedView , chociaż nie ma być samodzielnym walidatorem. Do samodzielnej walidacji można użyć „The Windows GEDCOM Validator”. lub starszy niekonserwowany Gedcheck z kościoła LDS.

W 2001 roku GEDCOM TestBook Project ocenił zgodność czterech popularnych programów genealogicznych ze standardem GEDCOM 5.5 przy użyciu programu Gedcheck. Wyniki pokazały, że istniało wiele problemów i że „Najczęściej spotykaną usterką prowadzącą do utraty danych był brak odczytu tagu NOTE na wszystkich możliwych poziomach, na których może się pojawić”. W 2005 roku Genealogical Software Report Card została oceniona (przez Billa Mumforda, który brał udział w oryginalnym projekcie GEDCOM Testbook Project ) i obejmowała testowanie standardu GEDCOM 5.5 przy użyciu programu Gedcheck.

Aby pomóc w przyjęciu GEDCOM 7.0, istnieją teraz również narzędzia do sprawdzania poprawności dla tego standardu.

Przykład

Poniżej znajduje się przykładowy plik GEDCOM.

sample.ged
 0 HEAD 1 SOUR PAF 2 NAZWA Osobista akta przodków 2 WERSJA 5.0 1 DATA 30 LISTOPADA 2000 1 GEDC 2 WERSJA 5.5 2 FORMA POŁĄCZONA Z LINEAGE 1 CHAR ANSEL 1 SUBM @U1@ 0 @I1@ INDI 1 IMIĘ John /Smith/ 1 PŁEĆ M 1 FAMS @F1@ 0 @I2@ INDI 1 IMIĘ Elżbieta /Stansfield/ 1 PŁEĆ K 1 FAMS @F1@ 0 @I3@ INDI 1 IMIĘ James /Smith/ 1 PŁEĆ M 1 FAMC @F1@ 0 @F1@ RODZINA 1 MĄŻ @I1@ 1 ŻONA @I2@ 1 MARR 1 CHIL @I3@ 0 @U1@ SUBM 1 NAZWA Przekazujący 0 TRLR 

Nagłówek (HEAD) zawiera program źródłowy i wersję (Personal Ancestral File, 5.0), wersję GEDCOM (5.5), kodowanie znaków ( ANSEL) oraz link do informacji o nadawcy pliku.

Poszczególne rekordy (INDI) definiują Johna Smitha (ID I1), Elizabeth Stansfield (ID I2) i Jamesa Smitha (ID I3).

Akta rodzinne (FAM) łączą męża (MĘŻA), żonę (ŻONĘ) i dziecko (CHIL) poprzez ich numery identyfikacyjne.

Wersje

Obecną wersją powszechnie używanej specyfikacji jest GEDCOM 5.5.1 final , która została wydana 15 listopada 2019 r. Jej poprzednik, wersja robocza GEDCOM 5.5.1 , została wydana w 1999 r., Wprowadzając dziewięć nowych atrybutów, tagów i dodając UTF-8 jako zatwierdzone kodowanie znaków . Projekt nie został formalnie zatwierdzony, ale jego zapisy zostały w pewnej części przyjęte przez szereg programów genealogicznych, w tym FamilySearch.org.

GEDCOM powiązany z rodowodem jest de facto celowym wspólnym mianownikiem. Pomimo tego, że wersja 5.5 standardu GEDCOM została po raz pierwszy opublikowana w 1996 r., Wielu dostawców oprogramowania genealogicznego nigdy w pełni nie obsługiwało funkcji wielojęzycznego tekstu Unicode (zamiast zestawu znaków ANSEL) wprowadzonej w tej wersji specyfikacji. Jednolite użycie Unicode pozwoliłoby na użycie międzynarodowych zestawów znaków. Przykładem jest przechowywanie nazw wschodnioazjatyckich w ich oryginalnych znakach chińskich, japońskich i koreańskich (CJK) , bez których mogłyby być niejednoznaczne i mało przydatne w badaniach genealogicznych lub historycznych. 5.2 to przykład oprogramowania, które używa UTF-8 jako wewnętrznego zestawu znaków i może wyświetlać GEDCOM UTF-8.

GEDCOM 7.0 wymaga kodowania UTF-8 przez cały czas i rozwiązuje inne długotrwałe problemy z GEDCOM 5.5.1. Obsługa multimediów w postaci powiązanego pliku .zip, zwanego GEDZip, to kolejne włączenie. Trwają starania, aby 7.0 zostało przyjęte jako nowy standard wymiany. GEDCOM 7.0 umożliwia jednoznaczne określenie, jakie standardy inne niż GEDCOM mogą mieć zastosowanie do konkretnego pliku. GEDCOM zawsze był rozszerzalny , ale przed wersją 7.0 nie było standardowego sposobu identyfikacji takich rozszerzeń. Ponadto GEDCOM umożliwia wyraźne oznaczenie zdarzenia jako nieistniejącego. Pozwala to na przykład udokumentować, że dana osoba nigdy nie była w związku małżeńskim.

Historia wydania

Wersja GEDCOM Data wydania Notatki
1984
grudzień 1985 PAF 2.0
Stara wersja, nie jest już obsługiwana: 2.1 luty 1987 GEDCOM dla PAF 2.1
Stara wersja, nie jest już obsługiwana: 2.3 Wersja robocza 7 sierpnia 1985 z konwencjami implementacji PAF2.0 GEDCOM
Stara wersja, nie jest już obsługiwana: 2.4 Wersja robocza 13 grudnia 1985 z konwencjami implementacji PAF2.0 GEDCOM
9 października 1987 PAF 2.0 i 2.1 implementacja wersji 3.0
Stara wersja, nie jest już obsługiwana: 4.0 Standard sierpień 1989 PAF 2.1 – 2.31
25 stycznia 1990
31 grudnia 1991 r wprowadzono struktury powiązane z rodowodem.
Stara wersja, nie jest już obsługiwana: 5.1 Wersja robocza 18 września 1992
Stara wersja, nie jest już obsługiwana: 5.2 Wersja robocza 22 stycznia 1992
Stara wersja, nie jest już obsługiwana: 5.3 Wersja robocza 4 listopada 1993 Standard Unicode ( ISO/IEC 10646 ) został wprowadzony jako dodatkowy zestaw znaków.
Stara wersja, nie jest już obsługiwana: 5.4 Wersja robocza 21 sierpnia 1995
Stara wersja, nie jest już obsługiwana: 5.5 Standard 11 grudnia 1995 r PAF 3, 4 i 5
Starsza wersja, ale nadal utrzymywana: 5.5 Standard 2 stycznia 1996 r PAF 3, 4 i 5 / 5,5 Norma
1 maja 1998 r „wykorzystywał zupełnie nowy model danych”
2 października 1999 r Używany przez FamilySearch.org UTF-8 dodany jako zatwierdzone kodowanie znaków.
15 listopada 2019 r aktualny standard, drobne modyfikacje tekstu do wersji roboczej 5.5.1.
2 października 2019 r Nieoficjalna aktualizacja autorstwa Tamury Jones
Stara wersja, nie jest już obsługiwana: 5.6 Private Draft - „Jed Allen wysłał te dwa pliki do kilku osób tylko w celu „prywatnych komentarzy”
Stara wersja, nie jest już obsługiwana: 6.0 XML Draft 28 grudnia 2001 r Nie była kompletną specyfikacją i nie była zalecana do rozpoczęcia wdrożeń oprogramowania.
Stara wersja, nie jest już obsługiwana: 7.0.0-rc1 Wersja robocza luty 2021 r Kandydat do wydania ujawniony dla RootsTech 2021, ale potem wszystkie rozmowy, specyfikacje i strona internetowa zostały usunięte 25 lutego 2021 r.
27 maja 2021 r Zmodernizuj kodowanie znaków, wyjaśnij niejasności w specyfikacji 5.5.1, wprowadź wersjonowanie semantyczne, popraw obsługę multimediów
Legenda:
Stara wersja
Starsza wersja, nadal utrzymywana
Ostatnia wersja
Najnowsza wersja podglądu
Przyszłe wydanie

Ograniczenia

Obsługa wieloosobowych wydarzeń i źródeł

Plik GEDCOM może zawierać informacje o wydarzeniach, takich jak narodziny, zgony, metryki spisowe, metryki okrętowe, śluby itp.; praktyczna zasada jest taka, że ​​wydarzenie to coś, co miało miejsce w określonym czasie, w określonym miejscu (nawet jeśli czas i miejsce nie są znane). Pliki GEDCOM mogą również zawierać atrybuty, takie jak opis fizyczny, zawód i całkowita liczba dzieci; w przeciwieństwie do wydarzeń, atrybutów na ogół nie można powiązać z określonym czasem ani miejscem.

Specyfikacja GEDCOM wymaga, aby każde zdarzenie lub atrybut były powiązane z dokładnie jedną osobą lub rodziną. Powoduje to redundancję zdarzeń, takich jak spisy ludności, w przypadku których rzeczywisty wpis do spisu często zawiera informacje o wielu osobach. W pliku GEDCOM, w przypadku spisu ludności, należy dodać oddzielne zdarzenie spisu „CENS” dla każdej osoby, do której się odnosi. Niektóre programy genealogiczne, takie jak Gramps i The Master Genealogist , mają rozbudowane struktury bazodanowe dla źródeł, które służą między innymi do reprezentowania wydarzeń wieloosobowych. Kiedy bazy danych są eksportowane z jednego z tych programów do GEDCOM, te struktury baz danych nie mogą być reprezentowane w GEDCOM z powodu tego ograniczenia, w wyniku czego informacje o wydarzeniu lub źródle, w tym wszystkie istotne informacje o cytowaniach, muszą być powielane w każdym miejscu, w którym są używany. To powielanie utrudnia użytkownikowi utrzymanie informacji związanych ze źródłami.

W specyfikacji GEDCOM zdarzenia związane z rodziną, takie jak informacje o małżeństwie, są przechowywane w GEDCOM tylko raz, jako część rekordu rodziny (FAM), a następnie oboje małżonkowie są powiązani z tym pojedynczym rekordem rodziny.

Niejasność w specyfikacji

Specyfikacja GEDCOM została celowo uelastyczniona, aby obsługiwać wiele sposobów kodowania danych, szczególnie w obszarze źródeł. Ta elastyczność doprowadziła do wielu niejasności i wywołała efekt uboczny polegający na tym, że niektóre programy genealogiczne, które importują GEDCOM, nie importują wszystkich danych z pliku.

Wsparcie dla różnych definicji rodzin i związków

GEDCOM nie obsługuje jawnie reprezentacji danych wielu rodzajów bliskich relacji międzyludzkich , takich jak małżeństwa osób tej samej płci , związki partnerskie , konkubinat , poliamoria lub poligamia . Takie relacje mogą być reprezentowane tylko przy użyciu ogólnego znacznika ASSO używanego dla dowolnego typu relacji.

Kolejność wydarzeń, które nie mają dat

Specyfikacja GEDCOM nie oferuje wyraźnego wsparcia dla zachowania znanej kolejności zdarzeń. W szczególności może zostać utracona kolejność relacji (FAMS) dla osoby i kolejność dzieci w związku (FAM). W wielu przypadkach kolejność wydarzeń można wywnioskować z powiązanych dat. Ale daty nie zawsze są znane, zwłaszcza gdy mamy do czynienia z danymi sprzed wieków. Na przykład w przypadku, gdy dana osoba była w dwóch związkach, oba z nieznanymi datami, ale z opisów wiadomo, że ten drugi jest rzeczywiście drugim. Kolejność, w jakiej te FAMS są rejestrowane w rejestrze INDI GEDCOM, będzie zależała od programu eksportującego. Na przykład w Aldfaer kolejność zależy od uporządkowania danych przez użytkownika (alfabetycznie, chronologicznie, odniesienia itp.). Proponowany standard XML GEDCOM również nie rozwiązuje tego problemu.

Mniej znane funkcje

GEDCOM ma wiele funkcji, które nie są powszechnie używane. Niektóre pakiety oprogramowania nie obsługują wszystkich funkcji, na które pozwala standard GEDCOM.

Multimedialne

Standard GEDCOM obsługuje włączanie obiektów multimedialnych (na przykład zdjęć osób). Takie obiekty multimedialne mogą być zawarte albo w samym pliku GEDCOM (zwanym „formularzem osadzonym”), albo w pliku zewnętrznym, w którym nazwa pliku zewnętrznego jest określona w pliku GEDCOM (zwanym „formularzem powiązanym”). Osadzanie multimediów bezpośrednio w pliku GEDCOM ułatwia transmisję danych, ponieważ wszystkie informacje (w tym dane multimedialne) znajdują się w jednym pliku, ale wynikowy plik może być ogromny. Łączenie multimediów utrzymuje kontrolę nad rozmiarem pliku GEDCOM, ale podczas przesyłania pliku obiekty multimedialne muszą być przesyłane oddzielnie lub archiwizowane razem z GEDCOM w jeden większy plik. Obsługa bezpośredniego osadzania multimediów została usunięta w wersji roboczej standardu 5.5.1.

Sprzeczne informacje

Standard GEDCOM pozwala na specyfikację wielu opinii lub sprzecznych danych, po prostu przez określenie wielu rekordów tego samego typu. Na przykład, jeśli data urodzenia danej osoby została zapisana jako 10 stycznia 1800 r. Na akcie urodzenia, ale 11 stycznia 1800 r. Na akcie zgonu, uwzględniono by dwa zapisy BIRT dla tej osoby, pierwszy z datą 10 stycznia 1800 r. i porodem jako źródło, a drugi z datą 11 stycznia 1800 r. i podaniem jako źródła aktu zgonu. Preferowany rekord jest zwykle wymieniony jako pierwszy.

Ten przykład zakodowany w GEDCOM może wyglądać tak:

0 @I1@ INDI 1 IMIĘ John /Doe/ 1 BIRT 2 DATA 10 JAN 1800 2 SOUR @S1@ 3 DANE 4 TEKST Transkrypcja z aktu urodzenia powinna znaleźć się tutaj 3 UWAGA Ten akt urodzenia jest preferowany, ponieważ pochodzi z aktu urodzenia 3 QUAY 2 1 BIRT 2 DATA 11 JAN 1800 2 SOUR @S2@ 3 DANE 4 TEKST Transkrypcja z aktu zgonu trafi tutaj 3 QUAY 2

Sprzeczne dane mogą być również wynikiem błędów użytkownika. Norma nie precyzuje w żaden sposób, że treść musi być spójna. Data urodzenia, taka jak „10 kwietnia 1819”, mogła zostać błędnie zapisana jako „10 kwietnia 1918” długo po śmierci osoby. Jedynym sposobem na ujawnienie takich niespójności jest rygorystyczna weryfikacja danych dotyczących treści .

Umiędzynarodowienie

Standard GEDCOM wspiera internacjonalizację na kilka sposobów. Po pierwsze, nowsze wersje standardu umożliwiają przechowywanie danych w formacie Unicode (lub, ostatnio, UTF-8), dzięki czemu można przechowywać tekst w dowolnym języku. Po drugie, w ten sam sposób, w jaki można miećwielezdarzeń dotyczących osoby, GEDCOM pozwala miećwiele imion dla osoby, dzięki czemu imiona mogą byćprzechowywane w wielu językach (chociaż nie ma ustandaryzowanego sposobu wskazania, która instancja jest w jakim języku ). Wreszcie, w najnowszej wersji (5.5.1, jeszcze nie w powszechnym użyciu), pole NAZWA obsługuje również odmianę fonetyczną (FONE) i odmianę latynizowaną (ROMN) nazwy.

GEDCOM X

W lutym 2012 r. na konferencji RootsTech 2012 FamilySearch nakreślił główny nowy projekt dotyczący standardów genealogicznych o nazwie GEDCOM X i zaprosił do współpracy. Obejmuje oprogramowanie opracowane na licencji open source Apache . Obejmuje formaty danych, które ułatwiają tworzenie drzew genealogicznych na podstawie źródeł i zapisów (zarówno artefaktów fizycznych, jak i artefaktów cyfrowych), obsługę udostępniania i łączenia danych online oraz interfejs API.

W sierpniu 2012 roku pracownik FamilySearch i lider projektu GEDCOM X, Ryan Heaton, porzucił twierdzenie, że GEDCOM X jest nowym standardem branżowym i zmienił pozycję GEDCOM X jako kolejny projekt open source FamilySearch.

Po wydaniu GEDCOM 7, FamilySearch umieścił GEDCOM X jako przydatny do współpracy z oprogramowaniem FamilySearch Family Tree.

Alternatywy

Commsoft, autorzy serii oprogramowania genealogicznego Roots i Ultimate Family Tree, zdefiniowali wersję o nazwie GEDCOM zorientowaną na zdarzenia (znaną również jako „Event GEDCOM” i pierwotnie nazywaną InterGED), która zawierała zdarzenia jako elementy pierwszej klasy (poziom zerowy) . Chociaż jest oparty na zdarzeniach, nadal jest to model zbudowany na domniemanej rzeczywistości, a nie na dowodach. Wydarzenie GEDCOM było bardziej elastyczne, ponieważ pozwalało na pewne rozdzielenie wydarzeń i uczestników. Jednak Event GEDCOM nie został powszechnie przyjęty przez innych programistów ze względu na różnice semantyczne. [ potrzebne źródło ] Ponieważ Roots i Ultimate Family Tree nie są już dostępne, bardzo niewiele osób korzysta z Event GEDCOM.

Gramps XML to otwarty format oparty na XML , stworzony przez genealogiczny projekt open source Gramps i używany również przez PhpGedView .

Organizacja Standardów Informacji o Historii Rodziny została utworzona w 2012 roku w celu opracowania międzynarodowych standardów dotyczących historii rodziny i informacji genealogicznych. Jednym ze standardów zaproponowanych przez organizację był Extended Legacy Format (ELF), zgodny z GEDCOM 5.5(.1), ale zawierający mechanizm rozszerzalności. Organizacja zażądała publicznego komentarza na temat proponowanego standardu w 2017 r. Wycofała propozycję, ponieważ wydanie 7.0 GEDCOM rozwiało wiele obaw organizacji.

Zobacz też

Linki zewnętrzne

Ogólny