Architektura zawartości dokumentu
Opracowany przez | IBM |
---|---|
Typ formatu | Format pliku dokumentu |
przedłużony do | MO: DCA |
Document Content Architecture , w skrócie DCA , to standard opracowany przez IBM dla dokumentów tekstowych na początku lat 80. DCA był używany w mainframe i IBM i i stanowił podstawę formatu plików DisplayWrite . DCA zostało później rozszerzone jako MO: DCA (Mixed Object Document Content Architecture), które dodało osadzone pliki danych .
Pierwotnym celem DCA było zapewnienie wspólnego formatu dokumentów, który mógłby być używany na wielu platformach przetwarzania tekstu IBM, takich jak IBM PC , komputery mainframe IBM , system Displaywriter i system administracyjny IBM 5520 .
DCA definiuje dwa rodzaje dokumentów:
- Revisable-Form Text (DCA/RFT), który można edytować.
- Final-Form Text (DCA/FFT), który jest „sformatowany dla określonego urządzenia wyjściowego i nie można go zmienić”.
Opis
DCA definiuje strumień danych reprezentujący dokument .
Dokumenty mogą zawierać czcionki, nakładki i inne obiekty zasobów wymagane w czasie prezentacji do prawidłowego przedstawienia danych. Wreszcie, dokumenty mogą zawierać obiekty zasobów, takie jak indeks dokumentów i elementy znaczników, wspierające wyszukiwanie i nawigację po danych dokumentu, do różnych celów aplikacji.
MO:DCA to opakowanie lub pojemnik na różne obiekty , które mogą składać się na dokument. Każdy obiekt jest zdefiniowany przez własną podrzędną architekturę. Architektury to:
- Architektura treści obiektu tekstowego prezentacji (PTOCA) opisuje sformatowany tekst, w tym atrybuty tekstu, takie jak czcionka lub kolor.
- Image Object Content Architecture (IOCA) opisuje obrazy niezależne od rozdzielczości.
- Graphics Object Content Architecture (GOCA) opisuje obrazy grafiki wektorowej . Odmiana GOCA, AFP GOCA, jest używana w zaawansowanej prezentacji funkcji .
- Bar Code Object Content Architecture (BCOCA) opisuje kody kreskowe w wielu różnych formatach.
- Font Object Content Architecture (FOCA) opisuje czcionki, które mają być używane w dokumencie
- Colour Management Object Content Architecture (CMOCA) opisuje wymagane informacje dotyczące zarządzania kolorami.
Każda architektura wykorzystuje szereg pól o strukturze binarnej do opisu odpowiadającego jej obiektu.
Tekst formularza z możliwością zmiany
Opracowany przez | IBM |
---|---|
Typ formatu | Format pliku dokumentu |
Revisable-Form Text (w skrócie RFT lub RFT-DCA ) jest częścią DCA. Jest czasami określany jako tekst formatu z możliwością zmiany . Był używany przez procesory tekstu IBM DisplayWrite 4 i 5 na komputerach mainframe System / 360 i 370 oraz OfficeVision / 400 , aby umożliwić przesyłanie sformatowanych dokumentów do innych systemów. [ potrzebne źródło ]
RFT ma odpowiednik Final-Form Text (w skrócie FFT lub FFT-DCA ), który nie miał być edytowalny i był przeznaczony tylko do wyjścia.
Historia
Dążenie do zainicjowania międzynarodowych standardów dla DCA zostało zapoczątkowane w 1980 roku w zakładzie IBM w Rochester. Zebrano zespół składający się z dwóch architektów MODCA, architekta RTOCA i architekta PTOCA. Ci architekci byli odpowiedzialni za wypracowanie konsensusu IBM w zakresie projektowania strumieni danych i przeniesienie prac na międzynarodową arenę standardów. Podjęto skoordynowane wysiłki, aby włączyć społeczność międzynarodową do rozwoju. Decyzja ta została częściowo oparta na doświadczeniach zdobytych podczas przyjmowania GML do międzynarodowego standardu SGML. Aby uniknąć długiego opóźnienia w tworzeniu architektury, chcieli wcześnie zaangażować wszystkich. Opracowanie standaryzacji SGML zajęło wiele lat. Prace IBM nad zawartością dokumentów były wymuszane potrzebami komputerów typu mainframe, w których używano GML i DCA, ale to doświadczenie wskazywało na potrzebę znormalizowanych architektur komponentów, w szczególności dla tekstu, który można i nie można poprawiać.
W 1981 roku, krótko po powstaniu, grupa została przeniesiona wraz z IBM 5280 Distributed Data System do IBM Austin w pobliżu Round Rock w Teksasie, gdzie prace kontynuowano z mieszanymi sukcesami. W miarę umacniania się architektur na arenie międzynarodowej zespół został ponownie przeniesiony w 1987 roku do The IBM Dallas Programming Center, gdzie w 1998 roku został rozwiązany, a prace nad architekturami DCA przerwane głównie z powodu odejścia społeczności PC w innym kierunku konieczności. Architektury DCA zostały w pełni ukończone, ale nie w pełni uzgodnione po 18 latach. Nie było żadnych aktywnych wdrożeń w zasięgu wzroku. [ potrzebne źródło ]
Świat PC zdecydował się na HTML (uważany za aplikację międzynarodowego standardu SGML ) i wykorzystał jego fragmenty do swoich celów. Microsoft Word ostatecznie wykorzystał podobny strumień danych do wewnętrznego roboczego strumienia danych do przechowywania edytowalnej treści. Mimo że standard SGML był dostępny, korzystanie z pełnej implementacji parsera SGML było niepraktyczne, więc jego potencjalny podzbiór stał się de facto standardem poprawialnego tekstu, używanym obecnie na arenie komputerów osobistych.
Mniej więcej w tym samym czasie firma Adobe Systems zaprojektowała i wyprodukowała dokument do druku w formacie PDF , który stał się standardem dla dokumentów drukowanych na komputerach PC. Międzynarodowa norma została ustalona w 2008 roku, przy udziale użytkowników, którzy zdecydowali się na korzystanie z oferowanych masowo produktów. Decyzja była podyktowana zapotrzebowaniem na produkt, a znalezione rozwiązanie było o wiele bardziej akceptowalne niż te, które komitety normalizacyjne były w stanie zaprojektować. Ponad 10 lat pracy nie przyniosło akceptowalnej metody, a społeczność komputerów osobistych stworzyła to, czego potrzebowała, w krótszym czasie. [ potrzebne źródło ]
Próba osiągnięcia konsensusu w strumieniu danych dokumentu została szybko zdominowana przez dostępną i użyteczną zawartość dostarczaną przez firmy, które nie próbowały dzielić się z innymi, ale stworzyły działające rozwiązanie iz powodzeniem sprzedały je użytkownikom. Dane wyjściowe edytora tekstu są „drukowane” w formacie PDF, który jest dostarczany przez najczęściej używany produkt do prezentacji. Na przykład program Microsoft Word zapewnia wybór drukarki „Microsoft Print to PDF” w celu uzyskania wymaganego wyniku dla dokumentu PDF. Podobna metoda mogłaby zostać wykorzystana do stworzenia międzynarodowego standardu, gdyby w końcu się pojawił.
Kiedy IBM rozwiązał swoje Centrum Programowania w Dallas w 1998 roku, cały personel architektów przeszedł na emeryturę i opuścił firmę, z wyjątkiem przeniesionego menedżera, kończąc projekt architektury DCA w dającej się przewidzieć przyszłości w IBM. [ potrzebne źródło ]
Zobacz też
- Zaawansowana prezentacja funkcji
- Rich Text Format (RTF) – inny system kodu formatowania, który jest czasami mylony z Revisable-Form Text.
- Lista języków znaczników dokumentów
Linki zewnętrzne
- Strona główna Konsorcjum AFP
- Konsorcjum prezentacji zaawansowanych funkcji (kwiecień 2017). Architektura zawartości obiektów graficznych dla prezentacji zaawansowanych funkcji (PDF) (wyd. Czwarte) . Źródło 7 lutego 2020 r .
- Williamsa; i in. (1996). Metoda i aparatura do wieloetapowej transformacji formatu dokumentu w systemie przetwarzania danych (PDF) . Patent Stanów Zjednoczonych numer 5 513 323