GB 12345

GB 12345 , zatytułowany Kodeks chińskiego zestawu ideogramów dla zestawu uzupełniającego wymiany informacji ( chiński : 信息交換用漢字編碼字符集輔助集 ), to tradycyjny chiński standard zestawu znaków ustanowiony przez Chiny i można go uważać za tradycyjny odpowiednik GB 2312 . Jest używany do kodowania tradycyjnych chińskich znaków, chociaż nie jest tak powszechnie używany jak Big5 . Ma 6866 znaków i nie ma związku ani zgodności z Big5 i CNS 11643 .

Postacie

Znaki w GB 12345 są ułożone w siatce 94×94 (jak w ISO/IEC 2022 ), a dwubajtowy punkt kodowy każdego znaku jest wyrażony w postaci qu - wei , która określa wiersz ( qu 区) i pozycja znaku w wierszu (komórka, wei 位).

Wiersze (ponumerowane od 1 do 94) zawierają następujące znaki:

  • 01–09: identyczny z GB 2312 , z wyjątkiem wiersza 06 pozycja 57–85, dodano 29 pionowych znaków interpunkcyjnych, a w wierszu 08 pozycja 27–32 dodano 6 znaków pinyin z GB 5007.1–85, sprostowanie GB 2312.
  • 16–87: uporządkowali tradycyjne formy znaków, które zastąpiły ich uproszczone formy z GB 2312.
  • 88–89: 103 chińskie znaki , które zostały połączone w wyniku uproszczenia chińskich znaków.

Wiersze 10–15 i 90–94 są nieprzypisane.

Kodowania

Specyfikacja kodowania ISO-2022-CN-EXT stwierdza, że ​​sekwencja ESC $ ) , po której następuje jeszcze nieokreślony bajt (pokazany przez symbol zastępczy <X12345> ), może być użyta do wskazania znaków GB 12345, podobnie jak sekwencja ESC $ ) A (również z prefiksem ESC $ ) wskazujący GB 2312, ale dopiero po otrzymaniu rejestracji w rejestrze ISO-IR z określeniem, jaki jest końcowy bajt sekwencji. Od 2023 r. Taka rejestracja nie istnieje. Jednak ta sama prośba o uwagi definiuje również etykietę kodowania CN-GB-12345 dla GB 12345 używaną z ASCII w sposób analogiczny do EUC-CN .

Włączenie niestandardowych tradycyjnych chińskich znaków

GB/T 12345 zawiera kilka tradycyjnych znaków, co różni się od tabeli powiązań między znakami chińskiego uproszczonego i chińskiego tradycyjnego w standardowej Tabeli ogólnych standardowych znaków chińskich .

  • 鳧 (57–76): tradycyjnym odpowiednikiem 凫 jest 鳬 (2013:3620, strona 76), 鳧 również nie występuje w formie wariantowej.
  • 隷 (33–05): tradycyjnym odpowiednikiem 隶 jest 隸 (2013:1305, strona 60), jednakże 隷 występuje w formie wariantowej.
  • 𨻶 (47–22): 隙 nie ma tradycyjnego odpowiednika w standardzie.

GB 12345 i Unicode

Znaki w GB 12345 zostały wzięte za jedno ze źródeł zjednoczenia Han , co doprowadziło do ujednoliconego zestawu znaków CJK w początkowym standardzie ISO 10646 / Unicode . Uwzględniono wszystkie 6866 chińskich znaków.

Zobacz też

Linki zewnętrzne