GB 12345
GB 12345 , zatytułowany Kodeks chińskiego zestawu ideogramów dla zestawu uzupełniającego wymiany informacji ( chiński : 信息交換用漢字編碼字符集輔助集 ), to tradycyjny chiński standard zestawu znaków ustanowiony przez Chiny i można go uważać za tradycyjny odpowiednik GB 2312 . Jest używany do kodowania tradycyjnych chińskich znaków, chociaż nie jest tak powszechnie używany jak Big5 . Ma 6866 znaków i nie ma związku ani zgodności z Big5 i CNS 11643 .
Postacie
Znaki w GB 12345 są ułożone w siatce 94×94 (jak w ISO/IEC 2022 ), a dwubajtowy punkt kodowy każdego znaku jest wyrażony w postaci qu - wei , która określa wiersz ( qu 区) i pozycja znaku w wierszu (komórka, wei 位).
Wiersze (ponumerowane od 1 do 94) zawierają następujące znaki:
- 01–09: identyczny z GB 2312 , z wyjątkiem wiersza 06 pozycja 57–85, dodano 29 pionowych znaków interpunkcyjnych, a w wierszu 08 pozycja 27–32 dodano 6 znaków pinyin z GB 5007.1–85, sprostowanie GB 2312.
- 16–87: uporządkowali tradycyjne formy znaków, które zastąpiły ich uproszczone formy z GB 2312.
- 88–89: 103 chińskie znaki , które zostały połączone w wyniku uproszczenia chińskich znaków.
Wiersze 10–15 i 90–94 są nieprzypisane.
Kodowania
Specyfikacja kodowania ISO-2022-CN-EXT stwierdza, że sekwencja ESC $ )
, po której następuje jeszcze nieokreślony bajt (pokazany przez symbol zastępczy <X12345>
), może być użyta do wskazania znaków GB 12345, podobnie jak sekwencja ESC $ ) A
(również z prefiksem ESC $ )
wskazujący GB 2312, ale dopiero po otrzymaniu rejestracji w rejestrze ISO-IR z określeniem, jaki jest końcowy bajt sekwencji. Od 2023 r. Taka rejestracja nie istnieje. Jednak ta sama prośba o uwagi definiuje również etykietę kodowania CN-GB-12345
dla GB 12345 używaną z ASCII w sposób analogiczny do EUC-CN .
Włączenie niestandardowych tradycyjnych chińskich znaków
GB/T 12345 zawiera kilka tradycyjnych znaków, co różni się od tabeli powiązań między znakami chińskiego uproszczonego i chińskiego tradycyjnego w standardowej Tabeli ogólnych standardowych znaków chińskich .
- 鳧 (57–76): tradycyjnym odpowiednikiem 凫 jest 鳬 (2013:3620, strona 76), 鳧 również nie występuje w formie wariantowej.
- 隷 (33–05): tradycyjnym odpowiednikiem 隶 jest 隸 (2013:1305, strona 60), jednakże 隷 występuje w formie wariantowej.
- 𨻶 (47–22): 隙 nie ma tradycyjnego odpowiednika w standardzie.
GB 12345 i Unicode
Znaki w GB 12345 zostały wzięte za jedno ze źródeł zjednoczenia Han , co doprowadziło do ujednoliconego zestawu znaków CJK w początkowym standardzie ISO 10646 / Unicode . Uwzględniono wszystkie 6866 chińskich znaków.
Zobacz też
- GB/T 2312–80
- GB 13000
- GBK
- GB 18030