KPS 9566

KPS 9566
Skróty)	ISO-IR-202 (wersja z 1997 r.)
Języki)	; ; Koreański , angielski , rosyjski Częściowe wsparcie: grecki , japoński
Standard	KPS 9566
Aktualny stan	Używany tylko w Korei Północnej .
Klasyfikacja	DBCS zgodne z ISO-2022 , CJK
Formaty kodowania	Kodowanie w stylu UHC , ISO 2022 .
Inne powiązane kodowanie	KS X 1001 , GB 12052

KPS 9566 („ Standardowy koreański zestaw znaków graficznych KRLD do wymiany informacji ”) to północnokoreański standard określający kodowanie znaków dla systemu pisma Chosŏn'gŭl (Hangul) używanego w języku koreańskim . Wydanie z 1997 r. Określało dwubajtowy kodowany zestaw znaków 94 × 94 zgodny z normą ISO 2022 . Kolejne edycje dodały dodatkowe zakodowane znaki poza płaszczyzną 94 × 94, w sposób porównywalny z UHC czy GBK .

KPS 9566 różni się podejściem od KS X 1001 , swojego południowokoreańskiego odpowiednika, tym, że używa innej kolejności chosŏn'gŭl, koduje wyraźne pionowe formy prezentacji interpunkcji, nie koduje zduplikowanych hanja dla wielu odczytów oraz zawiera kilka znaków specyficznych dla system polityczny Korei Północnej, w tym specjalne kodowanie imion byłych i obecnych przywódców tego kraju ( Kim Il-sunga , Kim Dzong-ila i Kim Dzong-una ).

Chociaż KPS 9566 był oryginalnym źródłem kilku znaków dodanych do Unicode , nie wszystkie znaki KPS 9566 mają odpowiedniki Unicode. Te, które nie są mapowane na podobne znaki Unicode lub na obszar użytku prywatnego .

Tło i inne standardy

Zestaw znaków ASCII powstał w Stanach Zjednoczonych w 1963 roku i został zmieniony w 1967 roku do postaci, jaką ma dzisiaj. ASCII został również zaakceptowany jako międzynarodowy standard w 1967 roku, stając się ECMA-6, oznaczony jako ISO/IEC 646 przez Międzynarodową Organizację Normalizacyjną . Jest obecnie oznaczony jako ANSI X3.4-1986 i ISO 646:1991. ASCII było 7-bitowym, jednobajtowym kodowaniem obejmującym 94 znaki graficzne, spację i 33 kody kontrolne , które zapewniały podstawową obsługę przedstawiania tekstu w języku angielskim amerykańskim jako serii bajtów.

Kolejna edycja ISO 646, opublikowana w 1972 r., Zrewidowała normę, wprowadzając koncepcję krajowych wersji kodu, umożliwiając krajom zastąpienie kilku rzadziej używanych kodów własnymi wymaganymi znakami. Równocześnie trwały prace nad zdefiniowaniem mechanizmów rozszerzeń dla ASCII, z zamiarem zastosowania zarówno w środowiskach 7-bitowych, jak i 8-bitowych. Zostało to ukończone w 1973 roku i opublikowane jako JIS X 0202 , ECMA-35 i ISO 2022 . ISO 2022 określa mechanizmy używania jednobajtowych i wielobajtowych zestawów znaków o określonej strukturze zarówno w środowiskach 7-bitowych, jak i 8-bitowych oraz do deklarowania i przełączania między nimi w standardowy sposób przy użyciu kodów zmiany i sekwencji specjalnych .

Kraje Azji Wschodniej , ze względu na stosowanie dużego repertuaru chińskich znaków , wprowadziły standardowe kodowanie dwubajtowe (DBCS) do swoich systemów pisma, ponieważ liczba znaków możliwych do przedstawienia w kodzie jednobajtowym nie była wystarczająca. W DBCS zgodnym z ISO 2022 każdy znak może być reprezentowany za pomocą dwóch bajtów znaków drukarskich ASCII; lokalizacja znaku może być określona przez te wartości bajtów lub przez dwie liczby od 1 do 94 ( kuten ), równym odpowiednim bajtom minus 32. Pierwszym zarejestrowanym DBCS zgodnym z ISO 2022 i pierwszym wschodnioazjatyckim DBCS, który został ustanowiony jako norma krajowa, była pierwsza edycja JIS X 0208 (Japonia), opublikowana w 1978 roku. następnie GB 2312 (Chiny kontynentalne) w 1980 r. i kod Wansung (Korea Południowa; po raz pierwszy oznaczony jako KS C 5601-1987) w 1987 r. Big5 (Tajwan), zdefiniowany w 1984 r., nie był zgodny ze strukturą ISO 2022. W przypadku używania w środowisku 8-bitowym (a nie 7-bitowym), GB 2312 i kod Wansung były zwykle używane z ósmym zestawem bitów, z ASCII lub podobnym SBCS używany z nieustawionym ósmym bitem; te schematy kodowania są znane odpowiednio jako EUC-CN i EUC-KR .

Chociaż koreański system pisma zawiera indywidualne symbole ( jamo ) dla spółgłosek i samogłosek, służące jako alfabet , tekst koreański jest odpowiednio złożony z tych symboli ułożonych w bloki dla każdej sylaby. Kod Wansung zawierał oddzielnie poszczególne koreańskie bloki sylab, traktując je jako duży zestaw znaków, podobnie jak hanja , i został po raz pierwszy zdefiniowany w trzeciej edycji południowokoreańskiego standardu KS C 5601. Pierwsza edycja zdefiniowała kodowanie indywidualnego jamo, co pozwoliło bloki sylab do zakodowania jako sekwencje, które nazwano N-bajtowym Hangul i nie został przyjęty na tak szeroką skalę, jak zamierzano.

Kod Wansung nie zakodował wszystkich możliwych współczesnych sylab koreańskich, a jedynie wybór 2350 najpopularniejszych, chociaż pozwalał na ich określenie za pomocą sekwencji łączących, które często nie były obsługiwane. Alternatywne kodowanie, również południowokoreańskie, o nazwie Johab zrobiło i przez pewien czas służyło jako konkurent Wansunga. Unified Hangul Code (UHC), wprowadzony przez Microsoft wraz z Windows 95 , rozszerzył EUC-KR, umożliwiając użycie nieprawidłowych dwubajtowych kodów EUC do reprezentowania wszystkich innych sylab dostępnych w Johab. Podobne podejście przyjęto w rozszerzeniu kodowania GBK w Chinach kontynentalnych GB 2312 z obsługą tradycyjnego chińskiego i mniej popularnych chińskich znaków poprzez kodowanie ich do kodów dwubajtowych nieprawidłowych w EUC-CN .

Korea Południowa nie była jedynym krajem, który opracował ISO 2022 DBCS dla języka koreańskiego: w Chinach kontynentalnych GB 12052 opublikowano w 1989 r. Nie było to ściśle związane z kodem Wansunga, chociaż zawierało również złożone sylaby. Zamiast tego odpowiadał GB 2312 z koreańskimi sylabami (i 94 hanja ) zastępującymi chińskie znaki, z wyjątkiem włączenia znaku dolara zamiast znaku juana. Być może został opracowany do użytku przez mniejszość koreańską w północno-wschodnich Chinach.

Podobnie Korea Północna opracowała KPS 9566. Chociaż Korea Północna i Korea Południowa używają koreańskiego Chosŏn'gŭl (Hangul) jako podstawowego systemu pisma, używają różnych porządków leksykograficznych . W związku z tym kolejność znaków różni się między kodem Wansung a KPS 9566.

KPS 9566 przeszedł kilka zmian, w tym edycje 1997 i 2003, głównie w celu zwiększenia zgodności z Unicode . Są one zwykle oznaczane przez podanie roku (np. KPS 9566-97, 9566-2003). Obecna edycja w momencie wydania Red Star OS 3.0 wydaje się być KPS 9566-2011, która dodaje Kim Jong-un do listy liderów. Publicznie dostępna tabela kodów dla wydania KPS 9566 z 1997 r. Przedstawia płaszczyznę ISO 2022 94 × 94. Nowsze edycje, z jakich źródeł informacji są dostępne poza samą Koreą Północną, wydają się określać dodatkowe przydziały poza płaszczyzną EUC (podobnie jak GBK czy UHC).

Ze względu na problemy z interoperacyjnością wynikające z używania wielu standardów krajowych i zastrzeżonych kodowań znaków specyficznych dla platformy lub czcionki, standard Unicode został opracowany z zamiarem umożliwienia wymiany całego reprezentowalnego tekstu w jednym, uniwersalnym formacie. Pierwsza edycja Unicode została opublikowana w 1991 i 1992 r., a norma ISO/IEC 10646 została zsynchronizowana z Unicode w 1993 r. Formaty Unicode są preferowane do użytku międzynarodowego w sieci World Wide Web , gdzie starsze kodowanie znaków jest traktowane jako częściowe kodowanie Unicode za pomocą plików mapowania.

Projekt

Zasadniczo KPS 9566 jest podobny do zestawu znaków Wansung zdefiniowanego przez południowokoreański standard KS X 1001 , chociaż te dwa nie są kompatybilne. Oba kodują sekcję znaków interpunkcyjnych, symboli, jamo , kana i znaków alfabetycznych, po której następuje podzbiór możliwych współczesnych sylab chosŏn'gŭl, a następnie sekcja hanja . Jednak KPS 9566 wykorzystuje inną kolejność jamo i sylab, aby zachować zgodność z porządkiem leksykograficznym Korei Północnej standardy. KPS 9566 zawiera również 28 jawnie obróconych znaków interpunkcyjnych dla typografii pionowej, czego KS X 1001 nie ma, i koduje każdą hanję tylko raz, podczas gdy KS X 1001 koduje kilka hanja z wieloma odczytami wiele razy.

KPS 9566-97 koduje łącznie 2679 sylab chosŏn'gŭl i 4653 hanja. Zapewnia to lepsze pokrycie niż 2350 sylab zakodowanych przez kod Wansung: na przykład znak 똠 użyty w nazwie 똠방각하 [ ko ] , znane koreańskie dzieło literackie, nie ma przypisanego punktu kodowego Wansung, ale ma jeden (38- 02) w KPS 9566. Sekcja hanja zawiera 4652 znaki z Unified Repertoire and Ordering oraz jeden z CJK Unified Ideographs Extension A . Całość rzędu 15, druga połowa rzędu 44 (po bloku sylab) i druga połowa rzędu 94 (po bloku hanja) może być wykorzystana do celów zdefiniowanych przez użytkownika.

KPS 9566 wyróżnia się szczególnie włączeniem kilku znaków specjalnych z życia politycznego Korei Północnej. W szczególności obejmuje godło sierpa, młota i pędzla Partii Pracy Korei , zarówno bez kółka, jak i z kółkiem (punkty kodowe 12-01 i 12-02) oraz dwie grupy trzech znaków specjalnego przeznaczenia, które składają się na imiona przywódcy Korei Północnej Kim Il-sung (김일성) i Kim Dzong-il (김정일) specjalną ozdobną czcionką (odpowiednio punkty kodowe od 04-72 do 04-74 i od 04-75 do 04-77). Sylaby Kim i Il, które są identyczne w pisowni obu imion, są zakodowane dwukrotnie. KPS 9566-2011 dodatkowo zawiera nazwę Kim Jong-un (김정은) jako punkty kodowe od 04-78 do 04-80.

Ze względu na te znaki specjalne obecnie nie ma pełnej zgodności w obie strony między KPS 9566 a Unicode, chyba że nieobsługiwane znaki są mapowane na obszar użytku prywatnego .

KPS 10721

Korea Północna opracowała również drugi zestaw znaków, KPS 10721 „ Kod dodatkowego koreańskiego zestawu Hanja do wymiany informacji ”, który został opublikowany w 2000 r. KPS 10721 koduje zestaw co najmniej 19469 hanja dodatkowych do tych zawartych w KPS 9566. Od 2009, nie wszystkie miały odwzorowania na Unicode, ale zawierały 10358 z Unified Repertoire and Ordering , 3187 z CJK Unified Ideographs Extension A i 107 z CJK Compatibility Ideographs (wszystkie w Basic Multilingual Plane ), a także 5767 z CJK Unified Ideographs Extension B i 50 z CJK Compatibility Ideographs Supplement (w dodatkowej płaszczyźnie ideograficznej ).

Oprócz mapowania tych hanja na Unicode, niewiele wiadomo o standardzie KPS 10721 poza Koreą Północną. Północnokoreańskie glify referencyjne nie są dostępne dla tych Hanja na wykresach kodu Unicode z powodu braku odpowiednich danych czcionek dostępnych dla Konsorcjum Unicode. Znaki hanja Unicode ze źródłami KPS 9566 lub KPS 10721 są jednak odsyłane do ich kodów KPS w Unihan za pomocą klucza kIRG_KPSource .

Dokumentacja i związek z Unicode

Początkowe pokrycie sylab koreańskich przez Unicode , dodane w wersji 1.0, było oparte na kodzie Wansunga. W Unicode w wersji 2.0 dodano nowy blok sylab koreańskich (obecny blok sylab Hangul ), oparty na repertuarze sylab dostępnym w Johab, a poprzedni blok został usunięty (jest teraz zajęty przez CJK Unified Ideographs Extension A ). Dokonano tego przy założeniu, że żadne koreańskie dane zakodowane w Unicode jeszcze nie istniały, ale stały się znane jako „koreański bałagan”, a odpowiedzialne komitety zobowiązały się nie wprowadzać takiej niezgodnej zmiany w przyszłości, zobowiązanie skodyfikowane przez Polityka stabilności Unicode .

Karta kodów dla KPS 9566-97, opublikowana w kwietniu 1997 r., Została zgłoszona do Międzynarodowego Rejestru Zakodowanych Zestawów Znaków ISO w celu rejestracji do użytku z ISO / IEC 2022 . Została zarejestrowana w czerwcu 1998 roku pod numerem ISO-IR-202 . Ta tabela kodów jest publicznie dostępna w Information Processing Society of Japan .

W sierpniu 1999 r. organ krajowy Korei Północnej przedłożył dokument WG2 ( grupa robocza 2 ISO/IEC JTC 1/SC 2), organowi ISO odpowiedzialnemu za ISO/IEC 10646 , międzynarodową normę odpowiadającą Unicode . Ten dokument wymagał dodania kodów KPS 9566 do istniejących odsyłaczy z CJK Unified Ideographs wykresy, dodanie 80 znaków symboli z KPS 9566, które nie miały istniejących odwzorowań Unicode, rozwiązanie różnicy w kolejności sortowania między KPS 9566 a Unicode (ze względu na kolejność znaków w Unicode zgodną z kodowaniem Korei Południowej) oraz dodatek 8 łączący jamo. Poprosił również WG2 o edycję istniejących znaków Unicode i nazw bloków, aby używały terminu „znak koreański” zamiast „Hangul”. Rozszerzona wersja tej propozycji, podzielona na kilka dokumentów, została złożona jako punkt roboczy w grudniu 1999 r.

Szwecji przedłożył szczegółową odpowiedź w marcu 2000 r., sprzeciwiając się kilku punktom i szczegółowo omawiając głosowanie Szwecji przeciwko propozycji. W tej odpowiedzi stwierdzono, że ponowna zmiana kodowania znaków koreańskich spowodowałaby poważne zakłócenia, nawet większe niż za pierwszym razem, co miało miejsce, gdy istniało stosunkowo niewiele implementacji, ale z perspektywy czasu nie powinno było zostać zrobione. Wyjaśniono, że niewiele języków lub żaden nie może być poprawnie zestawionych na podstawie wartości punktu kodowego oraz że dostosowanie algorytmu sortowania Unicode lub ISO/IEC 14651 (wówczas przygotowywana) powinna być wykorzystana do tego celu, a nazwy normatywne już nadanych znaków nie mogą być zmieniane ze względu na politykę stabilności, chociaż można zastosować tłumaczenia nienormatywne na inne języki. Zasugerowano, że sam organ północnokoreański mógłby dostarczyć plik mapowania do odczytu maszynowego między Unicode a KPS 9566 i byłby bardziej użyteczny niż drukowane odsyłacze w standardowym dokumencie. Jeśli chodzi o proponowane dodatkowe znaki, w odpowiedzi stwierdzono, że nie należy dodawać znaków, które miałyby dekompozycję kompatybilności w Unicode, oraz że nie należy dodawać logo, w tym logo partii politycznych, oraz znaków specjalnych imion i nazwisk konkretnych osób.

W lipcu 2000 roku północnokoreański organ napisał do WG2, zarzucając im, że rozwijają obie wersje kodowania Unicode dla języka koreańskiego wyłącznie na podstawie propozycji Korei Południowej, bez konsultacji z Koreą Północną, zarzucając im, że stawiają interesy handlowe firm i obawy przed zamieszanie wokół poszanowania suwerenności Korei Północnej oraz stwierdzenie, że Korea Północna uzna dalszą odmowę zmiany nazw i kolejności koreańskich znaków w Unicode za obrazę ich suwerennej godności i za naruszenie ISO roszczeń do bezstronności. Ponownie zażądali, aby WG2 i Unicode „poprawiły” kolejność koreańskich znaków i „poprawiły” nazwy „Hangul Jamo” i „Sylaba Hangul” na „alfabet koreański” i „sylaba koreańska”.

W sierpniu 2000 r. organ krajowy Korei Północnej przedstawił bardziej szczegółową wersję swoich wniosków w serii pięciu kolejnych propozycji. Prosili o dodanie 14 dodatkowych znaków jamo, dodanie 82 znaków symboli i użycie terminu „alfabet koreański” zamiast „Hangul”, dostarczyli dowodów potwierdzających północnokoreański porządek zestawienia i zażądali dodania północnokoreańskiego repertuar hanji. Propozycje te zostały omówione podczas dwóch spotkań między Koreą Północną a Koreą Południową , szwedzcy i inni przedstawiciele WG2 we wrześniu 2000 r., w którym północnokoreański organ został poproszony o dostarczenie manuskryptów potwierdzających dodatkowe znaki jamo, ponowne przedłożenie propozycji symboli z usuniętymi symbolami, które zostały już zaakceptowane w Unicode, oraz rozważenie użycia ISO / IEC 14651 , następnie na końcowym etapie projektu, do celów zestawiania.

We wrześniu 2001 r. Północnokoreański organ krajowy przedłożył poprawioną serię propozycji z prośbą o dodanie kilku znaków KPS 9566 i KPS 10721, w tym 70 znaków symboli, do Unicode. W tej wersji wniosku zawarto część fragmentów dokumentów wykazujących użycie kilku znaków oraz krótkie wyjaśnienia ich przeznaczenia. Robotnicza Korei symbol został nazwany „Młot, Sierp i Pędzel”, przemianowany z „Znaku Partii Robotniczej Korei” we wcześniejszych wersjach wniosku i uzasadniony jako symbol identyfikacyjny na mapach. Jako uzasadnienie proponowanych znaków imion przywódców wyjaśnili, że imiona przywódców często pojawiają się w publikacjach północnokoreańskich z innym rozmiarem i grubością czcionki w celu podkreślenia. W ramach działań następczych przedstawicieli WG2 z Korei Południowej zażądano dowodów, imion w języku koreańskim i uzasadnień dodania niektórych z tych znaków, i zauważono, że niepodkreślone wersje imion przywódców już istniały. Spotkanie przedstawicieli WG2 z Korei Północnej i Południowej zostało zwołane w październiku 2001 r., Na którym zalecono dodanie 47 znaków symboli do Unicode i zasugerowano, aby WG2 podniosła nazwiska przywódców i symbole WPK do dalszej dyskusji.

W kolejnym dokumencie zwrotnym z lutego 2002 r. dotyczącym proponowanych przez Koreę Północną dodatków żądano, aby symbol „herbaty” oznaczający herbaciarnię zostać zaakceptowany jako bardziej ogólny symbol „napoju gorącego”, utożsamiając go z symbolami używanymi w przewodnikach do oznaczania napojów gorących lub bezalkoholowych. Zalecił również, aby glif referencyjny dla istniejącego punktu kodowego parasola bez deszczu został zmodyfikowany, aby harmonizował z proponowanym glifem referencyjnym dla parasola z deszczem, zrównując je z symbolami „utrzymuj suchość” używanymi na opakowaniach, i poruszył kwestię, które piorun i symbole ostrzegawcze wysokiego napięcia w istniejących zbiorach symboli mogłyby zostać ujednolicone z proponowanym znakiem „wysokiego napięcia”. Wszystkie trzy z tych znaków zostały zaakceptowane w Unicode w wersji 4.0. Zalecono również, aby ułamki z poziomymi kreskami i nożyczki skierowane w lewą stronę były zakodowane przy użyciu selektor odmian , ponieważ nożyczki nie towarzyszyły nożyczkom zorientowanym w inny sposób, a istniejące punkty kodowe ułamków Unicode ujednoliciły formy skośne i poziome.

W listopadzie 2002 r. południowokoreański organ opublikował zestaw trójdzielnych tabel odwzorowujących znaki między normami KPS 9566, KS X 1001 (jako EUC-KR) i ISO/IEC 10646, jakie istniały w 2000 r. Tabele te zostały przygotowane bez wejście z Korei Północnej.

W sierpniu 2004 roku, para tabel mapowania między KPS 9566-2003 a Unicode została przesłana do projektu OpenOffice.org przez osobę używającą nazwy „ooprojlover”, która stwierdziła, że reprezentują one zaktualizowaną wersję standardu KPS 9566 i poprosiła o to dodać wsparcie. Pliki te odwzorowywały znaki niedostępne w Unicode na obszar użytku prywatnego i zawierały dodatkowe zakodowane formy dla innych bloków sylab poza główną płaszczyzną ISO-IR-202. Tabela mapowania została później opublikowana przez Konsorcjum Unicode w 2011 r. na podstawie tych danych kartograficznych, ale z poprawionymi błędami w odniesieniu do mapy ISO-IR.

Kopie Red Star OS 3.0 zawierają czcionki dla nowszej edycji KPS 9566, wyglądającej na KPS 9566-2011. Pomyślnie wyodrębniono tabelę mapowania używaną wewnętrznie przez Red Star OS. Oprócz dodania Kim Jong-una do listy przywódców, KPS 9566-2011 zmienia mapowania niektórych form pionowych w porównaniu z mapowaniami z 2003 r. (Wykorzystując blok form pionowych dodany w Unicode 4.1), a także zawiera kilka dodatkowych hanja i symboli zakodowane poza płaszczyzną ISO-IR-202. Kilka z tych dodatkowych symboli jest również przyporządkowanych do obszaru użytku prywatnego; jednak ich tożsamość nie jest znana, ponieważ poza Koreą Północną nie są znane żadne imiona ani glify referencyjne tych postaci.

Wpływ na Unicode dzisiaj

Kilka aktualnych znaków Unicode zostało dodanych do Unicode 4.0 w wyniku propozycji Korei Północnej, chociaż nie zawsze w pierwotnie proponowanych punktach kodowych. Należą do nich GORĄCY NAPÓJ (☕, proponowany jako SYMBOL HERBATY), który został zaproponowany jako symbol mapy do oznaczania herbaciarni oraz symbole flag BIAŁA FLAGA (⚐) i CZARNA FLAGA (⚑), które zostały zaproponowane jako symbole map dla miejsc bitew i zwycięstw militarnych. Znaki te zostały zaproponowane odpowiednio dla tymczasowych punktów kodowych U+270A, U+268E i U+268F, ale zostały zakodowane odpowiednio w końcowych punktach kodowych U+2615, U+2690 i U+2691. Obejmują one również serię pogrubionych strzałek kierunkowych w zakresie od U + 2B05 do U + 2B0D, z wyłączeniem strzałki skierowanej w prawo, która została zmapowana na istniejący znak w bloku Dingbats, które zostały dodane w tych samych punktach kodowych, dla których zostały zaproponowane, oprócz zamiany strzałek północno-wschodniej i północno-zachodniej w porównaniu z propozycją.

Inne znaki piktograficzne, które znalazły się w propozycji Korei Północnej, to parasol z kroplami deszczu (☔), piorun oznaczający wysokie napięcie (⚡) i trójkąt ostrzegawczy (⚠). Po dyskusji na temat innych glifów symboli wysokiego napięcia w użyciu reprezentował ten sam znak, co ten z propozycji północnokoreańskiej i który glif najlepiej byłoby umieścić dla niego na wykresie kodu Unicode, a po modyfikacji glifu wykresu kodowego istniejącego znaku parasolowego bez deszczu (U + 2602 , ☂), aby zharmonizować się z nowym parasolem z kroplami deszczu z propozycji Korei Północnej, znaki te zostały również dodane w Unicode 4.0, w tym samym czasie co flagi i symbol napoju. Chociaż zaproponowano tymczasowe punkty kodowe U + 2618, U + 267F i U + 267E, nadano im odpowiednio ostateczne punkty kodowe U + 2614, U + 26A1 i U + 26A0.

Spośród tych znaków gorący napój, parasol z kroplami deszczu, błyskawica i trójkąt ostrzegawczy oraz strzałki w górę, w dół i w lewo zostały następnie wybrane jako odwzorowania z japońskich zestawów emotikonów komórkowych, co daje w sumie siedem aktualnych emotikonów Unicode, które zostały pierwotnie dodane do Unicode na prośbę Korei Północnej. Parasol z kroplami deszczu oraz strzałkami w górę, w dół i w lewo zostały również ujednolicone ze znakami z rozszerzeń ARIB używany w japońskich programach telewizyjnych, który zawiera kilka znaków sklasyfikowanych obecnie jako emoji i został odwzorowany na Unicode w Unicode 5.2. Jednak para białych i czarnych flag używana jako emoji lub w sekwencjach flag regionalnych i identyfikacyjnych emoji to inny, „machający” zestaw dodany w Unicode 7.0 (U + 1F3F3 🏳 i U + 1F3F4 🏴), a nie para z Korei Północnej.

Od 2018 r. Pozostało kilka znaków KPS 9566, które nie są odwzorowane na Unicode. Należą do nich symbol WPK, cztery trójkątne znaki, para nożyczek skierowanych w lewo (wykluczone ze względu na to, że nie wykazano kontrastowego użycia nożyczek skierowanych w prawo w bloku Dingbats), skierowany w górę manikiuł w kole, prezentacja pionowa formy znaków interpunkcyjnych, warianty nawiasów zamykających zawierające kropki , warianty ułamków wulgarnych z poziomą kreską zakodowane oddzielnie od ich wersji ukośnych oraz nazwiska liderów.

Japoński znak pocztowy z trójkątem skierowanym w dół został uwzględniony w KPS 9566-97, ale usunięty w KPS 9566-2003 po tym, jak organ północnokoreański wycofał go ze swojej propozycji Unicode do przeglądu w odpowiedzi na prośby organu południowokoreańskiego o przedstawienie dowodów potwierdzających użycie symbolu w Korei Północnej. Ten znak został ponownie zaproponowany w 2018 roku na podstawie zgodności z KPS 9566 i zidentyfikowany jako znak zgodności elektrycznej używany w Japonii przed jego zastąpieniem diamentem PSE . Został dodany do Unicode w wersji 13.0, opublikowanej w 2020 roku.

Zakodowane formularze

Wydanie KPS 9566 z 1997 r. Zostało zarejestrowane w Międzynarodowym rejestrze kodowanych zestawów znaków do użytku z sekwencjami specjalnymi jako ISO-IR-202 i dlatego może być kodowane przy użyciu ISO / IEC 2022 . Jest to 94 ^-n wielobajtowy zestaw G, tzn. jeśli jest używany w 7-bitowym kodzie ISO 2022 (analogicznie do ISO-2022-JP lub ISO-2022-KR ), znaki będą kodowane parami bajtów pomiędzy 0x21 i 0x7E w odpowiednim trybie.

Udokumentowane mapowania między KPS 9566 i Unicode dla wydań KPS 9566 z 2003 i 2011 roku wykorzystują kodowanie przypominające adaptację Unified Hangul Code (UHC) do kodowania KPS 9566 zamiast kodu Wansung, z ich zaktualizowanymi wersjami ISO-IR-202 płaszczyzna jest kodowana przy użyciu par bajtów między 0xA1 a 0xFE oraz innymi dwubajtowymi kodami używanymi dla sylab nieobecnych w ISO-IR-202. Kolejność rozszerzonych sylab jest zgodna ze zwykłą kolejnością KPS 9566. Podobnie jak UHC, używają bajtów wiodących 0x81 i wyższych oraz bajtów końcowych z zakresów 0x41–0x5A, 0x61–0x7A i 0x81–0xFE, z wyłączeniem zakresu 0xA1–0xFE, jeśli bajt wiodący to 0xA1 lub wyższy.

Wydanie z 2011 roku zawiera również kilka dodatkowych hanja i symboli zakodowanych poza płaszczyzną ISO-IR-202, po zakresie używanym dla rozszerzonych bloków sylab. To podejście jest podobne do przyjętego przez GBK , ale z bajtami śladowymi pozostającymi w zakresach w stylu UHC: podobnie jak rozszerzone sylaby z bajtami wiodącymi 0xA1 i wyższymi, wszystkie one używają zakresów bajtów śledzących 0x41–0x5A, 0x61–0x7A i 0x81 –0xA0. Rozszerzone hanja są kodowane za pomocą wiodących bajtów między 0xC8 a 0xDC, rozszerzone symbole są kodowane za pomocą głównych bajtów między 0xE0 a 0xEA, a rozszerzone kody z głównymi bajtami między 0xEC a 0xFE są mapowane, bez przerw, do obszaru użytku prywatnego (porównaj zakresy zdefiniowane przez użytkownika w GBK). Kilka znaków w sekcji rozszerzonych symboli i trzy w sekcji hanja jest również mapowanych na obszar prywatnego użytku Unicode; w przeciwieństwie do symboli mapowanych przez PUA na głównej płaszczyźnie ISO-IR-202, tożsamość tych znaków nie jest udokumentowana.

Bajt wiodący

Ten wykres przedstawia ogólny układ płaszczyzny głównej zestawu znaków KPS 9566 według bajtu wiodącego. W przypadku bajtów wiodących używanych dla znaków innych niż złożone sylaby chosŏn'gŭl lub hanja, na tej stronie znajdują się łącza do wykresów zawierających znaki zakodowane w tym bajcie wiodącym. W przypadku bajtów wiodących używanych do Hanja podane są linki do odpowiedniej sekcji indeksu Hanja w Wikisłowniku .

Tam, gdzie podane są dwie liczby szesnastkowe, wartość poniżej 0x7F jest używana w kodowaniu 7-bitowym, a większa wartość (między 0xA1 a 0xFE) jest używana w 8-bitowym kodowaniu w stylu EUC . Rozszerzone 8-bitowe kodowanie w stylu UHC , zdefiniowane w wydaniu z 2003 r., Podobnie wykorzystuje większe wartości bajtów, od 0xA1 do 0xFE włącznie, dla głównej płaszczyzny opartej na ISO-IR-202.

KPS 9566 (bajty wiodące)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór	Sp	1-_	2-_	3-_	4-_	5-_	6-_	7-_	8-_	9-_	10-_	11-_	12-_	13-_	14-_	15-_
3x/Bx	16-_	17-_	18-_	19-_	20-_	21-_	22-_	23-_	24-_	25-_	26-_	27-_	28-_	29-_	30-_	31-_
4x/Cx	32-_	33-_	34-_	35-_	36-_	37-_	38-_	39-_	40-_	41-_	42-_	43-_	44-_	45-_	46-_	47-_
5x/Dx	48-_	49-_	50-_	51-_	52-_	53-_	54-_	55-_	56-_	57-_	58-_	59-_	60-_	61-_	62-_	63-_
6x/przykł	64-_	65-_	66-_	67-_	68-_	69-_	70-_	71-_	72-_	73-_	74-_	75-_	76-_	77-_	78-_	79-_
7x/Fx	80-_	81-_	82-_	83-_	84-_	85-_	86-_	87-_	88-_	89-_	90-_	91-_	92-_	93-_	94-_	DEL

Non-Hanja, nieskomponowane zestawy w planie głównym

Zestaw znaków 0x21/0xA1 (wiersz numer 1, znaki interpunkcyjne i pionowe)

Ten zestaw zawiera typowe znaki interpunkcyjne w zdaniu, takie jak nawiasy, cudzysłowy, przecinki itp., a także formularze prezentacji do użytku w piśmie pionowym. Interpunkcja ASCII (podświetlona) jest pokazana poniżej odwzorowana na Basic Latin (zgodnie z artykułami dotyczącymi innych zestawów znaków CJK, takich jak KS X 1001 lub JIS X 0208 ), ale jest odwzorowana na blok formularzy o połowie szerokości i pełnej szerokości, gdy jest używana w kodowaniu, które łączy KPS 9566 z ASCII (zgodnie z definicją na przykład w wydaniu z 2003 r.).

W porównaniu z mapowaniem z 2003 r., mapowanie z 2011 r. Zmienia mapowania Unicode trzech pionowych form prezentacji, aby skorzystać z bloku form pionowych wprowadzonego w Unicode 4.1.

KPS 9566 (z prefiksem 0x21/0xA1)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		IDSP	3001 _	3002 _	, 002C	. 002E	· 00B7	: 003A	; 003B	? 003F	! 0021	‥ 2025	… 2026	~ 007E	〃 3003	― 2015
3x/Bx	- 2010	_ 005F	￣ FFE3	/ 002F	\ 005C	\| 007C	∥ 2225	∕ 2215	∖ 2216	309B _	309C _	´ 00B4	` 0060	¨ 00A8	Bibliografia _	02C7 _
4x/Cx	˙ 02D9	ʼ / ︐	˚ / ︒	ˊ / ︑	⋮ 22EE		' 2018	' 2019	„ 201C	201D _	( 0028	) 0029	〔 3014	3015 _	[ 005B	] 005D
5x/Dx	{ 007B	} 007D	〈 3008	〉 3009	《 300A	》 300B	「 300C	」 300D	『 300E	』 300F	【 3010	】 3011	.)	.⟫	201A _	‛ 201b
6x/przykł	„ 201E	‟ 201F	︵ FE35	︶ FE36	︹ FE39	︺ FE3A	﹇FE47 _	﹈ FE48	︷ FE37	︸ FE38	︿ FE3F	﹀ FE40	︽ FE3D	︾ FE3E	﹁ FE41	﹂ FE42
7x/Fx	﹃ FE43	﹄ FE44	︻ FE3B	︼ FE3C
Interpunkcja ASCII może być również odwzorowana na blok formularzy o połowie szerokości i pełnej szerokości . Zmapowany do obszaru użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x22/0xA2 (wiersz numer 2, symbole i operatory)

Ten zestaw zawiera operatory matematyczne i kilka innych symboli, takich jak ampersand , pilcrow , nuta muzyczna i tak dalej. Interpunkcja ASCII (podświetlona) jest pokazana poniżej odwzorowana na Basic Latin (zgodne z artykułami na temat innych zestawów znaków CJK), ale jest odwzorowana na blok formularzy Halfwidth i Fullwidth Forms , gdy jest używana w kodowaniu, które łączy KPS 9566 z ASCII .

W tym rzędzie znajduje się kilka trójkątnych symboli „znaków drogowych” oznaczających nadchodzące góry lub pochyłości z przodu lub z jednej strony, ale obecnie nie są one uwzględnione w Unicode. Są one zmapowane do obszaru użytku prywatnego.

KPS 9566 (z prefiksem 0x22/0xA2)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		+ 002B	- 002D	± 00B1	× 00D7	÷ 00F7	= 003D	≠ 2260	< 003C	> 003E	≦ 2266	≧ 2267	∞ 221E	∴ 2234	♂ 2642	♀ 2640
3x/Bx	∠ 2220	⊥ 22A5	⌒ 2312	∂ 2202	∇ 2207	≡ 2261	≒ 2252	≈ 2248	≪ 226A	≫ 226B	√ 221A	∽ 223D	∝ 221D	∵ 2235	∫ 222B	∬ 222C
4x/Cx	∮ 222E	∈ 2208	∋ 220B	⊆2286 _	⊇ 2287	⊂ 2282	⊃ 2283	∉ 2209	∌220C _	⊈ 2288	⊉ 2289	⊄2284 _	⊅2285 _	∪ 222A	∩ 2229	∧ 2227
5x/Dx	∨ 2228	￢ FFE2	⇒ 21D2	⇔ 21D4	∀ 2200	∃ 2203	∑ 2211	# 0023	& 0026	* 002A	@ 0040	§00A7 _	※ 203B	☆ 2606	★ 2605	○ 25CB
6x/przykł	● 25 CF	◎ 25 n.e	◇ 25C7	◆ 25C6	□ 25A1	■ 25A0	△ 25B3	▲ 25B2	▽ 25BD	▼ 25 pne	▷ 25B7	◁ 25C1	▶ 25B6	◀ 25C0	∘ 2218	∙ 2219
7x/Fx	❖2756 _					⚐ 2690	⚑ 2691	♯ 266F	♭ 266D	♪ 266A	† 2020	‡ 2021	¶ 00B6	⊕ 2295	⊖2296 _
Interpunkcja ASCII może być również odwzorowana na blok formularzy o połowie szerokości i pełnej szerokości . Zmapowany do obszaru użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x23/0xA3 (wiersz numer 3, cyfry i Roman)

Ten zestaw zawiera podzbiór ASCII , bez znaków interpunkcyjnych i symboli, składający się z zachodnich cyfr arabskich i obu przypadków podstawowego alfabetu łacińskiego . Porównaj wiersz 3 JIS X 0208 , który dokładnie pasuje do tego wiersza. Porównaj i porównaj rząd 3 KS X 1001 i GB 2312 , które zawierają w tym wierszu całe ich krajowe warianty ISO 646 , a nie tylko podzbiór alfanumeryczny.

Znaki w tym wierszu są pokazane poniżej jako mapowane na punkty kodowe Basic Latin (zgodne z artykułami dotyczącymi innych zestawów znaków), ale są mapowane na blok formularzy Halfwidth i Fullwidth Forms , gdy są używane w kodowaniu, które łączy KPS 9566 z ASCII .

KPS 9566 (z prefiksem 0x23/0xA3)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór
3x/Bx	0 0030	1 0031	2 0032	3 0033	4 0034	5 0035	6 0036	7 0037	8 0038	9 0039
4x/Cx		0041 _	B 0042	C 0043	D 0044	E 0045	F 0046	G 0047	H 0048	ja 0049	J 004A	K 004B	L 004C	M 004D	N 004E	O 004 F
5x/Dx	P 0050	Pytanie 0051	R 0052	S 0053	T 0054	U 0055	V 0056	W 0057	X 0058	Y 0059	Z 005A
6x/przykł		0061 _	b 0062	c 0063	d 0064	e 0065	f 0066	g 0067	h 0068	ja 0069	j 006A	k 006B	l 006C	m 006D	n 006E	o 006F
7x/Fx	str. 0070	q 0071	r 0072	s 0073	0074 _	ty 0075	v 0076	w 0077	x 0078	y 0079	z 007A

Zestaw znaków 0x24/0xA4 (wiersz numer 4, Chosŏn'gŭl jamo i imiona liderów)

Ten zestaw zawiera Chosŏn'gŭl jamo , a także specjalne kodowanie imion (od 2003 r.) Przywódców Korei Północnej Kim Il-sunga i Kim Dzong-ila . Imię Kim Jong-un jest również zawarte w wydaniu z 2011 roku. Porównaj z rzędem 4 KS X 1001 .

Jamo w tym wierszu, które istnieje w bloku Unicode Hangul Compatibility Jamo (zawierającym niezależne od pozycji znaki odwzorowane z KS X 1001) są odwzorowywane na ten blok. Przestarzałe jamo , które wyróżnia spalatalizowane sybilanty, odwzorowuje znaki specyficzne dla pozycji w bloku Hangul Jamo . I odwrotnie, nie wszystkie przestarzałe jamo zakodowane przez KS X 1001 są zakodowane w głównej płaszczyźnie KPS 9566. W wydaniu KPS 9566 z 2011 roku niektóre inne historyczne jamo z KS X 1001 są zawarte poza główną płaszczyzną, z główny bajt 0xEA .

Specjalne kodowanie imion przywódców nie jest obecne w Unicode i jest mapowane na obszar użytku prywatnego. Są one pokazane poniżej w postaci symulacji ze znacznikami.

KPS 9566 (z prefiksem 0x24/0xA4)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		ㄱ 3131	ㄴ 3134	3137 _	ㄹ 3139	3141 _	3142 _	ㅅ 3145	ㅇ 3147	ㅈ 3148	ㅊ 314A	ㅋ 314B	ㅌ 314C	ㅍ 314D	ㅎ 314E	ㄲ 3132
3x/Bx	ㄸ 3138	ㅃ 3143	ㅆ 3146	ㅉ 3149	ㅏ 314F	ㅑ 3151	ㅓ 3153	ㅕ 3155	ㅗ 3157	ㅛ 315B	ㅜ 315C	ㅠ 3160	ㅡ 3161	ㅣ 3163	ㅐ 3150	ㅒ 3152
4x/Cx	ㅔ 3154	ㅖ 3156	ㅚ 315A	ㅟ 315F	ㅢ 3162	ㅘ 3158	ㅝ 315D	ㅙ 3159	ㅞ 315E	ㄳ 3133	ㄵ 3135	ㄶ 3136	ㄺ 313A	ㄻ 313B	ㄼ 313C	ㄽ 313D
5x/Dx	ㄾ 313E	ㄿ 313F	ㅀ 3140	ㅄ 3144	ㅿ 317F	3181 _	ㆆ 3186	ㆍ 318D	ᄼ 113C	ᄽ 113D	ᄾ 113E	ᄿ 113F	ᅎ 114E	ᅏ 114F	ᅐ 1150	ᅑ 1151
6x/przykł	ᅔ 1154	ᅕ 1155							김	일	성	김	정	일	김	정
7x/Fx	은
Zmapowany do obszaru użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x25/0xA5 (wiersz numer 5, cyrylica)

Ten zestaw zawiera oba przypadki 33 liter z cyrylicy , wystarczających do napisania współczesnego alfabetu rosyjskiego i alfabetu bułgarskiego , chociaż inne formy cyrylicy wymagają dodatkowych liter.

Porównaj wiersz 12 w KS X 1001 i wiersz 7 w JIS X 0208 , które wykorzystują ten sam układ (ale w innym rzędzie).

KPS 9566 (z prefiksem 0x25/0xA5)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		А 0410	Б 0411	0412 _	Г 0413	Ę 0414	Е 0415	0401 _	0416 _	0417 _	0418 _	Й 0419	K 041A	Л 041B	M 041C	Н 041D
3x/Bx	О 041E	П 041F	Р 0420	C 0421	Т 0422	У 0423	Ф 0424	0425 _	Ö 0426	Ч 0427	Ř 0428	Щ 0429	Ъ 042A	042B _	Ь 042C	Э 042D
4x/Cx	Ş 042E	ß 042F
5x/Dx		0430 _	0431 _	w 0432	г 0433	0434 _	0435 _	ё 0451	ć 0436	z 0437	i 0438	© 0439	к 043A	л 043B	м 043C	н 043D
6x/przykł	® 043E	п 043F	0440 _	0441 _	0442 _	0443 _	ф 0444	х 0445	0446 _	ч 0447	ř 0448	щ 0449	ъ 044A	ы 044B	ь 044C	э 044D
7x/Fx	ю 044E	я 044F

Zestaw znaków 0x26/0xA6 (wiersz nr 6, litery greckie i cyfry rzymskie)

Ten zestaw zawiera cyfry rzymskie i podstawową obsługę alfabetu greckiego , bez znaków diakrytycznych i końcowej sigmy .

Porównaj i porównaj rząd 5 w KS X 1001 (który używa tych samych znaków, ale w innym układzie i innym rzędzie) i rząd 6 w JIS X 0208 (który używa tego samego układu dla liter greckich, ale bez cyfr rzymskich).

KPS 9566 (z prefiksem 0x26/0xA6)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		Α 0391	B 0392	Γ 0393	Δ 0394	Ε 0395	Ζ 0396	0397 _	Θ 0398	I 0399	K 039A	Λ 039B	Μ 039C	Ν 039D	Ξ 039E	Ο 039F
3x/Bx	Π 03A0	Ρ03A1 _	Σ 03A3	Τ 03A4	Υ 03A5	Φ 03A6	Χ 03A7	Ψ 03A8	Ω 03A9
4x/Cx		α 03B1	β 03B2	γ 03B3	δ 03B4	ε 03B5	ζ 03B6	η 03B7	θ 03B8	ι 03B9	κ 03BA	λ 03BB	μ 03 pne	v 03BD	ξ 03BE	o 03BF
5x/Dx	π03C0 _	ρ 03C1	σ 03C3	τ 03C4	υ 03C5	φ 03C6	χ 03C7	ψ 03C8	ω 03C9
6x/przykł		Ⅰ 2160	Ⅱ 2161	Ⅲ 2162	Ⅳ 2163	Ⅴ 2164	Ⅵ 2165	Ⅶ 2166	Ⅷ 2167	Ⅸ 2168	Ⅹ 2169
7x/Fx		ⅰ 2170	ⅱ 2171	ⅲ 2172	ⅳ 2173	ⅴ 2174	ⅵ 2175	ⅶ 2176	ⅷ 2177	ⅸ 2178	ⅹ 2179

Zestaw znaków 0x27/0xA7 (wiersz numer 7, otoczony, indeks górny, indeks dolny, ułamki)

Kilka cyfr w kółku w tym rzędzie zostało niepoprawnie odwzorowanych na Unicode w wydaniu z 2003 roku, z powodu użycia nieostatecznych proponowanych punktów kodowych. Zostały one poprawione w wydaniu z 2011 roku.

KPS 9566 (z prefiksem 0x27/0xA7)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		① 2460	② 2461	③ 2462	④ 2463	⑤ 2464	⑥ 2465	⑦ 2466	⑧ 2467	⑨ 2468	⑩ 2469	⑪ 246A	⑫ 246B	⑬ 246C	⑭ 246D	⑮ 246E
3x/Bx	⑯ 246F	⑰ 2470	⑱ 2471	⑲ 2472	⑳ 2473	㉑ 3251	㉒ 3252	㉓ 3253	㉔ 3254	㉕ 3255	3256 _	㉗ 3257	㉘ 3258	3259 _	㉚ 325A
4x/Cx		㉠ 3260	㉡ 3261	㉢ 3262	㉣ 3263	㉤ 3264	㉥3265 _	㉦ 3266	㉧ 3267	㉨3268 _	㉩ 3269	326A _	㉫ 326B	㉬ 326C	㉭ 326D
5x/Dx		㉮ 326E	㉯ 326F	㉰ 3270	3271 _	㉲ 3272	㉳ 3273	㉴ 3274	㉵ 3275	㉶ 3276	3277 _	㉸ 3278	3279 _	㉺ 327A	㉻ 327B
6x/przykł	⁰ 2070	¹ 00B9	² 00B2	³ 00B3	⁴ 2074	⁵ 2075	⁶ 2076	⁷ 2077	⁸ 2078	⁹ 2079	½ 00BD	⅓ 2153	⅔ 2154	¼ 00 pne	¾ 00BE
7x/Fx	₀ 2080	₁ 2081	2082 zł	₃ 2083	2084 ₄	₅ 2085	₆2086 _	₇ 2087	₈ 2088	₉ 2089	1 / 2	1 / 3	2 / 3	1 / 4	3 / 4
Zmapowany do obszaru użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x28/0xA8 (wiersz nr 8, symbole jednostki, ilości i waluty)

Ten zestaw zawiera symbole jednostek miary i waluty. Te obecne w ASCII (podświetlone) są pokazane poniżej zmapowane na Basic Latin (zgodne z artykułami na temat innych zestawów znaków CJK), ale są odwzorowane na blok formularzy Halfwidth i Fullwidth , gdy są używane w kodowaniu, które łączy KPS 9566 z ASCII .

W wydaniu z 2003 roku znak Kelvina został zastąpiony znakiem euro . Wydanie 2011 zawiera alternatywne kodowanie znaku Kelvina w 0xE988 .

Porównaj i porównaj z repertuarem symboli jednostek zawartych w wierszu 7 KS X 1001 .

KPS 9566 (z prefiksem 0x28/0xA8)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		° 00B0	′ 2032	″ 2033	℃ 2103	℉ 2109	€ / K	￦ FFE6	0024 $	￠ FFE0	￡ FFE1	￥ FFE5	% 0025	‰ 2030	Å 212B	㏄ 33C4
3x/Bx	㎡ 33A1	㎥33A5 _	㎝ 339D	㎠ 33A0	㎤33A4 _	㎜ 339C	㎟339F _	㎣ 33A3	㍷ 3377	㍸3378 _	㍹3379 _	㎞ 339E	㎢ 33A2	㎦ 33A6	㎙3399 _	㎚ 339A
4x/Cx	㎛339B _	㎧ 33A7	㎨33A8 _	㎍338D _	㎎338E _	㎏338F _	㎴ 33B4	㎵ 33B5	㎶ 33B6	㎷ 33B7	㎸ 33B8	㎹ 33B9	㎀3380 _	3381 _	3382 _	㎃ 3383
5x/Dx	㎄3384 _	㎺ 33BA	㎻ 33 BB	㎼ 33 pne	㎽ 33BD	㎾ 33 BE	㎿ 33BF	Ω 2126	㏀ 33C0	33C1 _	㎐ 3390	㎑ 3391	㎒ 3392	㎓ 3393	㎔ 3394	㏞ 33 DE
6x/przykł	㏟ 33DF	㎰ 33B0	㎱ 33B1	㎲ 33B2	㎳ 33B3	㎊ 338A	㎋ 338B	㎌ 338C	㎩ 33A9	㎪ 33AA	㎫ 33AB	㎬33AC _	ℓ 2113	㎕ 3395	㎖3396 _	㎗ 3397
7x/Fx	㎘3398 _	㏿ 33FF	㎈3388 _	㎉ 3389	㎭ 33 AD	㎮ 33AE	㎯ 33AF	㋌ 32 CC	㏝ 33DD	㏈33C8 _	㋍ 32CD	㋎ 32 n.e	㏖33D6 _	㏋ 33CB	㏊ 33CA
Interpunkcja ASCII może być również odwzorowana na blok formularzy o połowie szerokości i pełnej szerokości .

Zestaw znaków 0x29/0xA9 (wiersz numer 9, rysunek w ramce)

KPS 9566 (z prefiksem 0x29/0xA9)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		─ 2500	│ 2502	┌ 250C	┐ 2510	┘ 2518	└ 2514	├ 251C	┬ 252C	┤ 2524	┴ 2534	┼ 253C	━ 2501	┃ 2503	┏ 250F	┓ 2513
3x/Bx	┛251B _	┗ 2517	┣ 2523	┳ 2533	┫ 252B	┻ 253b	╋ 254B	┠ 2520	┯ 252F	┨ 2528	┷ 2537	┿ 253F	┝251D _	┰ 2530	┥ 2525	┸2538 _
4x/Cx	╂ 2542	┒ 2512	┑ 2511	┚ 251A	┙ 2519	┖2516 _	┕ 2515	┎ 250E	┍ 250D	┞ 251E	┟ 251F	┡ 2521	┢ 2522	┦ 2526	┧ 2527	┩ 2529
5x/Dx	┪ 252A	┭ 252D	┮ 252E	┱ 2531	┲ 2532	┵ 2535	┶ 2536	┹ 2539	┺ 253A	┽ 253D	┾ 253E	╀ 2540	╁ 2541	╃ 2543	╄ 2544	╅ 2545
6x/przykł	╆ 2546	╇ 2547	╈ 2548	╉ 2549	╊ 254A
7x/Fx

Zestaw znaków 0x2A/0xAA (wiersz numer 10, Hiragana)

Ten wiersz zawiera Hiragana do użytku w języku japońskim .

Porównaj rząd 10 ze schematu KS X 1001 , który wykorzystuje ten sam układ. Porównaj i porównaj wiersz 4 JIS X 0208 , który również wykorzystuje ten sam układ, ale w innym rzędzie.

KPS 9566 (z prefiksem 0x2A/0xAA)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		3041 _	3042 _	3043 _	3044 _	3045 _	3046 _	3047 _	3048 _	3049 _	304A _	304B _	304C _	304D _	304E _	304F _
3x/Bx	3050 _	3051 _	3052 _	3053 _	3054 _	3055 _	3056 _	3057 _	3058 _	3059 _	305A _	305B _	ぜ 305C	305D _	305E _	305F _
4x/Cx	3060 _	3061 _	3062 _	3063 _	3064 _	3065 _	3066 _	3067 _	3068 _	3069 _	306A _	306B _	306C _	306D _	306E _	306F _
5x/Dx	3070 _	3071 _	3072 _	3073 _	3074 _	3075 _	3076 _	3077 _	3078 _	3079 _	307A _	ほ 307B	307C _	307D _	307E _	307F _
6x/przykł	3080 _	3081 _	3082 zł	3083 _	3084 zł	3085 _	3086 _	3087 _	3088 _	3089 _	308A _	308B _	308C _	308D _	308E _	308F _
7x/Fx	3090 _	3091 _	3092 zł	3093 _

Zestaw znaków 0x2B/0xAB (wiersz nr 11, Katakana)

Ten wiersz zawiera katakany do użytku w języku japońskim . Jednak japoński znak długiej samogłoski , który jest używany w tekście katakana i zawarty w wierszu 1 JIS X 0208 , nie jest uwzględniony (podobnie jak w przypadku GB 2312 i KS X 1001), chociaż jest włączony przez KPS 9566-2011 poza płaszczyzna główna, na 0xEA48 .

Porównaj rząd 11 ze schematu KS X 1001 , który wykorzystuje ten sam układ. Porównaj i porównaj wiersz 5 JIS X 0208 , który również wykorzystuje ten sam układ, ale w innym rzędzie.

KPS 9566 (z prefiksem 0x2B/0xAB)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		30A1 _	30A2 _	30A3 _	30A4 _	30A5 _	30A6 _	30A7 _	30A8 _	30A9 _	30AA _	30AB _	30 AC	30 AD	30 AE	30 AF
3x/Bx	30B0 _	30B1 _	30B2 _	30B3 _	ゴ 30B4	30B5 _	30B6 _	30B7 _	30B8 _	30B9 _	30BA _	セ 30 BB	30 pne	30BD _	30 BE	30 BF
4x/Cx	ダ 30C0	30C1 _	30C2 _	ッ 30C3	ツ 30C4	ヅ 30C5	テ 30C6	デ 30C7	ト 30C8	ド 30C9	30CA _	ニ 30CB	ヌ 30CC	ネ 30CD	ノ 30CE	ハ 30CF
5x/Dx	バ 30D0	パ 30D1	ヒ 30D2	ビ 30D3	ピ 30D4	30D5 _	ブ 30D6	プ 30D7	ヘ 30D8	ベ 30D9	ペ 30DA	ホ 30DB	ボ 30DC	30DD _	マ 30 DE	ミ 30DF
6x/przykł	ム 30E0	メ 30E1	モ 30E2	ャ 30E3	ヤ 30E4	30E5 _	ユ 30E6	ョ 30E7	30E8 _	ラ 30E9	30 EA	30EB _	レ 30EC	ロ 30 ED	30EE _	ワ 30EF
7x/Fx	ヰ 30F0	ヱ 30F1	ヲ 30F2	30F3 _	ヴ 30F4	ヵ 30F5	ヶ 30F6

Zestaw znaków 0x2C/0xAC (wiersz numer 12, różne symbole i strzałki)

W celu odwzorowania tego wiersza na Unicode, pogrubiona strzałka skierowana w prawo została ujednolicona z pogrubioną strzałką skierowaną w prawo z Zapf Dingbats (U + 27A1), chociaż wcześniejsze tabele (w których brakowało odwzorowań dla innych pogrubionych strzałek) zamiast tego ujednolicono ją z U + 279E, nieco inna postać Zapf Dingbats. Ponieważ odpowiednie strzałki w innych kierunkach nie zostały uwzględnione w Dingbatach bloku, dodatkowe strzałki zostały zakodowane między U + 2B05 i U + 2B0D w celu zapewnienia zgodności z KPS 9566. Zostały one włączone do wykresów kodów Unicode przy użyciu glifów referencyjnych zaproponowanych przez organ krajowy Korei Północnej, podczas gdy U + 27A1 zachował swój glif referencyjny oparty na Zapf Dingbaty. Te strzałki (od U+2B05 do U+2B07 oraz U+27A1) zostały wybrane w Unicode 6.0 jako odwzorowania niektórych znaków strzałek w zestawach emotikonów komórkowych. Następnie, podczas dodawania Wingdings 3 repertuaru w Unicode 7.0, dokonano przeglądu pokrycia Unicode znaków strzałek, w wyniku czego dodano dodatkową strzałkę w prawo w U + 2B95 z zamiarem zharmonizowania ze znakami od U + 2B05 do U + 2B0D (w prezentacji tekstowej), od czasu zmiany odniesienia glif postaci Zapf Dingbats nie został uznany za odpowiedni.

We wcześniejszych wydaniach KPS 9566, takich jak wydanie z 1997 r., Ten wiersz zawierał zarówno prosty znak pocztowy w stylu japońskim (〒), jak i wersję w trójkącie skierowanym w dół, który został zaproponowany przez organ krajowy Korei Północnej w celu dodania do Unicode obok innych brakujących znaków KPS 9566. Odpowiedź Koreańczyka z południa przedstawiciel zażądał między innymi dowodów na używanie tego symbolu w Korei Północnej, zauważając, że japoński znak pocztowy nie jest używany w Korei Południowej, w której w podobnym celu używa się 우 (tj. ㉾) w kółku, oraz pytając, czy japoński znak pocztowy w stylu był używany w Korei Północnej. Odbyło się kolejne spotkanie w celu omówienia tej propozycji, w którym uczestniczyli przedstawiciele WG2 z Korei Północnej i Południowej; w raporcie ze spotkania zauważono, że organ północnokoreański postanowił przejrzeć postać przed dalszymi dyskusjami i dlatego nie zarekomendował jej do rozważenia przez WG2 jako całość. Trójkąt znaku pocztowego został następnie usunięty z KPS 9566 w 2003 r., Pozostawiając jedynie niezamknięty znak pocztowy.

Trójkąt znaku pocztowego został ostatecznie dodany do Unicode w wersji 13.0, zarówno w celu zapewnienia zgodności ze starszym znakiem KPS 9566-97, jak i po zidentyfikowaniu znaku jako symbolu używanego do certyfikacji urządzeń elektrycznych w Japonii ( jako poprzednik do diamentu PSE ).

Niektóre znaki KPS 9566 w tym rzędzie, a mianowicie dwie formy godła Partii Robotniczej Korei , nożyczki skierowane w innym kierunku niż w bloku Dingbats oraz zakreślony manikiuł skierowany do góry , pozostają odwzorowane na Obszar użytku prywatnego .

Białe strzałki na północnym wschodzie i północnym zachodzie wykorzystywały nieprawidłowo zamienione mapowania Unicode w wydaniu z 2003 roku. Zostało to poprawione w mapowaniach edycji z 2011 roku.

KPS 9566 (z prefiksem 0x2C/0xAC)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór				⍟235F _	☀ 2600	☂ 2602	☔︎ 2614	☁ 2601	❄2744 _	⚡︎ 26A1	⚠ 26A0	№2116 _	→ 2192	← 2190	↑ 2191	↓ 2193
3x/Bx	↗ 2197	↖ 2196	↘ 2198	↙ 2199	↔ 2194	↕ 2195	⇨ 21E8	⇦ 21E6	⇧ 21E7	⇩ 21E9	⬀ 2B00	⬁ 2B01	⬂ 2B02	⬃ 2B03	⬄ 2B04	⇳ 21F3
4x/Cx	➡ 27A1	⬅ 2B05	⬆2B06 _	⬇ 2B07	⬈ 2B08	⬉ 2B09	⬊ 2B0A	⬋ 2B0B	⬌ 2B0C	⬍ 2B0D	♣ 2663	♥ 2665	♠ 2660	♦ 2666	3012 _	⮗ 2B97
5x/Dx	☏ 260F	☎ 260E	⏎23CE _	☞ 261E			☕︎ 2615	㉼ 327C	㉽ 327D	321D _	㈞ 321E	㏇ 33C7	㋏32CF _	㉐ 3250	℡2121 _	℻ 213B
6x/przykł	㍺ 337A	® 00AE
7x/Fx
odwzorowany na obszar użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x2E/0xAE (numer wiersza 14, podzbiór Latin-1)

Znaki w tym zestawie nie były obecne w wersji zestawu znaków z 1997 r., Ale zostały dodane w wersji z 2003 r. Stanowią podzbiór Latin-1 Supplement (odpowiednik górnej połowy zestawu znaków ISO 8859-1 (Latin-1)). Obejmuje to akcentowane litery rzymskie i symbole. Niektóre symbole, które zostały już uwzględnione, zostały pominięte, podczas gdy inne są powielane jako odpowiedniki o połowie szerokości do wcześniejszych form o pełnej szerokości : na przykład znak not (¬, U+00AC) jest reprezentowane jako 0xAEAC, podczas gdy jego postać o pełnej szerokości (￢, U+FFE2) jest reprezentowana jako 0xA2D1 (w rzędzie 2 ).

Ten wiersz został pominięty w mapowaniu dla wydania normy z 2011 roku, co wskazuje, że mógł zostać usunięty w pewnym momencie po wydaniu z 2003 roku. Zamiast tego znak jena o połowie szerokości jest zakodowany w 0xE98E w wydaniu z 2011 roku.

Wymagana przestrzeń wykraczałaby poza zakres 94 znaków, kolidując z obszarem używanym dla rozszerzonych sylab chosŏn'gŭl, gdy używane jest kodowanie w stylu UHC (w szczególności z sylabą 쁲) i jest pomijane. Chociaż y z trema również wykracza poza zakres 94 znaków, a bajt końcowy 0xFF jest poza tym nieużywany, kod 0xAEFF jest na niego mapowany w KPS 9566-2003.

KPS 9566-2003 (z prefiksem 0x2E/0xAE)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
2x/Topór		¡ 00A1	¢ 00A2	£ 00 A3	¤ 00A4	¥ 00A5	¦ 00A6			© 00A9	ª 00AA	« 00AB	¬ 00 AC	NIEŚMIAŁY		¯ 00AF
3x/Bx						μ 00B5			¸ 00B8		º 00BA	» 00BB				¿ 00BF
4x/Cx	00C0 _	00C1 _	00C2 _	00C3 _	Ę 00C4	Å 00C5	Ć 00C6	Ç 00C7	È 00C8	É 00C9	Ę 00CA	Ë 00CB	Ě 00CC	Í 00CD	Î 00CE	Ï 00CF
5x/Dx	Ð 00D0	Ń 00D1	Ò 00D2	O 00D3	Ô 00D4	00D5 _	00D6 _		Ø 00D8	00D9 _	Ú 00DA	Ű 00DB	Ü 00 DC	Ý 00DD	Þ 00 DE	ß 00DF
6x/przykł	à 00E0	á 00E1	00E2 _	ã 00E3	00E4 _	00E5 _	ć 00E6	ç 00E7	00E8 _	00E9 _	ę 00EA	ë 00EB	ì 00EC	í 00ED	î 00EE	ï 00EF
7x/Fx	ð 00F0	ñ 00F1	00F2 _	00F3 _	ô 00F4	õ 00F5	00F6 _		ř 00F8	ù 00F9	ú 00FA	û 00FB	ü 00FC	ý 00FD	þ 00FE	ÿ 00FF

Gotowe zestawy Chosŏn'gŭl (rzędy od 16 do 44)

Wstępnie skomponowane klastry sylab Chosŏn'gŭl mają przydzielane punkty kodowe w ciągłym posortowanym bloku między punktami kodowymi 16-01 i 44-47 włącznie. Nie wszystkie możliwe klastry mają przydzielone punkty kodowe. Porównaj różne zamówienia i dostępność w KS X 1001 .

Zakodowana postać udokumentowana dla KPS 9566-2003 koduje płaszczyznę KPS 9566 na GR (0xA1-0xFE) i dodatkowo koduje pozostałe klastry sylab przy użyciu bajtów wiodących w zakresie 0x80-0xC2 i bajtów końcowych w zakresach 0x41-0x5A, 0x61-0x7A i 0x81-0xFE (gdzie co najwyżej jeden bajt mieści się w zakresie 0xA1-0xFE), podobnie do Unified Hangul Code , ale z pominiętymi klastrami i kolejnością sortowania KPS 9566, a nie KS X 1001 .

16 rząd 걸 걹 걺 검 겁 것 겅 겆 겉 겊 겋 겄 겨 격 견 겯 결 겸 겹 겻 경 곁 겪 겼 고 곡 곤 곧 골 곪 곬 곰 곱 곳 공 곶 곺 교 굔 굘 굡 굣 구 국 군 굳 굴 굵 굶 굻 굼 굽 굿 궁 궂 규 균 귤 귬 귱 그 극 근 귿
rząd 17 갰 걔 걘 걜 게 겍 겐 겔 겜 겝 겟 겡 겠 계 곈 곌 곕 곗 괴 괵 괸 괼 굄 굅 굇 굉 굈 귀 귁 귄 귈 귐 귑 귓 긔 과 곽 관 괃 괄 괆 괌 괍 괏 광 괐 궈 궉 권 궐 궘 궝 궜 괘 괙 괜 괠 괩 괭 괬 궤 궥 궷 나 낙
18 rząd 넓 넘 넙 넛 넝 넢 넣 넊 넜 녀 녁 년 녈 념 녑 녓 녕 녘 녔 노 녹 논 놀 놂 놈 놉 놋 농 높 놓 뇨 뇩 뇬 뇰 뇸 뇹 뇻 뇽 누 눅 눈 눋 눌 눔 눕 눗 눙 눞 뉴 뉵 뉸 뉼 늄 늅 늉 느 늑 는 늘 늙 늚 늠 늡 늣 능
Rząd 19: 늦 늪 니 닉 닌 닐 닒 님 닙 닛 닝 닢 내 낵 낸 낼 냄 냅 냇 네 넥 넨 넬 넴 넵 넷 넹 넸 녜 녠 뇌 뇐 뇔 뇜 뇝 뇟 뉘 뉜 뉠 뉨 뉩 뉭 늬 늰 늴 늼 닁 놔 놘 놜 놧 놨 눠 눨 눳 눴 놰 눼 다 닥 단 닫 달 닭 닮 닯 닲 닳 담 답 닷 당 닺 닻 닾 닿 닦 닸 댜 더 덕 던 덛 덜 덞 덟 덤 덥 덧 덩 덫
Rząd 20: 덮 덯 덖 덨 뎌 뎐 뎔 뎡 뎠 도 독 돈 돋 돌 돎 돐 돔 돕 돗 동 돛 돝 됴 두 둑 둔 둘 둠 둡 둣 둥 듀 듄 듈 듐 듕 드 득 든 듣 들 듥 듦 듧 듬 듭 듯 등 디 딕 딘 딛 딜 딤 딥 딧 딩 딪 딮 딨 대 댁 댄 댈 댐 댑 댓 댕 댔 댸 데 덱 덴 덷 델 뎀 뎁 뎃 뎅 뎄 뎨 뎬 되 된 될 됨 됩 됫 됭 됬 뒤 뒥 뒨 뒬
Rząd 21: 뒴 뒵 뒷 뒹 듸 듼 딀 딉 딍 돠 돤 돨 둬 둰 둴 둼 둿 뒀 돼 됀 됄 됐 뒈 뒝 라 락 란 랄 람 랍 랏 랑 랒 랖 랗 랐 랴 략 랸 랼 럄 럅 럇 량 러 럭 런 럴 럼 럽 럿 렁 렆 렇 렀 려 력 련 렬 렴 렵 렷 령 렸 로 록 론 롤 롬 롭 롯 롱 롶 료 룐 룔 룜 룝 룟 룡 루 룩 룬 룰 룸 룹 룻 룽 류 륙 륜 률 륨 륩
Rząd 22: 륫 륭 르 륵 른 를 름 릅 릇 릉 릊 릍 릎 리 릭 린 릴 림 립 릿 링 맆 래 랙 랜 랠 램 랩 랫 랭 랬 럐 레 렉 렌 렐 렘 렙 렛 렝 렜 례 롄 롈 롑 롓 뢰 뢴 뢸 룀 룁 룃 룅 룄 뤼 뤽 륀 륄 륌 륏 륑 릐 릔 릘 릠 롸 롼 뢉 뢍 뤄 뤘 뢔 뢨 뤠 마 막 만 많 맏 말 맑 맒 맘 맙 맛 망 맞 맟 맡 맣 먀 먁 먄 먈
Rząd 23: 먐 먕 머 먹 먼 멀 멁 멂 멈 멉 멋 멍 멎 멓 멌 며 멱 면 멸 몀 몁 몃 명 몇 몄 모 목 몫 몬 몯 몰 몲 몸 몹 못 몽 뫃 묘 묜 묠 묩 묫 무 묵 문 묻 물 묽 묾 뭄 뭅 뭇 뭉 뭍 뭏 묶 뮤 뮥 뮨 뮬 뮴 뮷 뮹 므 믄 믈 믐 믑 믓 믕 미 믹 민 믿 밀 밂 밈 밉 밋 밍 및 밑 밌 매 맥 맨 맬 맴 맵 맷 맹 맺 맸 먜
Rząd 24: 메 멕 멘 멜 멤 멥 멧 멩 멨 몌 몐 뫼 묀 묄 묌 묍 묏 묑 뮈 뮌 뮐 믜 믠 믬 뫄 뫈 뫙 뫘 뭐 뭔 뭘 뭠 뭡 뭣 뭤 뫠 뭬 바 박 밗 반 받 발 밝 밞 밟 밤 밥 밧 방 밭 밖 뱌 뱍 뱐 뱜 뱝 버 벅 번 벋 벌 벍 벎 범 법 벗 벙 벚 벜 벘 벼 벽 변 별 볌 볍 볏 병 볓 볕 볐 보 복 본 볼 봄 봅 봇 봉 봏 볶 뵤 뵨
Rząd 25. 비 빅 빈 빌 빎 빔 빕 빗 빙 빚 빛 배 백 밴 밷 밸 뱀 뱁 뱃 뱅 뱉 뱄 뱨 베 벡 벤 벧 벨 벰 벱 벳 벵 벴 볘 볜 뵈 뵉 뵌 뵐 뵘 뵙 뵜 뷔 뷕 뷘 뷜 뷩 븨 븬 븰 븽 봐 봔 봡 봣 봤 붜 붤 붯 붴 붰 봬 봰 뵀 붸
Rząd 26: 사 삭 삯 산 삳 살 삵 삶 삼 삽 삿 상 샅 샀 샤 샥 샨 샬 샴 샵 샷 샹 서 석 섟 선 섣 설 섦 섧 섬 섭 섯 성 섶 섞 섰 셔 셕 션 셜 셤 셥 셧 셩 셨 소 속 손 솓 솔 솖 솜 솝 솟 송 솥 솎 쇼 쇽 숀 숄 숌 숍 숏 숑 수 숙 순 숟 술 숨 숩 숫 숭 숯 숱 숲 슈 슉 슌 슐 슘 슙 슛 슝 스 슥 슨 슬 슭 슲 슳 슴
Rząd 27: 습 슷 승 시 식 신 싣 실 싫 심 십 싯 싱 싶 새 색 샌 샐 샘 샙 샛 생 샜 섀 섄 섈 섐 섕 세 섹 센 셀 셈 셉 셋 셍 셑 셒 셌 셰 셴 셸 솅 쇠 쇡 쇤 쇨 쇰 쇱 쇳 쇵 쇴 쉬 쉭 쉰 쉴 쉼 쉽 쉿 슁 싀 싄 솨 솩 솬 솰 솻 솽 숴 쉈 쇄 쇈 쇌 쇔 쇗 쇘 쉐 쉑 쉔 쉘 쉠 쉡 쉥 자 작 잔 잖 잗 잘 잚 잠 잡 잣 장
Rząd 28. 졌 조 족 존 졸 졺 좀 좁 좃 종 좆 좇 좋 죠 죡 죤 죨 죰 죵 주 죽 준 줄 줅 줆 줌 줍 줏 중 쥬 쥰 쥴 쥼 즁 즈 즉 즌 즐 즘 즙 즛 증 지 직 진 짇 질 짊 짐 집 짓 징 짖 짙 짚 재 잭 잰 잴 잼 잽 잿 쟁 쟀 쟤
Rząd 29: 쟨 쟬 제 젝 젠 젤 젬 젭 젯 젱 젶 젰 졔 졘 졜 죄 죈 죌 죔 죕 죗 죙 죘 쥐 쥑 쥔 쥗 쥘 쥠 쥡 쥣 즤 좌 좍 좐 좔 좝 좟 좡 줘 줬 좨 좽 좼 줴 줸 줼 쥄 쥅 쥈 차 착 찬 찮 찰 참 찹 찻 창 찾 찼 챠 챤 챦 챨 챰 챱 챵 처 척 첨 첩 첫 청 첬 쳐 쳑 쳔 쳘 쳤 초 촉 촌 촐 촘 촙 촛 총 쵸 쵼 춀 춈
Rząd 30: 추 축 춘 춛 출 춤 춥 춧 충 츄 츈 츌 츔 츙 츠 측 츤 츨 츰 츱 츳 층 치 칙 친 칟 칠 칡 침 칩 칫 칭 채 책 챈 챌 챔 챕 챗 챙 챘 챼 체 첵 첸 첼 쳄 춰 췃 췄 쵀 쵄 췌 췐 카 칵 칸 칼 캄 캅 캇 캉 캎 캈 캬 캭 캰
Rząd 31: 캼 캽 컁 커 컥 컨 컫 컬 컴 컵 컷 컹 컽 컾 컸 켜 켠 켤 켬 켭 켯 켱 켰 코 콕 콘 콜 콤 콥 콧 콩 쿄 쿠 쿡 쿤 쿨 쿰 쿱 쿵 큐 큔 큘 큠 크 큭 큰 클 큼 큽 킁 키 킥 킨 킬 킴 킵 킷 킹 킾 캐 캑 캔 캘 캠 캡 캣 캥 캪 캤 컈 케 켁 켄 켈 켐 켑 켓 켕 켸 쾨 쾰 퀴 퀵 퀸 퀼 큄 큅 큇 큉 킈 콰 콱 콴
Rząd 32. 터 턱 턴 털 턺 텀 텁 텃 텅 텄 텨 텬 텼 토 톡 톤 톨 톰 톱 톳 통 톺 툐 투 툭 툰 툴 툼 툽 툿 퉁 튜 튠 튤 튬 튱 트 특 튼 튿 틀 틂 틈 틉 틋 틍 티 틱 탤 탬 탭 탯 탱 탶 탰 턔
Wiersz 33. 퉈 퉜 퇘 퉤 퉨 퉸 파 팍 판 팔 팖 팜 팝 팟 팡 팥 팎 팠 퍄 퍅 퍼 퍽 펀 펄 펌 펍 펏 펑 펐 펴 펵 편 펼 폄 폅 폇 평 폈 포 폭 폰 폴 폼 폽 폿 퐁 표 푠 푤 푭 푯 푸 푹 푼 푿 풀 풂 품 풉 풋 풍 퓨 퓬 퓰 퓸
Wiersz 34. 펜 펠 펨 펩 펫 펭 펲 폐 폔 폘 폡 폣 푀 푄 퓌 퓐 퓔 퓜 퓟 픠 픤 퐈 퐝 풔 풩 하 학 한 할 핥 함 합 핫 항 햐 향 허 헉 헌 헐 헒 헕 헗 험 헙 헛 헝 혀 혁 현 혈 혐 협 혓 형 혔 호 혹 혼 혿 홀 홅 홈 홉 홋
Wiersz 35. 흙 흝 흠 흡 흣 흥 히 힉 힌 힐 힘 힙 힛 힝 해 핵 핸 핼 햄 햅 햇 행 했 햬 헤 헥 헨 헬 헴 헵 헷 헸 혜 혠 혤 혭 회 획 횐 횔 횝 횟 횡 휘 휙 휜 휠 휨 휩 휫 휭 희 흰 흴 흼 흽 힁 화 확 환 활 홤 홥
Wiersz 36: 홧 황 훠 훡 훤 훨 훰 훵 홰 홱 홴 횃 횅 횄 훼 훽 휀 휄 휑 까 깍 깐 깓 깔 깖 깜 깝 깟 깡 깥 깎 깠 꺄 꺅 꺈 꺌 꺼 꺽 껀 껄 껌 껍 껏 껑 꺾 껐 껴 껸 껼 꼇 꼍 꼈 꼬 꼭 꼰 꼱 꼲 꼴 꼼 꼽 꼿 꽁 꽂 꽃 꾜 꾸 꾹 꿇 꿈 꿉 꿋 꿍 꿎 뀨 끄 끅 끈 끊 끌 끎 끓 끔 끕 끗 끙 끝 끼 끽 낀 낄 낌
Rząd 37: 낍 낏 낑 깨 깩 깬 깰 깸 깹 깻 깽 깼 꺠 께 껙 껜 껠 껨 껩 껫 껭 껬 꼐 꾀 꾁 꾄 꾈 꾐 꾑 꾕 뀌 뀐 뀔 뀜 뀝 뀡 꽈 꽉 꽌 꽐 꽛 꽝 꽜 꿔 꿘 꿜 꿥 꿧 꿩 꿨 꽤 꽥 꽨 꽬 꽹 꿰 꿱 꿴 꿸 뀀 뀁 뀅 뀄 따 딱 딴 딸 딿 땀 땁 땃 땅 땋 딲 땄 땨 땰 떠 떡 떤 떨 떪 떫 떰 떱 떳 떵 떻 떴 뗘 뗬 또 똑 똔
Rząd 38. 띱 띳 띵 때 땍 땐 땔 땜 땝 땟 땡 땠 떼 떽 뗀 뗄 뗌 뗍 뗏 뗑 뗐 뙤 뙨 뛰 뛴 뛸 뜀 뜁 뜅 띄 띅 띈 띌 띔 띕 띙 똬 똰 똴 뚸 뛌 뙈 뙉 뛔 빠 빡 빤 빨 빪 빰 빱 빳 빵 빻 빴 뺘 뺙 뺜 뺨 뻐 뻑 뻔 뻗 뻘 뻠
Rząd 39. 쁑 쁘 쁜 쁠 쁨 쁩 삐 삑 삔 삘 삠 삡 삣 삥 빼 빽 뺀 뺄 뺌 뺍 뺏 뺑 뺐 뺴 뻬 뻭 뻰 뻴 뻼 뼁 뾔 쀠 쁴 뽜 뿨 싸 싹 싻 싼 쌀 쌈 쌉 쌋 쌍 쌓 쌌 쌰 쌴 쌸 썅 써 썩 썬 썰 썲 썸 썹 썻 썽 썪 썼 쎠 쏘 쏙 쏜
Rząd 40: 쏟 쏠 쏢 쏨 쏩 쏫 쏭 쑈 쑌 쑐 쑘 쑝 쑤 쑥 쑨 쑬 쑴 쑵 쑹 쓔 쓘 쓧 쓩 쓰 쓱 쓴 쓸 쓺 쓿 씀 씁 씅 씨 씩 씬 씯 씰 씸 씹 씻 씽 씼 쌔 쌕 쌘 쌜 쌤 쌥 쌧 쌩 쌨 썌 쎄 쎅 쎈 쎌 쎔 쎕 쎙 쎼 쏀 쐬 쐭 쐰 쐴 쐼 쐽 쑀 쒸 쒼 씌 씐 씔 씜 쏴 쏵 쏸 쏼 쐇 쐉 쐈 쒀 쒔 쐐 쐑 쐤 쒜 쒠 쒭 짜 짝 짠 짢 짤
Rząd 41: 짧 짬 짭 짯 짱 짰 쨔 쨘 쨤 쨩 쩌 쩍 쩐 쩔 쩗 쩜 쩝 쩟 쩡 쪼 쪽 쫀 쫄 쫌 쫍 쫏 쫑 쫒 쫓 쫗 쬬 쬰 쬼 쭁 쭈 쭉 쭌 쭐 쭘 쭙 쭛 쭝 쮸 쯀 쯔 쯕 쯘 쯜 쯤 쯧 쯩 쯪 찌 찍 찐 찔 찜 찝 찟 찡 찢 찦 찧 째 짹 짼 쨀 쨈 쨉 쨋 쨍 쨌 쨰 쨴 쩨 쩩 쩬 쩰 쩸 쩹 쩽 쪠 쬐 쬔 쬘 쬠 쬡 쬤 쮜 쯰 쯴
Rząd 42: 쫘 쫙 쫜 쫠 쫭 쫬 쭤 쭹 쭸 쫴 쬈 쮀 아 악 안 앉 않 알 앍 앎 앒 앓 암 압 앗 앙 앝 앞 앟 았 야 약 얀 얃 얄 얇 얌 얍 얏 양 얕 얗 얐 어 억 언 얹 얻 얼 얽 얾 엄 업 없 엇 엉 엊 엌 엎 엏 었 여 역 연 엳 열 엶 엷 염 엽 엾 엿 영 옅 옆 옇 엮 였 오 옥 온 올 옭 옮 옰 옳 옴 옵 옷 옹 옻 옾 요 욕
Wiersz 43. 을 읅 읊 음 읍 읏 응 읒 읓 읔 읕 읖 읗 이 익 인 일 읽 읾 잃 임 입 잇 잉 잊 잎 있 애 액 앤 앨 앰 앱 앳 앵 앴 얘 얜 얠 얩 에 엑 엔 엘 엠 엡 엣 엥 엤 예 옌 옐 옘 옙 옛 옝 옜 외 왹 왼 욀 욈 욉 욋 욍
Wiersz 44. 웟 웡 웠 왜 왝 왠 왬 왯 왱 웨 웩 웬 웰 웸 웹 웻 웽 윁

Zestawy Hanja (rzędy od 45 do 94)

Hanja pod adresem 69-09 (0xE5A9) jest mapowana na U + 676E 杮 we wszystkich udokumentowanych tabelach; znaki są jednak uporządkowane zgodnie z ich odczytami, z których wynika, że zamiast tego ma to być U + 67FF 柿 .

Rozszerzone zestawy bezsylabowe, inne niż hanja w KPS 9566:2011

Poniżej znajdują się wykresy dla bezsylabowej, nie-hanja sekcji KPS 9566-2011 poza główną płaszczyzną.

Zestaw rozszerzeń 0xE0 (symbole i piktogramy)

KPS 9566-2011 (z prefiksem 0xE0)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x						◑ 25D1					⊘ 2298	✉ 2709	☛261B _	☞ 261E	✌270C _	
5x	✍ 270D	✏ 270F	✎ 270E	✐ 2710		✓ 2713	✔ 2714	⊡ 22A1	⎔ 2394		
6x		⊙ 2299
7x			⚓︎ 2693							☼ 263C	
8x					◉ 25C9		
9x			✪ 272A		✯ 272F	✬ 272C		✫ 272B		✮ 272E	✭ 272D	✰ 2730		✩ 2729
Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestawy rozszerzeń 0xE1, 0xE2, 0xE3 (nieznane)

Te zestawy rozszerzeń są mapowane na obszar użytku prywatnego. Ich cel nie jest udokumentowany.

KPS 9566-2011 (z prefiksem 0xE1)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x																
5x											
6x																
7x											
8x																
9x																
Topór		(Część płaszczyzny głównej.)
Nie w Unicode, zmapowane do obszaru użytku prywatnego

KPS 9566-2011 (z prefiksem 0xE2)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x																
5x										
6x
7x
8x
9x
Nie w Unicode, zmapowane do obszaru użytku prywatnego

KPS 9566-2011 (z prefiksem 0xE3)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x																
5x											
6x														
7x
8x							
9x
Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE4 (strzałki)

Ten zestaw zawiera kilka, głównie strzałek w prawo, mapujących do bloku Unicode Dingbats i gdzie indziej.

KPS 9566-2011 (z prefiksem 0xE4)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x		➔ 2794	➘ 2798	➙ 2799	➚ 279A	➛ 279B	➜ 279C	➝ 279D	➟ 279F	➠ 27A0	➢ 27A2	➣ 27A3	➤ 27A4	➥ 27A5	➦ 27A6	➧ 27A7
5x	➨ 27A8	➩ 27A9	➪ 27AA	➫ 27AB	➬ 27 AC	➭ 27 n.e	➮ 27AE	➯ 27 AF	➱ 27B1	➲ 27B2	➳ 27B3
6x		➴ 27B4	➵ 27B5	➶ 27B6	➷ 27B7	➸ 27B8	➹ 27B9	➺ 27BA	➻ 27BB	➾ 27BE	➼ 27 pne	➽ 27BD	
7x
8x		⟷ 27F7	⇌ 21CC					⥫ 296B		⥬ 296C	⇐ 21D0		⟹ 27F9
9x																
Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE5 (rzymskie indeksy górne i dolne)

Ten wiersz zawiera kilka rzymskich indeksów górnych pisanych małymi literami z bajtami końcowymi odpowiadającymi ich odpowiednikom ASCII pisanym dużymi literami oraz rzymskimi indeksami dolnymi pisanymi małymi literami z bajtami końcowymi odpowiadającymi ich odpowiednikom ASCII pisanym małymi literami.

KPS 9566-2011 (z prefiksem 0xE5)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x		ᵃ 1D43	ᵇ 1D47	ᶜ 1D9C	ᵈ 1D48	ᵉ 1D49	ᶠ 1DA0	ᵍ 1D4D				ᵏ 1D4F		ᵐ 1K50	ⁿ 207F	ᵒ 1D52
5x	ᵖ 1D56				ᵗ 1D57	ᵘ 1D58	ᵛ 1D5B				
6x		ₐ 2090				2091 jenów				ᵢ 1D62	ⱼ 2C7C					ₒ 2092
7x			ᵣ 1D63			ᵤ 1D64	ᵥ 1D65		ₓ 2093		
8x							
9x							
Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE6 (grecki i indeksy górne i dolne symboli)

KPS 9566-2011 (z prefiksem 0xE6)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x		ᵅ 1D45	ᵝ 1D5D	ᵞ 1D5E	ᵟ 1D5F	ᵋ 1D4B			ᶿ 1DBF					ᶹ 1DB9		
5x						ᵠ 1K60	ᵡ 1D61		
6x			ᵦ 1D66	ᵧ 1D67												
7x		ᵨ 1D68				ᵩ 1D69	ᵪ 1D6A		
8x		⁺ 207A	⁻ 207b			
9x		₊ 208A	₋ 208B			
Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE7 (dalsze znaczniki listy)

KPS 9566-2011 (z prefiksem 0xE7)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x		㉛ 325B	㉜ 325C	㉝ 325D	㉞ 325E	㉟325F _	㊱ 32B1	㊲ 32B2	㊳ 32B3	㊴ 32B4	㊵ 32B5	㊶ 32B6	㊷ 32B7	㊸ 32B8	㊹ 32B9	㊺32BA _
5x	㊻ 32BB	㊼ 32 pne	㊽ 32BD	㊾ 32 p.n.e	㊿ 32BF						
6x																
7x											
8x									
9x
Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE8

KPS 9566-2011 (z prefiksem 0xE8)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x															
5x
6x															
7x
8x					︰ FE30
9x
Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE9 (dodatkowe symbole i interpunkcja)

Ten zestaw zawiera symbole kolorów kart do gry, różne różne symbole i odpowiedniki o połowie szerokości dla niektórych symboli walut w 8 rzędzie . Uwzględniono również znak Kelvina, który w wierszu 8 został zastąpiony znakiem euro .

KPS 9566-2011 (z prefiksem 0xE9)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x		∅ 2205	⊗ 2297		〓 3013			♧ 2667	♡ 2661	♤ 2664	♢ 2662		◯ 25EF	⦾ 29BE		
5x
6x				
7x
8x									K 212A	₩ 20A9				₤ 20A4	¥ 00A5
9x
Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xEA (japońska interpunkcja i dodatkowe jamo)

Ten zestaw zawiera kilka znaków interpunkcyjnych używanych w Japonii oraz niektóre znaki z bloku Unicode zgodności Hangul Jamo , które nie są jeszcze uwzględnione w wierszu 4 . Obejmuje to niektóre znaki jamo obecne w KS X 1001 , ale wcześniej nieobecne w KPS 9566.

KPS 9566-2011 (z prefiksem 0xEA)
	0	1	2	3	4	5	6	7	8	9	A	B	C	D	mi	F
4x		ヽ 30FD	ヾ 30FE	309D _	309E _	々3005 _	〆3006 _	〇3007 _	ー 30FC
5x			
6x		ㅥ 3165	ㅭ 316D	ㅱ 3171	ㅲ 3172	ㅳ 3173	ㅴ 3174	ㅵ 3175	ㅶ 3176	ㅷ 3177	ㅸ 3178	ㅹ 3179	ㅺ 317A	ㅻ 317B	ㅽ 317D	ㅾ 317E
7x	ㆀ 3180	ㆄ 3184	ㆅ 3185	ㆇ 3187	ㆈ 3188	ㆉ 3189	ㆊ 318A	ㆋ 318B	ㆌ 318C	ᆞ 119E	ㆎ 318E
8x
9x
Nie w Unicode, zmapowane do obszaru użytku prywatnego

przypisy

Linki zewnętrzne

Tabela kodów KPS 9566-97 z rejestru ISO-IR
Mapowania trójstronne między EUC-KP (KPS 9566), EUC-KR i Unicode od 2000 r. Zarchiwizowane 03.04.2021 w Wayback Machine (plik w EUC-KR; zwróć uwagę na mapowanie błędów typograficznych 0xA1BA na U + 3090 ゐ zamiast U+309C ゜ )
Mapowanie KPS 9566-2003 do Unicode
Tabela kodów KPS 9566-2011 i mapowanie poddane inżynierii wstecznej z systemu operacyjnego Red Star

Kodowanie znaków
Wczesna telekomunikacja	Kod telegraficzny Igła Morse'a Niełaciński Wabun/Kana chiński cyrylica koreański Baudota i Murraya Fieldata ASCII ISO/IEC 646 BCDIC Teleteks i Wideoteks / Teletekst T.51/ISO/IEC 6937 ITU T.61 ITU T.101 Telegazeta systemu światowego tło zestawy Transkoduj
ISO/IEC8859	Zatwierdzone części -1 (Europa Zachodnia) -2 (Europa Środkowa) -3 (maltański/esperanto) -4 (Europa Północna) -5 (cyrylica) -6 (arabski) -7 (grecki) -8 (hebr.) -9 (turecki) -10 (nordycki) -11 (tajski) -13 (Bałtyk) -14 (celtycki) -15 (Nowa Europa Zachodnia) -16 (rumuński) Opuszczone części -12 (Dewanagari) Zaproponowano, ale nie zatwierdzono KOI-8 Cyrylica Samowie Adaptacje walijski Cyrylica Barentsa estoński cyrylica ukraińska
Wykorzystanie bibliograficzne	MARC-8 ANSELA CCCII/EACC ISO 5426 5426-2 5427 5428 6438 6862
Normy krajowe	ArmSCII Biustonosz SCII OUN 11643 DIN 66003 ELOT 927 GOST 10859 GB 2312 GB 12345 GB 12052 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 KOI-7 KPS 9566 KSX1001 KSX1002 LST 1564 LST 1590-4 PASCII Zmień JIS SI 960 TIS-620 TSCII VISCII VSCII YUSCII
ISO/IEC 2022	ISO/IEC8859 ISO/IEC 10367 Rozszerzony kod Unix / EUC
Strony kodowe systemu Mac OS („skrypty”)	ormiański arabski Cyrylica Barentsa celtycki środkowoeuropejski chorwacki cyrylica Dewanagari perski (perski) Czcionka X (Kermit) celtycki gruziński grecki gudżarati Gurmukhi hebrajski Islandia Eskimosów Klawiatura łacina (Kermit) maltański/esperanto Ogham rzymski rumuński Samowie turecki Cyrylica turecka ukraiński VT100
strony kodowe DOS	437 668 708 720 737 770 773 775 776 777 778 850 851 852 853 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 897 899 903 904 932 936 942 949 950 951 1040 1042 1043 1046 1098 1115 1116 1117 1118 1127 3846 ABIKOMP CS Ind CSX Ind CSX+ Ind CWI-2 systemu irańskiego Kamenickiego Mazowsze MIK
Strony kodowe IBM AIX	895 896 912 915 921 922 1006 1008 1009 1010 1012 1013 1014 1015 1016 1017 1018 1019 1124 1133
Strony kodowe systemu Windows	CER-GS 932 936 ( GBK ) 950 1169 Rozszerzona łacina-8 1250 1251 1252 1253 1254 1255 1256 1257 1258 1270 cyrylica + fiński cyrylica + francuski cyrylica + niemiecki greka politoniczna
strony kodowe EBCDIC	37 Język japoński w EBCDIC DKOI
DEC ( VTx )	Wielonarodowy (MCS) Wymiana krajowa (NRCS) Francuski Kanadyjczyk szwajcarski hiszpański Zjednoczone Królestwo Holenderski fiński Francuski norweski i duński szwedzki norweski i duński (alternatywa) 8-bitowy grecki 8-bitowy turecki SI 960 hebrajski Specjalna grafika techniczne (TCS)
Specyficzne dla platformy	1057 Żołądź standard Adobe Adobe łacina 1 CPC Amstrada Jabłko II ATASCII Atari ST BICS Kalkulatory Casio CDC Compucolor II PK/M+ DEC RADIX 50 DEC MCS / NRC Dyrekcja Generalna ds. Międzynarodowych Fieldata KLEJNOT GSM 03.38 HP Roman HP FOCAL HP RPL ŚCIŚNIJ LIC LMBCS MSX NEC APC Następny PETSCII Segę SC-3000 Ostre kalkulatory Ostry MZ Sinclair QL Symbol Teletekst Kalkulatory TI TRS-80 Ventura International WISCII XCCS ZX80 ZX81 ZX Spectrum
Unicode / ISO/IEC 10646	UTF-1 UTF-7 UTF-8 UTF-16 UTF-32 UTF-EBCDIC GB 18030 BOCU-1 CESU-8 SCSU TACE16 Porównanie kodowań Unicode
System składu TeX	Korek LY1 OML OMS OT1
Różne strony kodowe	ABIKOMP ASMO 449 Duży5 Cyfrowe kodowanie symboli APL ISO-IR-68 ARIB STD-B24 HZ IEC-P27-1 INIS 7-bitowy 8 bitowy ISO-IR-169 ISO 2033 KOI KOI8-R KOI8-RU KOI8-U Mojikyo SEASCII Stanforda/ITS TRON Ujednolicony kod Hangul
Postać kontrolna	Prosygnaty Morse'a Kody kontrolne C0 i C1 ISO/IEC 6429 JIS X 0211 Znaki kontrolne, formatujące i separatory Unicode Białe znaki
powiązane tematy	CCSID Kodowanie znaków w HTML Wykrywanie zestawu znaków Zjednoczenie Hanów Strona kodowa sprzętu Kod MICR Mojibake Kodowanie o zmiennej długości
Zestawy znaków