KPS 9566

KPS 9566
Skróty) ISO-IR-202 (wersja z 1997 r.)
Języki)

Koreański , angielski , rosyjski Częściowe wsparcie: grecki , japoński
Standard KPS 9566
Aktualny stan Używany tylko w Korei Północnej .
Klasyfikacja DBCS zgodne z ISO-2022 , CJK
Formaty kodowania Kodowanie w stylu UHC , ISO 2022 .
Inne powiązane kodowanie KS X 1001 , GB 12052

KPS 9566 („ Standardowy koreański zestaw znaków graficznych KRLD do wymiany informacji ”) to północnokoreański standard określający kodowanie znaków dla systemu pisma Chosŏn'gŭl (Hangul) używanego w języku koreańskim . Wydanie z 1997 r. Określało dwubajtowy kodowany zestaw znaków 94 × 94 zgodny z normą ISO 2022 . Kolejne edycje dodały dodatkowe zakodowane znaki poza płaszczyzną 94 × 94, w sposób porównywalny z UHC czy GBK .

KPS 9566 różni się podejściem od KS X 1001 , swojego południowokoreańskiego odpowiednika, tym, że używa innej kolejności chosŏn'gŭl, koduje wyraźne pionowe formy prezentacji interpunkcji, nie koduje zduplikowanych hanja dla wielu odczytów oraz zawiera kilka znaków specyficznych dla system polityczny Korei Północnej, w tym specjalne kodowanie imion byłych i obecnych przywódców tego kraju ( Kim Il-sunga , Kim Dzong-ila i Kim Dzong-una ).

Chociaż KPS 9566 był oryginalnym źródłem kilku znaków dodanych do Unicode , nie wszystkie znaki KPS 9566 mają odpowiedniki Unicode. Te, które nie są mapowane na podobne znaki Unicode lub na obszar użytku prywatnego .

Tło i inne standardy

Zestaw znaków ASCII powstał w Stanach Zjednoczonych w 1963 roku i został zmieniony w 1967 roku do postaci, jaką ma dzisiaj. ASCII został również zaakceptowany jako międzynarodowy standard w 1967 roku, stając się ECMA-6, oznaczony jako ISO/IEC 646 przez Międzynarodową Organizację Normalizacyjną . Jest obecnie oznaczony jako ANSI X3.4-1986 i ISO 646:1991. ASCII było 7-bitowym, jednobajtowym kodowaniem obejmującym 94 znaki graficzne, spację i 33 kody kontrolne , które zapewniały podstawową obsługę przedstawiania tekstu w języku angielskim amerykańskim jako serii bajtów.

Kolejna edycja ISO 646, opublikowana w 1972 r., Zrewidowała normę, wprowadzając koncepcję krajowych wersji kodu, umożliwiając krajom zastąpienie kilku rzadziej używanych kodów własnymi wymaganymi znakami. Równocześnie trwały prace nad zdefiniowaniem mechanizmów rozszerzeń dla ASCII, z zamiarem zastosowania zarówno w środowiskach 7-bitowych, jak i 8-bitowych. Zostało to ukończone w 1973 roku i opublikowane jako JIS X 0202 , ECMA-35 i ISO 2022 . ISO 2022 określa mechanizmy używania jednobajtowych i wielobajtowych zestawów znaków o określonej strukturze zarówno w środowiskach 7-bitowych, jak i 8-bitowych oraz do deklarowania i przełączania między nimi w standardowy sposób przy użyciu kodów zmiany i sekwencji specjalnych .

Kraje Azji Wschodniej , ze względu na stosowanie dużego repertuaru chińskich znaków , wprowadziły standardowe kodowanie dwubajtowe (DBCS) do swoich systemów pisma, ponieważ liczba znaków możliwych do przedstawienia w kodzie jednobajtowym nie była wystarczająca. W DBCS zgodnym z ISO 2022 każdy znak może być reprezentowany za pomocą dwóch bajtów znaków drukarskich ASCII; lokalizacja znaku może być określona przez te wartości bajtów lub przez dwie liczby od 1 do 94 ( kuten ), równym odpowiednim bajtom minus 32. Pierwszym zarejestrowanym DBCS zgodnym z ISO 2022 i pierwszym wschodnioazjatyckim DBCS, który został ustanowiony jako norma krajowa, była pierwsza edycja JIS X 0208 (Japonia), opublikowana w 1978 roku. następnie GB 2312 (Chiny kontynentalne) w 1980 r. i kod Wansung (Korea Południowa; po raz pierwszy oznaczony jako KS C 5601-1987) w 1987 r. Big5 (Tajwan), zdefiniowany w 1984 r., nie był zgodny ze strukturą ISO 2022. W przypadku używania w środowisku 8-bitowym (a nie 7-bitowym), GB 2312 i kod Wansung były zwykle używane z ósmym zestawem bitów, z ASCII lub podobnym SBCS używany z nieustawionym ósmym bitem; te schematy kodowania są znane odpowiednio jako EUC-CN i EUC-KR .

Chociaż koreański system pisma zawiera indywidualne symbole ( jamo ) dla spółgłosek i samogłosek, służące jako alfabet , tekst koreański jest odpowiednio złożony z tych symboli ułożonych w bloki dla każdej sylaby. Kod Wansung zawierał oddzielnie poszczególne koreańskie bloki sylab, traktując je jako duży zestaw znaków, podobnie jak hanja , i został po raz pierwszy zdefiniowany w trzeciej edycji południowokoreańskiego standardu KS C 5601. Pierwsza edycja zdefiniowała kodowanie indywidualnego jamo, co pozwoliło bloki sylab do zakodowania jako sekwencje, które nazwano N-bajtowym Hangul i nie został przyjęty na tak szeroką skalę, jak zamierzano.

Kod Wansung nie zakodował wszystkich możliwych współczesnych sylab koreańskich, a jedynie wybór 2350 najpopularniejszych, chociaż pozwalał na ich określenie za pomocą sekwencji łączących, które często nie były obsługiwane. Alternatywne kodowanie, również południowokoreańskie, o nazwie Johab zrobiło i przez pewien czas służyło jako konkurent Wansunga. Unified Hangul Code (UHC), wprowadzony przez Microsoft wraz z Windows 95 , rozszerzył EUC-KR, umożliwiając użycie nieprawidłowych dwubajtowych kodów EUC do reprezentowania wszystkich innych sylab dostępnych w Johab. Podobne podejście przyjęto w rozszerzeniu kodowania GBK w Chinach kontynentalnych GB 2312 z obsługą tradycyjnego chińskiego i mniej popularnych chińskich znaków poprzez kodowanie ich do kodów dwubajtowych nieprawidłowych w EUC-CN .

Korea Południowa nie była jedynym krajem, który opracował ISO 2022 DBCS dla języka koreańskiego: w Chinach kontynentalnych GB 12052 opublikowano w 1989 r. Nie było to ściśle związane z kodem Wansunga, chociaż zawierało również złożone sylaby. Zamiast tego odpowiadał GB 2312 z koreańskimi sylabami (i 94 hanja ) zastępującymi chińskie znaki, z wyjątkiem włączenia znaku dolara zamiast znaku juana. Być może został opracowany do użytku przez mniejszość koreańską w północno-wschodnich Chinach.

Podobnie Korea Północna opracowała KPS 9566. Chociaż Korea Północna i Korea Południowa używają koreańskiego Chosŏn'gŭl (Hangul) jako podstawowego systemu pisma, używają różnych porządków leksykograficznych . W związku z tym kolejność znaków różni się między kodem Wansung a KPS 9566.

KPS 9566 przeszedł kilka zmian, w tym edycje 1997 i 2003, głównie w celu zwiększenia zgodności z Unicode . Są one zwykle oznaczane przez podanie roku (np. KPS 9566-97, 9566-2003). Obecna edycja w momencie wydania Red Star OS 3.0 wydaje się być KPS 9566-2011, która dodaje Kim Jong-un do listy liderów. Publicznie dostępna tabela kodów dla wydania KPS 9566 z 1997 r. Przedstawia płaszczyznę ISO 2022 94 × 94. Nowsze edycje, z jakich źródeł informacji są dostępne poza samą Koreą Północną, wydają się określać dodatkowe przydziały poza płaszczyzną EUC (podobnie jak GBK czy UHC).

Ze względu na problemy z interoperacyjnością wynikające z używania wielu standardów krajowych i zastrzeżonych kodowań znaków specyficznych dla platformy lub czcionki, standard Unicode został opracowany z zamiarem umożliwienia wymiany całego reprezentowalnego tekstu w jednym, uniwersalnym formacie. Pierwsza edycja Unicode została opublikowana w 1991 i 1992 r., a norma ISO/IEC 10646 została zsynchronizowana z Unicode w 1993 r. Formaty Unicode są preferowane do użytku międzynarodowego w sieci World Wide Web , gdzie starsze kodowanie znaków jest traktowane jako częściowe kodowanie Unicode za pomocą plików mapowania.

Projekt

Zasadniczo KPS 9566 jest podobny do zestawu znaków Wansung zdefiniowanego przez południowokoreański standard KS X 1001 , chociaż te dwa nie są kompatybilne. Oba kodują sekcję znaków interpunkcyjnych, symboli, jamo , kana i znaków alfabetycznych, po której następuje podzbiór możliwych współczesnych sylab chosŏn'gŭl, a następnie sekcja hanja . Jednak KPS 9566 wykorzystuje inną kolejność jamo i sylab, aby zachować zgodność z porządkiem leksykograficznym Korei Północnej standardy. KPS 9566 zawiera również 28 jawnie obróconych znaków interpunkcyjnych dla typografii pionowej, czego KS X 1001 nie ma, i koduje każdą hanję tylko raz, podczas gdy KS X 1001 koduje kilka hanja z wieloma odczytami wiele razy.

KPS 9566-97 koduje łącznie 2679 sylab chosŏn'gŭl i 4653 hanja. Zapewnia to lepsze pokrycie niż 2350 sylab zakodowanych przez kod Wansung: na przykład znak 똠 użyty w nazwie 똠방각하 [ ko ] , znane koreańskie dzieło literackie, nie ma przypisanego punktu kodowego Wansung, ale ma jeden (38- 02) w KPS 9566. Sekcja hanja zawiera 4652 znaki z Unified Repertoire and Ordering oraz jeden z CJK Unified Ideographs Extension A . Całość rzędu 15, druga połowa rzędu 44 (po bloku sylab) i druga połowa rzędu 94 (po bloku hanja) może być wykorzystana do celów zdefiniowanych przez użytkownika.

KPS 9566 wyróżnia się szczególnie włączeniem kilku znaków specjalnych z życia politycznego Korei Północnej. W szczególności obejmuje godło sierpa, młota i pędzla Partii Pracy Korei , zarówno bez kółka, jak i z kółkiem (punkty kodowe 12-01 i 12-02) oraz dwie grupy trzech znaków specjalnego przeznaczenia, które składają się na imiona przywódcy Korei Północnej Kim Il-sung (김일성) i Kim Dzong-il (김정일) specjalną ozdobną czcionką (odpowiednio punkty kodowe od 04-72 do 04-74 i od 04-75 do 04-77). Sylaby Kim i Il, które są identyczne w pisowni obu imion, są zakodowane dwukrotnie. KPS 9566-2011 dodatkowo zawiera nazwę Kim Jong-un (김정은) jako punkty kodowe od 04-78 do 04-80.

Ze względu na te znaki specjalne obecnie nie ma pełnej zgodności w obie strony między KPS 9566 a Unicode, chyba że nieobsługiwane znaki są mapowane na obszar użytku prywatnego .

KPS 10721

Korea Północna opracowała również drugi zestaw znaków, KPS 10721 „ Kod dodatkowego koreańskiego zestawu Hanja do wymiany informacji ”, który został opublikowany w 2000 r. KPS 10721 koduje zestaw co najmniej 19469 hanja dodatkowych do tych zawartych w KPS 9566. Od 2009, nie wszystkie miały odwzorowania na Unicode, ale zawierały 10358 z Unified Repertoire and Ordering , 3187 z CJK Unified Ideographs Extension A i 107 z CJK Compatibility Ideographs (wszystkie w Basic Multilingual Plane ), a także 5767 z CJK Unified Ideographs Extension B i 50 z CJK Compatibility Ideographs Supplement (w dodatkowej płaszczyźnie ideograficznej ).

Oprócz mapowania tych hanja na Unicode, niewiele wiadomo o standardzie KPS 10721 poza Koreą Północną. Północnokoreańskie glify referencyjne nie są dostępne dla tych Hanja na wykresach kodu Unicode z powodu braku odpowiednich danych czcionek dostępnych dla Konsorcjum Unicode. Znaki hanja Unicode ze źródłami KPS 9566 lub KPS 10721 są jednak odsyłane do ich kodów KPS w Unihan za pomocą klucza kIRG_KPSource .

Dokumentacja i związek z Unicode

Początkowe pokrycie sylab koreańskich przez Unicode , dodane w wersji 1.0, było oparte na kodzie Wansunga. W Unicode w wersji 2.0 dodano nowy blok sylab koreańskich (obecny blok sylab Hangul ), oparty na repertuarze sylab dostępnym w Johab, a poprzedni blok został usunięty (jest teraz zajęty przez CJK Unified Ideographs Extension A ). Dokonano tego przy założeniu, że żadne koreańskie dane zakodowane w Unicode jeszcze nie istniały, ale stały się znane jako „koreański bałagan”, a odpowiedzialne komitety zobowiązały się nie wprowadzać takiej niezgodnej zmiany w przyszłości, zobowiązanie skodyfikowane przez Polityka stabilności Unicode .

Karta kodów dla KPS 9566-97, opublikowana w kwietniu 1997 r., Została zgłoszona do Międzynarodowego Rejestru Zakodowanych Zestawów Znaków ISO w celu rejestracji do użytku z ISO / IEC 2022 . Została zarejestrowana w czerwcu 1998 roku pod numerem ISO-IR-202 . Ta tabela kodów jest publicznie dostępna w Information Processing Society of Japan .

W sierpniu 1999 r. organ krajowy Korei Północnej przedłożył dokument WG2 ( grupa robocza 2 ISO/IEC JTC 1/SC 2), organowi ISO odpowiedzialnemu za ISO/IEC 10646 , międzynarodową normę odpowiadającą Unicode . Ten dokument wymagał dodania kodów KPS 9566 do istniejących odsyłaczy z CJK Unified Ideographs wykresy, dodanie 80 znaków symboli z KPS 9566, które nie miały istniejących odwzorowań Unicode, rozwiązanie różnicy w kolejności sortowania między KPS 9566 a Unicode (ze względu na kolejność znaków w Unicode zgodną z kodowaniem Korei Południowej) oraz dodatek 8 łączący jamo. Poprosił również WG2 o edycję istniejących znaków Unicode i nazw bloków, aby używały terminu „znak koreański” zamiast „Hangul”. Rozszerzona wersja tej propozycji, podzielona na kilka dokumentów, została złożona jako punkt roboczy w grudniu 1999 r.

Szwecji przedłożył szczegółową odpowiedź w marcu 2000 r., sprzeciwiając się kilku punktom i szczegółowo omawiając głosowanie Szwecji przeciwko propozycji. W tej odpowiedzi stwierdzono, że ponowna zmiana kodowania znaków koreańskich spowodowałaby poważne zakłócenia, nawet większe niż za pierwszym razem, co miało miejsce, gdy istniało stosunkowo niewiele implementacji, ale z perspektywy czasu nie powinno było zostać zrobione. Wyjaśniono, że niewiele języków lub żaden nie może być poprawnie zestawionych na podstawie wartości punktu kodowego oraz że dostosowanie algorytmu sortowania Unicode lub ISO/IEC 14651 (wówczas przygotowywana) powinna być wykorzystana do tego celu, a nazwy normatywne już nadanych znaków nie mogą być zmieniane ze względu na politykę stabilności, chociaż można zastosować tłumaczenia nienormatywne na inne języki. Zasugerowano, że sam organ północnokoreański mógłby dostarczyć plik mapowania do odczytu maszynowego między Unicode a KPS 9566 i byłby bardziej użyteczny niż drukowane odsyłacze w standardowym dokumencie. Jeśli chodzi o proponowane dodatkowe znaki, w odpowiedzi stwierdzono, że nie należy dodawać znaków, które miałyby dekompozycję kompatybilności w Unicode, oraz że nie należy dodawać logo, w tym logo partii politycznych, oraz znaków specjalnych imion i nazwisk konkretnych osób.

W lipcu 2000 roku północnokoreański organ napisał do WG2, zarzucając im, że rozwijają obie wersje kodowania Unicode dla języka koreańskiego wyłącznie na podstawie propozycji Korei Południowej, bez konsultacji z Koreą Północną, zarzucając im, że stawiają interesy handlowe firm i obawy przed zamieszanie wokół poszanowania suwerenności Korei Północnej oraz stwierdzenie, że Korea Północna uzna dalszą odmowę zmiany nazw i kolejności koreańskich znaków w Unicode za obrazę ich suwerennej godności i za naruszenie ISO roszczeń do bezstronności. Ponownie zażądali, aby WG2 i Unicode „poprawiły” kolejność koreańskich znaków i „poprawiły” nazwy „Hangul Jamo” i „Sylaba Hangul” na „alfabet koreański” i „sylaba koreańska”.

W sierpniu 2000 r. organ krajowy Korei Północnej przedstawił bardziej szczegółową wersję swoich wniosków w serii pięciu kolejnych propozycji. Prosili o dodanie 14 dodatkowych znaków jamo, dodanie 82 znaków symboli i użycie terminu „alfabet koreański” zamiast „Hangul”, dostarczyli dowodów potwierdzających północnokoreański porządek zestawienia i zażądali dodania północnokoreańskiego repertuar hanji. Propozycje te zostały omówione podczas dwóch spotkań między Koreą Północną a Koreą Południową , szwedzcy i inni przedstawiciele WG2 we wrześniu 2000 r., w którym północnokoreański organ został poproszony o dostarczenie manuskryptów potwierdzających dodatkowe znaki jamo, ponowne przedłożenie propozycji symboli z usuniętymi symbolami, które zostały już zaakceptowane w Unicode, oraz rozważenie użycia ISO / IEC 14651 , następnie na końcowym etapie projektu, do celów zestawiania.

We wrześniu 2001 r. Północnokoreański organ krajowy przedłożył poprawioną serię propozycji z prośbą o dodanie kilku znaków KPS 9566 i KPS 10721, w tym 70 znaków symboli, do Unicode. W tej wersji wniosku zawarto część fragmentów dokumentów wykazujących użycie kilku znaków oraz krótkie wyjaśnienia ich przeznaczenia. Robotnicza Korei symbol został nazwany „Młot, Sierp i Pędzel”, przemianowany z „Znaku Partii Robotniczej Korei” we wcześniejszych wersjach wniosku i uzasadniony jako symbol identyfikacyjny na mapach. Jako uzasadnienie proponowanych znaków imion przywódców wyjaśnili, że imiona przywódców często pojawiają się w publikacjach północnokoreańskich z innym rozmiarem i grubością czcionki w celu podkreślenia. W ramach działań następczych przedstawicieli WG2 z Korei Południowej zażądano dowodów, imion w języku koreańskim i uzasadnień dodania niektórych z tych znaków, i zauważono, że niepodkreślone wersje imion przywódców już istniały. Spotkanie przedstawicieli WG2 z Korei Północnej i Południowej zostało zwołane w październiku 2001 r., Na którym zalecono dodanie 47 znaków symboli do Unicode i zasugerowano, aby WG2 podniosła nazwiska przywódców i symbole WPK do dalszej dyskusji.

W kolejnym dokumencie zwrotnym z lutego 2002 r. dotyczącym proponowanych przez Koreę Północną dodatków żądano, aby symbol „herbaty” oznaczający herbaciarnię zostać zaakceptowany jako bardziej ogólny symbol „napoju gorącego”, utożsamiając go z symbolami używanymi w przewodnikach do oznaczania napojów gorących lub bezalkoholowych. Zalecił również, aby glif referencyjny dla istniejącego punktu kodowego parasola bez deszczu został zmodyfikowany, aby harmonizował z proponowanym glifem referencyjnym dla parasola z deszczem, zrównując je z symbolami „utrzymuj suchość” używanymi na opakowaniach, i poruszył kwestię, które piorun i symbole ostrzegawcze wysokiego napięcia w istniejących zbiorach symboli mogłyby zostać ujednolicone z proponowanym znakiem „wysokiego napięcia”. Wszystkie trzy z tych znaków zostały zaakceptowane w Unicode w wersji 4.0. Zalecono również, aby ułamki z poziomymi kreskami i nożyczki skierowane w lewą stronę były zakodowane przy użyciu selektor odmian , ponieważ nożyczki nie towarzyszyły nożyczkom zorientowanym w inny sposób, a istniejące punkty kodowe ułamków Unicode ujednoliciły formy skośne i poziome.

W listopadzie 2002 r. południowokoreański organ opublikował zestaw trójdzielnych tabel odwzorowujących znaki między normami KPS 9566, KS X 1001 (jako EUC-KR) i ISO/IEC 10646, jakie istniały w 2000 r. Tabele te zostały przygotowane bez wejście z Korei Północnej.

W sierpniu 2004 roku, para tabel mapowania między KPS 9566-2003 a Unicode została przesłana do projektu OpenOffice.org przez osobę używającą nazwy „ooprojlover”, która stwierdziła, że ​​reprezentują one zaktualizowaną wersję standardu KPS 9566 i poprosiła o to dodać wsparcie. Pliki te odwzorowywały znaki niedostępne w Unicode na obszar użytku prywatnego i zawierały dodatkowe zakodowane formy dla innych bloków sylab poza główną płaszczyzną ISO-IR-202. Tabela mapowania została później opublikowana przez Konsorcjum Unicode w 2011 r. na podstawie tych danych kartograficznych, ale z poprawionymi błędami w odniesieniu do mapy ISO-IR.

Kopie Red Star OS 3.0 zawierają czcionki dla nowszej edycji KPS 9566, wyglądającej na KPS 9566-2011. Pomyślnie wyodrębniono tabelę mapowania używaną wewnętrznie przez Red Star OS. Oprócz dodania Kim Jong-una do listy przywódców, KPS 9566-2011 zmienia mapowania niektórych form pionowych w porównaniu z mapowaniami z 2003 r. (Wykorzystując blok form pionowych dodany w Unicode 4.1), a także zawiera kilka dodatkowych hanja i symboli zakodowane poza płaszczyzną ISO-IR-202. Kilka z tych dodatkowych symboli jest również przyporządkowanych do obszaru użytku prywatnego; jednak ich tożsamość nie jest znana, ponieważ poza Koreą Północną nie są znane żadne imiona ani glify referencyjne tych postaci.

Wpływ na Unicode dzisiaj

Kilka aktualnych znaków Unicode zostało dodanych do Unicode 4.0 w wyniku propozycji Korei Północnej, chociaż nie zawsze w pierwotnie proponowanych punktach kodowych. Należą do nich GORĄCY NAPÓJ (☕, proponowany jako SYMBOL HERBATY), który został zaproponowany jako symbol mapy do oznaczania herbaciarni oraz symbole flag BIAŁA FLAGA (⚐) i CZARNA FLAGA (⚑), które zostały zaproponowane jako symbole map dla miejsc bitew i zwycięstw militarnych. Znaki te zostały zaproponowane odpowiednio dla tymczasowych punktów kodowych U+270A, U+268E i U+268F, ale zostały zakodowane odpowiednio w końcowych punktach kodowych U+2615, U+2690 i U+2691. Obejmują one również serię pogrubionych strzałek kierunkowych w zakresie od U + 2B05 do U + 2B0D, z wyłączeniem strzałki skierowanej w prawo, która została zmapowana na istniejący znak w bloku Dingbats, które zostały dodane w tych samych punktach kodowych, dla których zostały zaproponowane, oprócz zamiany strzałek północno-wschodniej i północno-zachodniej w porównaniu z propozycją.

Inne znaki piktograficzne, które znalazły się w propozycji Korei Północnej, to parasol z kroplami deszczu (☔), piorun oznaczający wysokie napięcie (⚡) i trójkąt ostrzegawczy (⚠). Po dyskusji na temat innych glifów symboli wysokiego napięcia w użyciu reprezentował ten sam znak, co ten z propozycji północnokoreańskiej i który glif najlepiej byłoby umieścić dla niego na wykresie kodu Unicode, a po modyfikacji glifu wykresu kodowego istniejącego znaku parasolowego bez deszczu (U + 2602 , ☂), aby zharmonizować się z nowym parasolem z kroplami deszczu z propozycji Korei Północnej, znaki te zostały również dodane w Unicode 4.0, w tym samym czasie co flagi i symbol napoju. Chociaż zaproponowano tymczasowe punkty kodowe U + 2618, U + 267F i U + 267E, nadano im odpowiednio ostateczne punkty kodowe U + 2614, U + 26A1 i U + 26A0.

Spośród tych znaków gorący napój, parasol z kroplami deszczu, błyskawica i trójkąt ostrzegawczy oraz strzałki w górę, w dół i w lewo zostały następnie wybrane jako odwzorowania z japońskich zestawów emotikonów komórkowych, co daje w sumie siedem aktualnych emotikonów Unicode, które zostały pierwotnie dodane do Unicode na prośbę Korei Północnej. Parasol z kroplami deszczu oraz strzałkami w górę, w dół i w lewo zostały również ujednolicone ze znakami z rozszerzeń ARIB używany w japońskich programach telewizyjnych, który zawiera kilka znaków sklasyfikowanych obecnie jako emoji i został odwzorowany na Unicode w Unicode 5.2. Jednak para białych i czarnych flag używana jako emoji lub w sekwencjach flag regionalnych i identyfikacyjnych emoji to inny, „machający” zestaw dodany w Unicode 7.0 (U + 1F3F3 🏳 i U + 1F3F4 🏴), a nie para z Korei Północnej.

Od 2018 r. Pozostało kilka znaków KPS 9566, które nie są odwzorowane na Unicode. Należą do nich symbol WPK, cztery trójkątne znaki, para nożyczek skierowanych w lewo (wykluczone ze względu na to, że nie wykazano kontrastowego użycia nożyczek skierowanych w prawo w bloku Dingbats), skierowany w górę manikiuł w kole, prezentacja pionowa formy znaków interpunkcyjnych, warianty nawiasów zamykających zawierające kropki , warianty ułamków wulgarnych z poziomą kreską zakodowane oddzielnie od ich wersji ukośnych oraz nazwiska liderów.

Japoński znak pocztowy z trójkątem skierowanym w dół został uwzględniony w KPS 9566-97, ale usunięty w KPS 9566-2003 po tym, jak organ północnokoreański wycofał go ze swojej propozycji Unicode do przeglądu w odpowiedzi na prośby organu południowokoreańskiego o przedstawienie dowodów potwierdzających użycie symbolu w Korei Północnej. Ten znak został ponownie zaproponowany w 2018 roku na podstawie zgodności z KPS 9566 i zidentyfikowany jako znak zgodności elektrycznej używany w Japonii przed jego zastąpieniem diamentem PSE . Został dodany do Unicode w wersji 13.0, opublikowanej w 2020 roku.

Zakodowane formularze

Wydanie KPS 9566 z 1997 r. Zostało zarejestrowane w Międzynarodowym rejestrze kodowanych zestawów znaków do użytku z sekwencjami specjalnymi jako ISO-IR-202 i dlatego może być kodowane przy użyciu ISO / IEC 2022 . Jest to 94 -n wielobajtowy zestaw G, tzn. jeśli jest używany w 7-bitowym kodzie ISO 2022 (analogicznie do ISO-2022-JP lub ISO-2022-KR ), znaki będą kodowane parami bajtów pomiędzy 0x21 i 0x7E w odpowiednim trybie.

Udokumentowane mapowania między KPS 9566 i Unicode dla wydań KPS 9566 z 2003 i 2011 roku wykorzystują kodowanie przypominające adaptację Unified Hangul Code (UHC) do kodowania KPS 9566 zamiast kodu Wansung, z ich zaktualizowanymi wersjami ISO-IR-202 płaszczyzna jest kodowana przy użyciu par bajtów między 0xA1 a 0xFE oraz innymi dwubajtowymi kodami używanymi dla sylab nieobecnych w ISO-IR-202. Kolejność rozszerzonych sylab jest zgodna ze zwykłą kolejnością KPS 9566. Podobnie jak UHC, używają bajtów wiodących 0x81 i wyższych oraz bajtów końcowych z zakresów 0x41–0x5A, 0x61–0x7A i 0x81–0xFE, z wyłączeniem zakresu 0xA1–0xFE, jeśli bajt wiodący to 0xA1 lub wyższy.

Wydanie z 2011 roku zawiera również kilka dodatkowych hanja i symboli zakodowanych poza płaszczyzną ISO-IR-202, po zakresie używanym dla rozszerzonych bloków sylab. To podejście jest podobne do przyjętego przez GBK , ale z bajtami śladowymi pozostającymi w zakresach w stylu UHC: podobnie jak rozszerzone sylaby z bajtami wiodącymi 0xA1 i wyższymi, wszystkie one używają zakresów bajtów śledzących 0x41–0x5A, 0x61–0x7A i 0x81 –0xA0. Rozszerzone hanja są kodowane za pomocą wiodących bajtów między 0xC8 a 0xDC, rozszerzone symbole są kodowane za pomocą głównych bajtów między 0xE0 a 0xEA, a rozszerzone kody z głównymi bajtami między 0xEC a 0xFE są mapowane, bez przerw, do obszaru użytku prywatnego (porównaj zakresy zdefiniowane przez użytkownika w GBK). Kilka znaków w sekcji rozszerzonych symboli i trzy w sekcji hanja jest również mapowanych na obszar prywatnego użytku Unicode; w przeciwieństwie do symboli mapowanych przez PUA na głównej płaszczyźnie ISO-IR-202, tożsamość tych znaków nie jest udokumentowana.

Bajt wiodący

Ten wykres przedstawia ogólny układ płaszczyzny głównej zestawu znaków KPS 9566 według bajtu wiodącego. W przypadku bajtów wiodących używanych dla znaków innych niż złożone sylaby chosŏn'gŭl lub hanja, na tej stronie znajdują się łącza do wykresów zawierających znaki zakodowane w tym bajcie wiodącym. W przypadku bajtów wiodących używanych do Hanja podane są linki do odpowiedniej sekcji indeksu Hanja w Wikisłowniku .

Tam, gdzie podane są dwie liczby szesnastkowe, wartość poniżej 0x7F jest używana w kodowaniu 7-bitowym, a większa wartość (między 0xA1 a 0xFE) jest używana w 8-bitowym kodowaniu w stylu EUC . Rozszerzone 8-bitowe kodowanie w stylu UHC , zdefiniowane w wydaniu z 2003 r., Podobnie wykorzystuje większe wartości bajtów, od 0xA1 do 0xFE włącznie, dla głównej płaszczyzny opartej na ISO-IR-202.

KPS 9566 (bajty wiodące)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór Sp 1-_ 2-_ 3-_ 4-_ 5-_ 6-_ 7-_ 8-_ 9-_ 10-_ 11-_ 12-_ 13-_ 14-_ 15-_
3x/Bx 16-_ 17-_ 18-_ 19-_ 20-_ 21-_ 22-_ 23-_ 24-_ 25-_ 26-_ 27-_ 28-_ 29-_ 30-_ 31-_
4x/Cx 32-_ 33-_ 34-_ 35-_ 36-_ 37-_ 38-_ 39-_ 40-_ 41-_ 42-_ 43-_ 44-_ 45-_ 46-_ 47-_
5x/Dx 48-_ 49-_ 50-_ 51-_ 52-_ 53-_ 54-_ 55-_ 56-_ 57-_ 58-_ 59-_ 60-_ 61-_ 62-_ 63-_
6x/przykł 64-_ 65-_ 66-_ 67-_ 68-_ 69-_ 70-_ 71-_ 72-_ 73-_ 74-_ 75-_ 76-_ 77-_ 78-_ 79-_
7x/Fx 80-_ 81-_ 82-_ 83-_ 84-_ 85-_ 86-_ 87-_ 88-_ 89-_ 90-_ 91-_ 92-_ 93-_ 94-_ DEL

Non-Hanja, nieskomponowane zestawy w planie głównym

Zestaw znaków 0x21/0xA1 (wiersz numer 1, znaki interpunkcyjne i pionowe)

Ten zestaw zawiera typowe znaki interpunkcyjne w zdaniu, takie jak nawiasy, cudzysłowy, przecinki itp., a także formularze prezentacji do użytku w piśmie pionowym. Interpunkcja ASCII (podświetlona) jest pokazana poniżej odwzorowana na Basic Latin (zgodnie z artykułami dotyczącymi innych zestawów znaków CJK, takich jak KS X 1001 lub JIS X 0208 ), ale jest odwzorowana na blok formularzy o połowie szerokości i pełnej szerokości, gdy jest używana w kodowaniu, które łączy KPS 9566 z ASCII (zgodnie z definicją na przykład w wydaniu z 2003 r.).

W porównaniu z mapowaniem z 2003 r., mapowanie z 2011 r. Zmienia mapowania Unicode trzech pionowych form prezentacji, aby skorzystać z bloku form pionowych wprowadzonego w Unicode 4.1.

KPS 9566 (z prefiksem 0x21/0xA1)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór IDSP
3001 _

3002 _

, 002C

. 002E

· 00B7

: 003A

; 003B

? 003F

! 0021

2025

2026

~ 007E

3003

2015
3x/Bx
- 2010

_ 005F

FFE3

/ 002F

\ 005C

| 007C

2225

2215

2216

309B _

309C _

´ 00B4

` 0060

¨ 00A8

Bibliografia _

02C7 _
4x/Cx
˙ 02D9
ʼ / ˚ / ˊ /
22EE
ⸯ
' 2018

' 2019

201C

201D _

( 0028

) 0029

3014

3015 _

[ 005B

] 005D
5x/Dx
{ 007B

} 007D

3008

3009

300A

300B

300C

300D

300E

300F

3010

3011
.) .⟫
201A _

201b
6x/przykł
201E

201F

FE35

FE36

FE39

FE3A

﹇FE47 _

FE48

FE37

FE38

︿ FE3F

FE40

FE3D

FE3E

FE41

FE42
7x/Fx
FE43

FE44

FE3B

FE3C
  Interpunkcja ASCII może być również odwzorowana na blok formularzy o połowie szerokości i pełnej szerokości .
 Zmapowany do obszaru użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x22/0xA2 (wiersz numer 2, symbole i operatory)

Ten zestaw zawiera operatory matematyczne i kilka innych symboli, takich jak ampersand , pilcrow , nuta muzyczna i tak dalej. Interpunkcja ASCII (podświetlona) jest pokazana poniżej odwzorowana na Basic Latin (zgodne z artykułami na temat innych zestawów znaków CJK), ale jest odwzorowana na blok formularzy Halfwidth i Fullwidth Forms , gdy jest używana w kodowaniu, które łączy KPS 9566 z ASCII .

W tym rzędzie znajduje się kilka trójkątnych symboli „znaków drogowych” oznaczających nadchodzące góry lub pochyłości z przodu lub z jednej strony, ale obecnie nie są one uwzględnione w Unicode. Są one zmapowane do obszaru użytku prywatnego.

KPS 9566 (z prefiksem 0x22/0xA2)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
+ 002B

- 002D

± 00B1

× 00D7

÷ 00F7

= 003D

2260

< 003C

> 003E

2266

2267

221E

2234

2642

2640
3x/Bx
2220

22A5

2312

2202

2207

2261

2252

2248

226A

226B

221A

223D

221D

2235

222B

222C
4x/Cx
222E

2208

220B

⊆2286 _

2287

2282

2283

2209

∌220C _

2288

2289

⊄2284 _

⊅2285 _

222A

2229

2227
5x/Dx
2228

FFE2

21D2

21D4

2200

2203

2211

# 0023

& 0026

* 002A

@ 0040

§00A7 _

203B

2606

2605

25CB
6x/przykł
25 CF

25 n.e

25C7

25C6

25A1

25A0

25B3

25B2

25BD

25 pne

25B7

25C1

25B6

25C0

2218

2219
7x/Fx
❖2756 _
   
2690

2691

266F

266D

266A

2020

2021

00B6

2295

⊖2296 _
  Interpunkcja ASCII może być również odwzorowana na blok formularzy o połowie szerokości i pełnej szerokości .
 Zmapowany do obszaru użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x23/0xA3 (wiersz numer 3, cyfry i Roman)

Ten zestaw zawiera podzbiór ASCII , bez znaków interpunkcyjnych i symboli, składający się z zachodnich cyfr arabskich i obu przypadków podstawowego alfabetu łacińskiego . Porównaj wiersz 3 JIS X 0208 , który dokładnie pasuje do tego wiersza. Porównaj i porównaj rząd 3 KS X 1001 i GB 2312 , które zawierają w tym wierszu całe ich krajowe warianty ISO 646 , a nie tylko podzbiór alfanumeryczny.

Znaki w tym wierszu są pokazane poniżej jako mapowane na punkty kodowe Basic Latin (zgodne z artykułami dotyczącymi innych zestawów znaków), ale są mapowane na blok formularzy Halfwidth i Fullwidth Forms , gdy są używane w kodowaniu, które łączy KPS 9566 z ASCII .

KPS 9566 (z prefiksem 0x23/0xA3)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
3x/Bx 0
0030

1 0031

2 0032

3 0033

4 0034

5 0035

6 0036

7 0037

8 0038

9 0039
4x/Cx
0041 _

B 0042

C 0043

D 0044

E 0045

F 0046

G 0047

H 0048

ja 0049

J 004A

K 004B

L 004C

M 004D

N 004E

O 004 F
5x/Dx
P 0050

Pytanie 0051

R 0052

S 0053

T 0054

U 0055

V 0056

W 0057

X 0058

Y 0059

Z 005A
6x/przykł
0061 _

b 0062

c 0063

d 0064

e 0065

f 0066

g 0067

h 0068

ja 0069

j 006A

k 006B

l 006C

m 006D

n 006E

o 006F
7x/Fx
str. 0070

q 0071

r 0072

s 0073

0074 _

ty 0075

v 0076

w 0077

x 0078

y 0079

z 007A

Zestaw znaków 0x24/0xA4 (wiersz numer 4, Chosŏn'gŭl jamo i imiona liderów)

Ten zestaw zawiera Chosŏn'gŭl jamo , a także specjalne kodowanie imion (od 2003 r.) Przywódców Korei Północnej Kim Il-sunga i Kim Dzong-ila . Imię Kim Jong-un jest również zawarte w wydaniu z 2011 roku. Porównaj z rzędem 4 KS X 1001 .

Jamo w tym wierszu, które istnieje w bloku Unicode Hangul Compatibility Jamo (zawierającym niezależne od pozycji znaki odwzorowane z KS X 1001) są odwzorowywane na ten blok. Przestarzałe jamo , które wyróżnia spalatalizowane sybilanty, odwzorowuje znaki specyficzne dla pozycji w bloku Hangul Jamo . I odwrotnie, nie wszystkie przestarzałe jamo zakodowane przez KS X 1001 są zakodowane w głównej płaszczyźnie KPS 9566. W wydaniu KPS 9566 z 2011 roku niektóre inne historyczne jamo z KS X 1001 są zawarte poza główną płaszczyzną, z główny bajt 0xEA .

Specjalne kodowanie imion przywódców nie jest obecne w Unicode i jest mapowane na obszar użytku prywatnego. Są one pokazane poniżej w postaci symulacji ze znacznikami.

KPS 9566 (z prefiksem 0x24/0xA4)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
3131

3134

3137 _

3139

3141 _

3142 _

3145

3147

3148

314A

314B

314C

314D

314E

3132
3x/Bx
3138

3143

3146

3149

314F

3151

3153

3155

3157

315B

315C

3160

3161

3163

3150

3152
4x/Cx
3154

3156

315A

315F

3162

3158

315D

3159

315E

3133

3135

3136

313A

313B

313C

313D
5x/Dx
313E

313F

3140

3144

317F

3181 _

3186

318D

113C

113D

113E

113F

114E

114F

1150

1151
6x/przykł
1154

1155
7x/Fx
 Zmapowany do obszaru użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x25/0xA5 (wiersz numer 5, cyrylica)

Ten zestaw zawiera oba przypadki 33 liter z cyrylicy , wystarczających do napisania współczesnego alfabetu rosyjskiego i alfabetu bułgarskiego , chociaż inne formy cyrylicy wymagają dodatkowych liter.

Porównaj wiersz 12 w KS X 1001 i wiersz 7 w JIS X 0208 , które wykorzystują ten sam układ (ale w innym rzędzie).

KPS 9566 (z prefiksem 0x25/0xA5)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
А 0410

Б 0411

0412 _

Г 0413

Ę 0414

Е 0415

0401 _

0416 _

0417 _

0418 _

Й 0419

K 041A

Л 041B

M 041C

Н 041D
3x/Bx
О 041E

П 041F

Р 0420

C 0421

Т 0422

У 0423

Ф 0424

0425 _

Ö 0426

Ч 0427

Ř 0428

Щ 0429

Ъ 042A

042B _

Ь 042C

Э 042D
4x/Cx
Ş 042E

ß 042F
5x/Dx
0430 _

0431 _

w 0432

г 0433

0434 _

0435 _

ё 0451

ć 0436

z 0437

i 0438

© 0439

к 043A

л 043B

м 043C

н 043D
6x/przykł
® 043E

п 043F

0440 _

0441 _

0442 _

0443 _

ф 0444

х 0445

0446 _

ч 0447

ř 0448

щ 0449

ъ 044A

ы 044B

ь 044C

э 044D
7x/Fx
ю 044E

я 044F

Zestaw znaków 0x26/0xA6 (wiersz nr 6, litery greckie i cyfry rzymskie)

Ten zestaw zawiera cyfry rzymskie i podstawową obsługę alfabetu greckiego , bez znaków diakrytycznych i końcowej sigmy .

Porównaj i porównaj rząd 5 w KS X 1001 (który używa tych samych znaków, ale w innym układzie i innym rzędzie) i rząd 6 w JIS X 0208 (który używa tego samego układu dla liter greckich, ale bez cyfr rzymskich).

KPS 9566 (z prefiksem 0x26/0xA6)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
Α 0391

B 0392

Γ 0393

Δ 0394

Ε 0395

Ζ 0396

0397 _

Θ 0398

I 0399

K 039A

Λ 039B

Μ 039C

Ν 039D

Ξ 039E

Ο 039F
3x/Bx
Π 03A0

Ρ03A1 _

Σ 03A3

Τ 03A4

Υ 03A5

Φ 03A6

Χ 03A7

Ψ 03A8

Ω 03A9
4x/Cx
α 03B1

β 03B2

γ 03B3

δ 03B4

ε 03B5

ζ 03B6

η 03B7

θ 03B8

ι 03B9

κ 03BA

λ 03BB

μ 03 pne

v 03BD

ξ 03BE

o 03BF
5x/Dx
π03C0 _

ρ 03C1

σ 03C3

τ 03C4

υ 03C5

φ 03C6

χ 03C7

ψ 03C8

ω 03C9
6x/przykł
2160

2161

2162

2163

2164

2165

2166

2167

2168

2169
7x/Fx
2170

2171

2172

2173

2174

2175

2176

2177

2178

2179

Zestaw znaków 0x27/0xA7 (wiersz numer 7, otoczony, indeks górny, indeks dolny, ułamki)

Kilka cyfr w kółku w tym rzędzie zostało niepoprawnie odwzorowanych na Unicode w wydaniu z 2003 roku, z powodu użycia nieostatecznych proponowanych punktów kodowych. Zostały one poprawione w wydaniu z 2011 roku.

KPS 9566 (z prefiksem 0x27/0xA7)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
2460

2461

2462

2463

2464

2465

2466

2467

2468

2469

246A

246B

246C

246D

246E
3x/Bx
246F

2470

2471

2472

2473

3251

3252

3253

3254

3255

3256 _

3257

3258

3259 _

325A
4x/Cx
3260

3261

3262

3263

3264

㉥3265 _

3266

3267

㉨3268 _

3269

326A _

326B

326C

326D
5x/Dx
326E

326F

3270

3271 _

3272

3273

3274

3275

3276

3277 _

3278

3279 _

327A

327B
6x/przykł
2070

¹ 00B9

² 00B2

³ 00B3

2074

2075

2076

2077

2078

2079

½ 00BD

2153

2154

¼ 00 pne

¾ 00BE
7x/Fx
2080

2081
2082

2083
2084

2085

₆2086 _

2087

2088

2089
1 / 2 1 / 3 2 / 3 1 / 4 3 / 4
 Zmapowany do obszaru użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x28/0xA8 (wiersz nr 8, symbole jednostki, ilości i waluty)

Ten zestaw zawiera symbole jednostek miary i waluty. Te obecne w ASCII (podświetlone) są pokazane poniżej zmapowane na Basic Latin (zgodne z artykułami na temat innych zestawów znaków CJK), ale są odwzorowane na blok formularzy Halfwidth i Fullwidth , gdy są używane w kodowaniu, które łączy KPS 9566 z ASCII .

W wydaniu z 2003 roku znak Kelvina został zastąpiony znakiem euro . Wydanie 2011 zawiera alternatywne kodowanie znaku Kelvina w 0xE988 .

Porównaj i porównaj z repertuarem symboli jednostek zawartych w wierszu 7 KS X 1001 .

KPS 9566 (z prefiksem 0x28/0xA8)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
° 00B0

2032

2033

2103

2109
/ K
FFE6
0024 $

FFE0

FFE1

FFE5

% 0025

2030

Å 212B

33C4
3x/Bx
33A1

㎥33A5 _

339D

33A0

㎤33A4 _

339C

㎟339F _

33A3

3377

㍸3378 _

㍹3379 _

339E

33A2

33A6

㎙3399 _

339A
4x/Cx
㎛339B _

33A7

㎨33A8 _

㎍338D _

㎎338E _

㎏338F _

33B4

33B5

33B6

33B7

33B8

33B9

㎀3380 _

3381 _

3382 _

3383
5x/Dx
㎄3384 _

33BA

33 BB

33 pne

33BD

33 BE

33BF

Ω 2126

33C0

33C1 _

3390

3391

3392

3393

3394

33 DE
6x/przykł
33DF

33B0

33B1

33B2

33B3

338A

338B

338C

33A9

33AA

33AB

㎬33AC _

2113

3395

㎖3396 _

3397
7x/Fx
㎘3398 _

33FF

㎈3388 _

3389

33 AD

33AE

33AF

32 CC

33DD

㏈33C8 _

32CD

32 n.e

㏖33D6 _

33CB

33CA
  Interpunkcja ASCII może być również odwzorowana na blok formularzy o połowie szerokości i pełnej szerokości .

Zestaw znaków 0x29/0xA9 (wiersz numer 9, rysunek w ramce)

KPS 9566 (z prefiksem 0x29/0xA9)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
2500

2502

250C

2510

2518

2514

251C

252C

2524

2534

253C

2501

2503

250F

2513
3x/Bx
┛251B _

2517

2523

2533

252B

253b

254B

2520

252F

2528

2537

253F

┝251D _

2530

2525

┸2538 _
4x/Cx
2542

2512

2511

251A

2519

┖2516 _

2515

250E

250D

251E

251F

2521

2522

2526

2527

2529
5x/Dx
252A

252D

252E

2531

2532

2535

2536

2539

253A

253D

253E

2540

2541

2543

2544

2545
6x/przykł
2546

2547

2548

2549

254A
7x/Fx

Zestaw znaków 0x2A/0xAA (wiersz numer 10, Hiragana)

Ten wiersz zawiera Hiragana do użytku w języku japońskim .

Porównaj rząd 10 ze schematu KS X 1001 , który wykorzystuje ten sam układ. Porównaj i porównaj wiersz 4 JIS X 0208 , który również wykorzystuje ten sam układ, ale w innym rzędzie.

KPS 9566 (z prefiksem 0x2A/0xAA)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
3041 _

3042 _

3043 _

3044 _

3045 _

3046 _

3047 _

3048 _

3049 _

304A _

304B _

304C _

304D _

304E _

304F _
3x/Bx
3050 _

3051 _

3052 _

3053 _

3054 _

3055 _

3056 _

3057 _

3058 _

3059 _

305A _

305B _

305C

305D _

305E _

305F _
4x/Cx
3060 _

3061 _

3062 _

3063 _

3064 _

3065 _

3066 _

3067 _

3068 _

3069 _

306A _

306B _

306C _

306D _

306E _

306F _
5x/Dx
3070 _

3071 _

3072 _

3073 _

3074 _

3075 _

3076 _

3077 _

3078 _

3079 _

307A _

307B

307C _

307D _

307E _

307F _
6x/przykł
3080 _

3081 _
3082

3083 _
3084

3085 _

3086 _

3087 _

3088 _

3089 _

308A _

308B _

308C _

308D _

308E _

308F _
7x/Fx
3090 _

3091 _
3092

3093 _

Zestaw znaków 0x2B/0xAB (wiersz nr 11, Katakana)

Ten wiersz zawiera katakany do użytku w języku japońskim . Jednak japoński znak długiej samogłoski , który jest używany w tekście katakana i zawarty w wierszu 1 JIS X 0208 , nie jest uwzględniony (podobnie jak w przypadku GB 2312 i KS X 1001), chociaż jest włączony przez KPS 9566-2011 poza płaszczyzna główna, na 0xEA48 .

Porównaj rząd 11 ze schematu KS X 1001 , który wykorzystuje ten sam układ. Porównaj i porównaj wiersz 5 JIS X 0208 , który również wykorzystuje ten sam układ, ale w innym rzędzie.

KPS 9566 (z prefiksem 0x2B/0xAB)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
30A1 _

30A2 _

30A3 _

30A4 _

30A5 _

30A6 _

30A7 _

30A8 _

30A9 _

30AA _

30AB _
30 AC
30 AD
30 AE
30 AF
3x/Bx
30B0 _

30B1 _

30B2 _

30B3 _

30B4

30B5 _

30B6 _

30B7 _

30B8 _

30B9 _

30BA _

30 BB
30 pne

30BD _
30 BE
30 BF
4x/Cx
30C0

30C1 _

30C2 _

30C3

30C4

30C5

30C6

30C7

30C8

30C9

30CA _

30CB

30CC

30CD

30CE

30CF
5x/Dx
30D0

30D1

30D2

30D3

30D4

30D5 _

30D6

30D7

30D8

30D9

30DA

30DB

30DC

30DD _

30 DE

30DF
6x/przykł
30E0

30E1

30E2

30E3

30E4

30E5 _

30E6

30E7

30E8 _

30E9
30 EA

30EB _

30EC

30 ED

30EE _

30EF
7x/Fx
30F0

30F1

30F2

30F3 _

30F4

30F5

30F6

Zestaw znaków 0x2C/0xAC (wiersz numer 12, różne symbole i strzałki)

W celu odwzorowania tego wiersza na Unicode, pogrubiona strzałka skierowana w prawo została ujednolicona z pogrubioną strzałką skierowaną w prawo z Zapf Dingbats (U + 27A1), chociaż wcześniejsze tabele (w których brakowało odwzorowań dla innych pogrubionych strzałek) zamiast tego ujednolicono ją z U + 279E, nieco inna postać Zapf Dingbats. Ponieważ odpowiednie strzałki w innych kierunkach nie zostały uwzględnione w Dingbatach bloku, dodatkowe strzałki zostały zakodowane między U + 2B05 i U + 2B0D w celu zapewnienia zgodności z KPS 9566. Zostały one włączone do wykresów kodów Unicode przy użyciu glifów referencyjnych zaproponowanych przez organ krajowy Korei Północnej, podczas gdy U + 27A1 zachował swój glif referencyjny oparty na Zapf Dingbaty. Te strzałki (od U+2B05 do U+2B07 oraz U+27A1) zostały wybrane w Unicode 6.0 jako odwzorowania niektórych znaków strzałek w zestawach emotikonów komórkowych. Następnie, podczas dodawania Wingdings 3 repertuaru w Unicode 7.0, dokonano przeglądu pokrycia Unicode znaków strzałek, w wyniku czego dodano dodatkową strzałkę w prawo w U + 2B95 z zamiarem zharmonizowania ze znakami od U + 2B05 do U + 2B0D (w prezentacji tekstowej), od czasu zmiany odniesienia glif postaci Zapf Dingbats nie został uznany za odpowiedni.

We wcześniejszych wydaniach KPS 9566, takich jak wydanie z 1997 r., Ten wiersz zawierał zarówno prosty znak pocztowy w stylu japońskim (〒), jak i wersję w trójkącie skierowanym w dół, który został zaproponowany przez organ krajowy Korei Północnej w celu dodania do Unicode obok innych brakujących znaków KPS 9566. Odpowiedź Koreańczyka z południa przedstawiciel zażądał między innymi dowodów na używanie tego symbolu w Korei Północnej, zauważając, że japoński znak pocztowy nie jest używany w Korei Południowej, w której w podobnym celu używa się 우 (tj. ㉾) w kółku, oraz pytając, czy japoński znak pocztowy w stylu był używany w Korei Północnej. Odbyło się kolejne spotkanie w celu omówienia tej propozycji, w którym uczestniczyli przedstawiciele WG2 z Korei Północnej i Południowej; w raporcie ze spotkania zauważono, że organ północnokoreański postanowił przejrzeć postać przed dalszymi dyskusjami i dlatego nie zarekomendował jej do rozważenia przez WG2 jako całość. Trójkąt znaku pocztowego został następnie usunięty z KPS 9566 w 2003 r., Pozostawiając jedynie niezamknięty znak pocztowy.

Trójkąt znaku pocztowego został ostatecznie dodany do Unicode w wersji 13.0, zarówno w celu zapewnienia zgodności ze starszym znakiem KPS 9566-97, jak i po zidentyfikowaniu znaku jako symbolu używanego do certyfikacji urządzeń elektrycznych w Japonii ( jako poprzednik do diamentu PSE ).

Niektóre znaki KPS 9566 w tym rzędzie, a mianowicie dwie formy godła Partii Robotniczej Korei , nożyczki skierowane w innym kierunku niż w bloku Dingbats oraz zakreślony manikiuł skierowany do góry , pozostają odwzorowane na Obszar użytku prywatnego .

Białe strzałki na północnym wschodzie i północnym zachodzie wykorzystywały nieprawidłowo zamienione mapowania Unicode w wydaniu z 2003 roku. Zostało to poprawione w mapowaniach edycji z 2011 roku.

KPS 9566 (z prefiksem 0x2C/0xAC)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór  
⍟235F _

2600

2602

☔︎ 2614

2601

❄2744 _

⚡︎ 26A1

26A0

№2116 _

2192

2190

2191

2193
3x/Bx
2197

2196

2198

2199

2194

2195

21E8

21E6

21E7

21E9

2B00

2B01

2B02

2B03

2B04

21F3
4x/Cx
27A1

2B05

⬆2B06 _

2B07

2B08

2B09

2B0A

2B0B

2B0C

2B0D

2663

2665

2660

2666

3012 _

2B97
5x/Dx
260F

260E

⏎23CE _

261E
 
☕︎ 2615

327C

327D

321D _

321E

33C7

㋏32CF _

3250

℡2121 _

213B
6x/przykł
337A

® 00AE
7x/Fx
  odwzorowany na obszar użytku prywatnego, pokazany jako symulacja.

Zestaw znaków 0x2E/0xAE (numer wiersza 14, podzbiór Latin-1)

Znaki w tym zestawie nie były obecne w wersji zestawu znaków z 1997 r., Ale zostały dodane w wersji z 2003 r. Stanowią podzbiór Latin-1 Supplement (odpowiednik górnej połowy zestawu znaków ISO 8859-1 (Latin-1)). Obejmuje to akcentowane litery rzymskie i symbole. Niektóre symbole, które zostały już uwzględnione, zostały pominięte, podczas gdy inne są powielane jako odpowiedniki o połowie szerokości do wcześniejszych form o pełnej szerokości : na przykład znak not (¬, U+00AC) jest reprezentowane jako 0xAEAC, podczas gdy jego postać o pełnej szerokości (¬, U+FFE2) jest reprezentowana jako 0xA2D1 (w rzędzie 2 ).

Ten wiersz został pominięty w mapowaniu dla wydania normy z 2011 roku, co wskazuje, że mógł zostać usunięty w pewnym momencie po wydaniu z 2003 roku. Zamiast tego znak jena o połowie szerokości jest zakodowany w 0xE98E w wydaniu z 2011 roku.

Wymagana przestrzeń wykraczałaby poza zakres 94 znaków, kolidując z obszarem używanym dla rozszerzonych sylab chosŏn'gŭl, gdy używane jest kodowanie w stylu UHC (w szczególności z sylabą 쁲) i jest pomijane. Chociaż y z trema również wykracza poza zakres 94 znaków, a bajt końcowy 0xFF jest poza tym nieużywany, kod 0xAEFF jest na niego mapowany w KPS 9566-2003.

KPS 9566-2003 (z prefiksem 0x2E/0xAE)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
2x/Topór
¡ 00A1

¢ 00A2

£ 00 A3

¤ 00A4

¥ 00A5

¦ 00A6

© 00A9

ª 00AA

« 00AB

¬ 00 AC
NIEŚMIAŁY
¯ 00AF
3x/Bx
μ 00B5

¸ 00B8

º 00BA

» 00BB

¿ 00BF
4x/Cx
00C0 _

00C1 _

00C2 _

00C3 _

Ę 00C4

Å 00C5

Ć 00C6

Ç 00C7

È 00C8

É 00C9

Ę 00CA

Ë 00CB

Ě 00CC

Í 00CD

Î 00CE

Ï 00CF
5x/Dx
Ð 00D0

Ń 00D1

Ò 00D2

O 00D3

Ô 00D4

00D5 _

00D6 _

Ø 00D8

00D9 _

Ú 00DA

Ű 00DB

Ü 00 DC

Ý 00DD

Þ 00 DE

ß 00DF
6x/przykł
à 00E0

á 00E1

00E2 _

ã 00E3

00E4 _

00E5 _

ć 00E6

ç 00E7

00E8 _

00E9 _

ę 00EA

ë 00EB

ì 00EC

í 00ED

î 00EE

ï 00EF
7x/Fx
ð 00F0

ñ 00F1

00F2 _

00F3 _

ô 00F4

õ 00F5

00F6 _

ř 00F8

ù 00F9

ú 00FA

û 00FB

ü 00FC

ý 00FD

þ 00FE

ÿ 00FF

Gotowe zestawy Chosŏn'gŭl (rzędy od 16 do 44)

Wstępnie skomponowane klastry sylab Chosŏn'gŭl mają przydzielane punkty kodowe w ciągłym posortowanym bloku między punktami kodowymi 16-01 i 44-47 włącznie. Nie wszystkie możliwe klastry mają przydzielone punkty kodowe. Porównaj różne zamówienia i dostępność w KS X 1001 .

Zakodowana postać udokumentowana dla KPS 9566-2003 koduje płaszczyznę KPS 9566 na GR (0xA1-0xFE) i dodatkowo koduje pozostałe klastry sylab przy użyciu bajtów wiodących w zakresie 0x80-0xC2 i bajtów końcowych w zakresach 0x41-0x5A, 0x61-0x7A i 0x81-0xFE (gdzie co najwyżej jeden bajt mieści się w zakresie 0xA1-0xFE), podobnie do Unified Hangul Code , ale z pominiętymi klastrami i kolejnością sortowania KPS 9566, a nie KS X 1001 .

  • 16 rząd 걸 걹 걺 검 겁 것 겅 겆 겉 겊 겋 겄 겨 격 견 겯 결 겸 겹 겻 경 곁 겪 겼 고 곡 곤 곧 골 곪 곬 곰 곱 곳 공 곶 곺 교 굔 굘 굡 굣 구 국 군 굳 굴 굵 굶 굻 굼 굽 굿 궁 궂 규 균 귤 귬 귱 그 극 근 귿
  • rząd 17 갰 걔 걘 걜 게 겍 겐 겔 겜 겝 겟 겡 겠 계 곈 곌 곕 곗 괴 괵 괸 괼 굄 굅 굇 굉 굈 귀 귁 귄 귈 귐 귑 귓 긔 과 곽 관 괃 괄 괆 괌 괍 괏 광 괐 궈 궉 권 궐 궘 궝 궜 괘 괙 괜 괠 괩 괭 괬 궤 궥 궷 나 낙
  • 18 rząd 넓 넘 넙 넛 넝 넢 넣 넊 넜 녀 녁 년 녈 념 녑 녓 녕 녘 녔 노 녹 논 놀 놂 놈 놉 놋 농 높 놓 뇨 뇩 뇬 뇰 뇸 뇹 뇻 뇽 누 눅 눈 눋 눌 눔 눕 눗 눙 눞 뉴 뉵 뉸 뉼 늄 늅 늉 느 늑 는 늘 늙 늚 늠 늡 늣 능
  • Rząd 19: 늦 늪 니 닉 닌 닐 닒 님 닙 닛 닝 닢 내 낵 낸 낼 냄 냅 냇 네 넥 넨 넬 넴 넵 넷 넹 넸 녜 녠 뇌 뇐 뇔 뇜 뇝 뇟 뉘 뉜 뉠 뉨 뉩 뉭 늬 늰 늴 늼 닁 놔 놘 놜 놧 놨 눠 눨 눳 눴 놰 눼 다 닥 단 닫 달 닭 닮 닯 닲 닳 담 답 닷 당 닺 닻 닾 닿 닦 닸 댜 더 덕 던 덛 덜 덞 덟 덤 덥 덧 덩 덫
  • Rząd 20: 덮 덯 덖 덨 뎌 뎐 뎔 뎡 뎠 도 독 돈 돋 돌 돎 돐 돔 돕 돗 동 돛 돝 됴 두 둑 둔 둘 둠 둡 둣 둥 듀 듄 듈 듐 듕 드 득 든 듣 들 듥 듦 듧 듬 듭 듯 등 디 딕 딘 딛 딜 딤 딥 딧 딩 딪 딮 딨 대 댁 댄 댈 댐 댑 댓 댕 댔 댸 데 덱 덴 덷 델 뎀 뎁 뎃 뎅 뎄 뎨 뎬 되 된 될 됨 됩 됫 됭 됬 뒤 뒥 뒨 뒬
  • Rząd 21: 뒴 뒵 뒷 뒹 듸 듼 딀 딉 딍 돠 돤 돨 둬 둰 둴 둼 둿 뒀 돼 됀 됄 됐 뒈 뒝 라 락 란 랄 람 랍 랏 랑 랒 랖 랗 랐 랴 략 랸 랼 럄 럅 럇 량 러 럭 런 럴 럼 럽 럿 렁 렆 렇 렀 려 력 련 렬 렴 렵 렷 령 렸 로 록 론 롤 롬 롭 롯 롱 롶 료 룐 룔 룜 룝 룟 룡 루 룩 룬 룰 룸 룹 룻 룽 류 륙 륜 률 륨 륩
  • Rząd 22: 륫 륭 르 륵 른 를 름 릅 릇 릉 릊 릍 릎 리 릭 린 릴 림 립 릿 링 맆 래 랙 랜 랠 램 랩 랫 랭 랬 럐 레 렉 렌 렐 렘 렙 렛 렝 렜 례 롄 롈 롑 롓 뢰 뢴 뢸 룀 룁 룃 룅 룄 뤼 뤽 륀 륄 륌 륏 륑 릐 릔 릘 릠 롸 롼 뢉 뢍 뤄 뤘 뢔 뢨 뤠 마 막 만 많 맏 말 맑 맒 맘 맙 맛 망 맞 맟 맡 맣 먀 먁 먄 먈
  • Rząd 23: 먐 먕 머 먹 먼 멀 멁 멂 멈 멉 멋 멍 멎 멓 멌 며 멱 면 멸 몀 몁 몃 명 몇 몄 모 목 몫 몬 몯 몰 몲 몸 몹 못 몽 뫃 묘 묜 묠 묩 묫 무 묵 문 묻 물 묽 묾 뭄 뭅 뭇 뭉 뭍 뭏 묶 뮤 뮥 뮨 뮬 뮴 뮷 뮹 므 믄 믈 믐 믑 믓 믕 미 믹 민 믿 밀 밂 밈 밉 밋 밍 및 밑 밌 매 맥 맨 맬 맴 맵 맷 맹 맺 맸 먜
  • Rząd 24: 메 멕 멘 멜 멤 멥 멧 멩 멨 몌 몐 뫼 묀 묄 묌 묍 묏 묑 뮈 뮌 뮐 믜 믠 믬 뫄 뫈 뫙 뫘 뭐 뭔 뭘 뭠 뭡 뭣 뭤 뫠 뭬 바 박 밗 반 받 발 밝 밞 밟 밤 밥 밧 방 밭 밖 뱌 뱍 뱐 뱜 뱝 버 벅 번 벋 벌 벍 벎 범 법 벗 벙 벚 벜 벘 벼 벽 변 별 볌 볍 볏 병 볓 볕 볐 보 복 본 볼 봄 봅 봇 봉 봏 볶 뵤 뵨
  • Rząd 25. 비 빅 빈 빌 빎 빔 빕 빗 빙 빚 빛 배 백 밴 밷 밸 뱀 뱁 뱃 뱅 뱉 뱄 뱨 베 벡 벤 벧 벨 벰 벱 벳 벵 벴 볘 볜 뵈 뵉 뵌 뵐 뵘 뵙 뵜 뷔 뷕 뷘 뷜 뷩 븨 븬 븰 븽 봐 봔 봡 봣 봤 붜 붤 붯 붴 붰 봬 봰 뵀 붸
  • Rząd 26: 사 삭 삯 산 삳 살 삵 삶 삼 삽 삿 상 샅 샀 샤 샥 샨 샬 샴 샵 샷 샹 서 석 섟 선 섣 설 섦 섧 섬 섭 섯 성 섶 섞 섰 셔 셕 션 셜 셤 셥 셧 셩 셨 소 속 손 솓 솔 솖 솜 솝 솟 송 솥 솎 쇼 쇽 숀 숄 숌 숍 숏 숑 수 숙 순 숟 술 숨 숩 숫 숭 숯 숱 숲 슈 슉 슌 슐 슘 슙 슛 슝 스 슥 슨 슬 슭 슲 슳 슴
  • Rząd 27: 습 슷 승 시 식 신 싣 실 싫 심 십 싯 싱 싶 새 색 샌 샐 샘 샙 샛 생 샜 섀 섄 섈 섐 섕 세 섹 센 셀 셈 셉 셋 셍 셑 셒 셌 셰 셴 셸 솅 쇠 쇡 쇤 쇨 쇰 쇱 쇳 쇵 쇴 쉬 쉭 쉰 쉴 쉼 쉽 쉿 슁 싀 싄 솨 솩 솬 솰 솻 솽 숴 쉈 쇄 쇈 쇌 쇔 쇗 쇘 쉐 쉑 쉔 쉘 쉠 쉡 쉥 자 작 잔 잖 잗 잘 잚 잠 잡 잣 장
  • Rząd 28. 졌 조 족 존 졸 졺 좀 좁 좃 종 좆 좇 좋 죠 죡 죤 죨 죰 죵 주 죽 준 줄 줅 줆 줌 줍 줏 중 쥬 쥰 쥴 쥼 즁 즈 즉 즌 즐 즘 즙 즛 증 지 직 진 짇 질 짊 짐 집 짓 징 짖 짙 짚 재 잭 잰 잴 잼 잽 잿 쟁 쟀 쟤
  • Rząd 29: 쟨 쟬 제 젝 젠 젤 젬 젭 젯 젱 젶 젰 졔 졘 졜 죄 죈 죌 죔 죕 죗 죙 죘 쥐 쥑 쥔 쥗 쥘 쥠 쥡 쥣 즤 좌 좍 좐 좔 좝 좟 좡 줘 줬 좨 좽 좼 줴 줸 줼 쥄 쥅 쥈 차 착 찬 찮 찰 참 찹 찻 창 찾 찼 챠 챤 챦 챨 챰 챱 챵 처 척 첨 첩 첫 청 첬 쳐 쳑 쳔 쳘 쳤 초 촉 촌 촐 촘 촙 촛 총 쵸 쵼 춀 춈
  • Rząd 30: 추 축 춘 춛 출 춤 춥 춧 충 츄 츈 츌 츔 츙 츠 측 츤 츨 츰 츱 츳 층 치 칙 친 칟 칠 칡 침 칩 칫 칭 채 책 챈 챌 챔 챕 챗 챙 챘 챼 체 첵 첸 첼 쳄 춰 췃 췄 쵀 쵄 췌 췐 카 칵 칸 칼 캄 캅 캇 캉 캎 캈 캬 캭 캰
  • Rząd 31: 캼 캽 컁 커 컥 컨 컫 컬 컴 컵 컷 컹 컽 컾 컸 켜 켠 켤 켬 켭 켯 켱 켰 코 콕 콘 콜 콤 콥 콧 콩 쿄 쿠 쿡 쿤 쿨 쿰 쿱 쿵 큐 큔 큘 큠 크 큭 큰 클 큼 큽 킁 키 킥 킨 킬 킴 킵 킷 킹 킾 캐 캑 캔 캘 캠 캡 캣 캥 캪 캤 컈 케 켁 켄 켈 켐 켑 켓 켕 켸 쾨 쾰 퀴 퀵 퀸 퀼 큄 큅 큇 큉 킈 콰 콱 콴
  • Rząd 32. 터 턱 턴 털 턺 텀 텁 텃 텅 텄 텨 텬 텼 토 톡 톤 톨 톰 톱 톳 통 톺 툐 투 툭 툰 툴 툼 툽 툿 퉁 튜 튠 튤 튬 튱 트 특 튼 튿 틀 틂 틈 틉 틋 틍 티 틱 탤 탬 탭 탯 탱 탶 탰 턔
  • Wiersz 33. 퉈 퉜 퇘 퉤 퉨 퉸 파 팍 판 팔 팖 팜 팝 팟 팡 팥 팎 팠 퍄 퍅 퍼 퍽 펀 펄 펌 펍 펏 펑 펐 펴 펵 편 펼 폄 폅 폇 평 폈 포 폭 폰 폴 폼 폽 폿 퐁 표 푠 푤 푭 푯 푸 푹 푼 푿 풀 풂 품 풉 풋 풍 퓨 퓬 퓰 퓸
  • Wiersz 34. 펜 펠 펨 펩 펫 펭 펲 폐 폔 폘 폡 폣 푀 푄 퓌 퓐 퓔 퓜 퓟 픠 픤 퐈 퐝 풔 풩 하 학 한 할 핥 함 합 핫 항 햐 향 허 헉 헌 헐 헒 헕 헗 험 헙 헛 헝 혀 혁 현 혈 혐 협 혓 형 혔 호 혹 혼 혿 홀 홅 홈 홉 홋
  • Wiersz 35. 흙 흝 흠 흡 흣 흥 히 힉 힌 힐 힘 힙 힛 힝 해 핵 핸 핼 햄 햅 햇 행 했 햬 헤 헥 헨 헬 헴 헵 헷 헸 혜 혠 혤 혭 회 획 횐 횔 횝 횟 횡 휘 휙 휜 휠 휨 휩 휫 휭 희 흰 흴 흼 흽 힁 화 확 환 활 홤 홥
  • Wiersz 36: 홧 황 훠 훡 훤 훨 훰 훵 홰 홱 홴 횃 횅 횄 훼 훽 휀 휄 휑 까 깍 깐 깓 깔 깖 깜 깝 깟 깡 깥 깎 깠 꺄 꺅 꺈 꺌 꺼 꺽 껀 껄 껌 껍 껏 껑 꺾 껐 껴 껸 껼 꼇 꼍 꼈 꼬 꼭 꼰 꼱 꼲 꼴 꼼 꼽 꼿 꽁 꽂 꽃 꾜 꾸 꾹 꿇 꿈 꿉 꿋 꿍 꿎 뀨 끄 끅 끈 끊 끌 끎 끓 끔 끕 끗 끙 끝 끼 끽 낀 낄 낌
  • Rząd 37: 낍 낏 낑 깨 깩 깬 깰 깸 깹 깻 깽 깼 꺠 께 껙 껜 껠 껨 껩 껫 껭 껬 꼐 꾀 꾁 꾄 꾈 꾐 꾑 꾕 뀌 뀐 뀔 뀜 뀝 뀡 꽈 꽉 꽌 꽐 꽛 꽝 꽜 꿔 꿘 꿜 꿥 꿧 꿩 꿨 꽤 꽥 꽨 꽬 꽹 꿰 꿱 꿴 꿸 뀀 뀁 뀅 뀄 따 딱 딴 딸 딿 땀 땁 땃 땅 땋 딲 땄 땨 땰 떠 떡 떤 떨 떪 떫 떰 떱 떳 떵 떻 떴 뗘 뗬 또 똑 똔
  • Rząd 38. 띱 띳 띵 때 땍 땐 땔 땜 땝 땟 땡 땠 떼 떽 뗀 뗄 뗌 뗍 뗏 뗑 뗐 뙤 뙨 뛰 뛴 뛸 뜀 뜁 뜅 띄 띅 띈 띌 띔 띕 띙 똬 똰 똴 뚸 뛌 뙈 뙉 뛔 빠 빡 빤 빨 빪 빰 빱 빳 빵 빻 빴 뺘 뺙 뺜 뺨 뻐 뻑 뻔 뻗 뻘 뻠
  • Rząd 39. 쁑 쁘 쁜 쁠 쁨 쁩 삐 삑 삔 삘 삠 삡 삣 삥 빼 빽 뺀 뺄 뺌 뺍 뺏 뺑 뺐 뺴 뻬 뻭 뻰 뻴 뻼 뼁 뾔 쀠 쁴 뽜 뿨 싸 싹 싻 싼 쌀 쌈 쌉 쌋 쌍 쌓 쌌 쌰 쌴 쌸 썅 써 썩 썬 썰 썲 썸 썹 썻 썽 썪 썼 쎠 쏘 쏙 쏜
  • Rząd 40: 쏟 쏠 쏢 쏨 쏩 쏫 쏭 쑈 쑌 쑐 쑘 쑝 쑤 쑥 쑨 쑬 쑴 쑵 쑹 쓔 쓘 쓧 쓩 쓰 쓱 쓴 쓸 쓺 쓿 씀 씁 씅 씨 씩 씬 씯 씰 씸 씹 씻 씽 씼 쌔 쌕 쌘 쌜 쌤 쌥 쌧 쌩 쌨 썌 쎄 쎅 쎈 쎌 쎔 쎕 쎙 쎼 쏀 쐬 쐭 쐰 쐴 쐼 쐽 쑀 쒸 쒼 씌 씐 씔 씜 쏴 쏵 쏸 쏼 쐇 쐉 쐈 쒀 쒔 쐐 쐑 쐤 쒜 쒠 쒭 짜 짝 짠 짢 짤
  • Rząd 41: 짧 짬 짭 짯 짱 짰 쨔 쨘 쨤 쨩 쩌 쩍 쩐 쩔 쩗 쩜 쩝 쩟 쩡 쪼 쪽 쫀 쫄 쫌 쫍 쫏 쫑 쫒 쫓 쫗 쬬 쬰 쬼 쭁 쭈 쭉 쭌 쭐 쭘 쭙 쭛 쭝 쮸 쯀 쯔 쯕 쯘 쯜 쯤 쯧 쯩 쯪 찌 찍 찐 찔 찜 찝 찟 찡 찢 찦 찧 째 짹 짼 쨀 쨈 쨉 쨋 쨍 쨌 쨰 쨴 쩨 쩩 쩬 쩰 쩸 쩹 쩽 쪠 쬐 쬔 쬘 쬠 쬡 쬤 쮜 쯰 쯴
  • Rząd 42: 쫘 쫙 쫜 쫠 쫭 쫬 쭤 쭹 쭸 쫴 쬈 쮀 아 악 안 앉 않 알 앍 앎 앒 앓 암 압 앗 앙 앝 앞 앟 았 야 약 얀 얃 얄 얇 얌 얍 얏 양 얕 얗 얐 어 억 언 얹 얻 얼 얽 얾 엄 업 없 엇 엉 엊 엌 엎 엏 었 여 역 연 엳 열 엶 엷 염 엽 엾 엿 영 옅 옆 옇 엮 였 오 옥 온 올 옭 옮 옰 옳 옴 옵 옷 옹 옻 옾 요 욕
  • Wiersz 43. 을 읅 읊 음 읍 읏 응 읒 읓 읔 읕 읖 읗 이 익 인 일 읽 읾 잃 임 입 잇 잉 잊 잎 있 애 액 앤 앨 앰 앱 앳 앵 앴 얘 얜 얠 얩 에 엑 엔 엘 엠 엡 엣 엥 엤 예 옌 옐 옘 옙 옛 옝 옜 외 왹 왼 욀 욈 욉 욋 욍
  • Wiersz 44. 웟 웡 웠 왜 왝 왠 왬 왯 왱 웨 웩 웬 웰 웸 웹 웻 웽 윁

Zestawy Hanja (rzędy od 45 do 94)

Hanja pod adresem 69-09 (0xE5A9) jest mapowana na U + 676E we wszystkich udokumentowanych tabelach; znaki są jednak uporządkowane zgodnie z ich odczytami, z których wynika, że ​​zamiast tego ma to być U + 67FF .

Rozszerzone zestawy bezsylabowe, inne niż hanja w KPS 9566:2011

Poniżej znajdują się wykresy dla bezsylabowej, nie-hanja sekcji KPS 9566-2011 poza główną płaszczyzną.

Zestaw rozszerzeń 0xE0 (symbole i piktogramy)

KPS 9566-2011 (z prefiksem 0xE0)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
25D1

2298

2709

☛261B _

261E

✌270C _
5x
270D

270F

270E

2710

2713

2714

22A1

2394
6x
2299
7x
⚓︎ 2693

263C
8x
25C9
9x
272A

272F

272C

272B

272E

272D

2730

2729
 Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestawy rozszerzeń 0xE1, 0xE2, 0xE3 (nieznane)

Te zestawy rozszerzeń są mapowane na obszar użytku prywatnego. Ich cel nie jest udokumentowany.

KPS 9566-2011 (z prefiksem 0xE1)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
5x
6x
7x
8x
9x
Topór (Część płaszczyzny głównej.)
 Nie w Unicode, zmapowane do obszaru użytku prywatnego
KPS 9566-2011 (z prefiksem 0xE2)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
5x
6x
7x
8x
9x
  Nie w Unicode, zmapowane do obszaru użytku prywatnego
KPS 9566-2011 (z prefiksem 0xE3)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
5x
6x
7x
8x
9x
  Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE4 (strzałki)

Ten zestaw zawiera kilka, głównie strzałek w prawo, mapujących do bloku Unicode Dingbats i gdzie indziej.

KPS 9566-2011 (z prefiksem 0xE4)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
2794

2798

2799

279A

279B

279C

279D

279F

27A0

27A2

27A3

27A4

27A5

27A6

27A7
5x
27A8

27A9

27AA

27AB

27 AC

27 n.e

27AE

27 AF

27B1

27B2

27B3
6x
27B4

27B5

27B6

27B7

27B8

27B9

27BA

27BB

27BE

27 pne

27BD
7x
8x
27F7

21CC

296B

296C

21D0

27F9
9x
 Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE5 (rzymskie indeksy górne i dolne)

Ten wiersz zawiera kilka rzymskich indeksów górnych pisanych małymi literami z bajtami końcowymi odpowiadającymi ich odpowiednikom ASCII pisanym dużymi literami oraz rzymskimi indeksami dolnymi pisanymi małymi literami z bajtami końcowymi odpowiadającymi ich odpowiednikom ASCII pisanym małymi literami.

KPS 9566-2011 (z prefiksem 0xE5)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
1D43

1D47

1D9C

1D48

1D49

1DA0

1D4D

1D4F

1K50

207F

1D52
5x
1D56

1D57

1D58

1D5B
6x
2090
2091 jenów

1D62

2C7C

2092
7x
1D63

1D64

1D65

2093
8x
9x
 Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE6 (grecki i indeksy górne i dolne symboli)

KPS 9566-2011 (z prefiksem 0xE6)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
1D45

1D5D

1D5E

1D5F

1D4B

ᶿ 1DBF

1DB9
5x
1K60

1D61
6x
1D66

1D67
7x
1D68

1D69

1D6A
8x
207A

207b
9x
208A

208B
 Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE7 (dalsze znaczniki listy)

KPS 9566-2011 (z prefiksem 0xE7)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
325B

325C

325D

325E

㉟325F _

32B1

32B2

32B3

32B4

32B5

32B6

32B7

32B8

32B9

㊺32BA _
5x
32BB

32 pne

32BD

32 p.n.e

32BF
6x
7x
8x
9x
  Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE8

KPS 9566-2011 (z prefiksem 0xE8)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
5x
6x
7x
8x
FE30
9x
  Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xE9 (dodatkowe symbole i interpunkcja)

Ten zestaw zawiera symbole kolorów kart do gry, różne różne symbole i odpowiedniki o połowie szerokości dla niektórych symboli walut w 8 rzędzie . Uwzględniono również znak Kelvina, który w wierszu 8 został zastąpiony znakiem euro .

KPS 9566-2011 (z prefiksem 0xE9)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
2205

2297

3013

2667

2661

2664

2662

25EF

29BE
5x
6x
7x
8x
K 212A

20A9

20A4

¥ 00A5
9x
  Nie w Unicode, zmapowane do obszaru użytku prywatnego

Zestaw rozszerzeń 0xEA (japońska interpunkcja i dodatkowe jamo)

Ten zestaw zawiera kilka znaków interpunkcyjnych używanych w Japonii oraz niektóre znaki z bloku Unicode zgodności Hangul Jamo , które nie są jeszcze uwzględnione w wierszu 4 . Obejmuje to niektóre znaki jamo obecne w KS X 1001 , ale wcześniej nieobecne w KPS 9566.

KPS 9566-2011 (z prefiksem 0xEA)
0 1 2 3 4 5 6 7 8 9 A B C D mi F
4x
30FD

30FE

309D _

309E _

々3005 _

〆3006 _

〇3007 _

30FC
5x
6x
3165

316D

3171

3172

3173

3174

3175

3176

3177

3178

3179

317A

317B

317D

317E
7x
3180

3184

3185

3187

3188

3189

318A

318B

318C

119E

318E
8x
9x
  Nie w Unicode, zmapowane do obszaru użytku prywatnego

przypisy

Linki zewnętrzne