ISO/IEC 8859-11
ISO / IEC 8859-11:2001 , Informatyka — 8-bitowe jednobajtowe kodowane zestawy znaków graficznych — Część 11: alfabet łaciński/tajski , jest częścią serii ISO/IEC 8859 standardowych kodowań znaków opartych na ASCII , wydanie pierwsze opublikowany w 2001 roku. Jest nieformalnie określany jako Latin / Thai . Jest prawie identyczny z krajową normą tajlandzką TIS-620 (1990). Jedyna różnica polega na tym, że ISO/IEC 8859-11 przydziela nierozdzielną przestrzeń dla kodu 0xA0, podczas gdy TIS-620 pozostawia ją niezdefiniowaną. (W praktyce to małe rozróżnienie jest zwykle ignorowane).
ISO-8859-11 nie jest główną zarejestrowaną nazwą zestawu znaków IANA, mimo że jest zgodny z normalnym wzorcem zestawów znaków IANA opartym na serii ISO 8859 . Jest jednak zdefiniowany jako alias bliskiego odpowiednika TIS-620 (w którym brakuje spacji nierozdzielającej) i którego można bez problemów używać w ISO/IEC 8859-11, ponieważ spacja nierozdzielająca ma kod, który był nieprzydzielony w TIS-620. Microsoft przypisał stronę kodową 28601, czyli Windows-28601 , do ISO-8859-11 w systemie Windows. Szkic miał tajskie litery w różnych miejscach.
Podobnie jak w przypadku wszystkich odmian ISO/IEC 8859, dolne 128 kodów odpowiada kodom ASCII . Dodatkowe znaki, oprócz spacji bez przerw, występują w Unicode w tej samej kolejności, tylko przesunięte z 0xA1 do U+0E01 i tak dalej.
Microsoft Windows 874 , jak również strona kodowa używana w tajskiej wersji Apple Macintosh , MacThai , to warianty TIS-620 — jednak niekompatybilne ze sobą.
Zestaw znaków
ISO/IEC 8859-11 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
0x | ||||||||||||||||
1x | ||||||||||||||||
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | mi | F | G | H | I | J | k | Ł | M | N | O |
5x | P | Q | R | S | T | u | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | A | B | C | D | mi | F | G | H | I | J | k | l | M | N | o |
7x | P | Q | R | S | T | u | w | w | X | y | z | { | | | } | ~ | |
8x | ||||||||||||||||
9x | ||||||||||||||||
Topór | NBSP | ก | ข | ฃ | ¸ | ฅ | ฆ | § | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
Bx | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
Cx | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
Dx | ะ | ◌ั | า | ำ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌ุ | ◌ู | ◌ฺ | ฿ | ||||
Były | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌็ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌ํ | ◌๎ | ๏ |
Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ |
Wartości kodów D1, D4-DA, E7-EE to kombinacje znaków .
Rozszerzenia dostawców
Strona kodowa 874 (IBM) / 9066
Strona kodowa IBM 874 ( CP874 , IBM-874 , x-IBM874 ), znana również jako strona kodowa 9066 ( IBM-9066 ), różni się od ISO / IEC 8859-11 tylko dziewięcioma symbolami przedstawionymi w ramkach w poniższej tabeli:
Strona kodowa IBM 874/9066 (różnice od ISO-8859-11) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
Topór | ◌่ | ก | ข | ฃ | ¸ | ฅ | ฆ | § | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
Bx | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
Cx | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
Dx | ะ | ◌ั | า | ำ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌ุ | ◌ู | ◌ฺ | ◌้︀ | ◌๊︀ | ◌๋︀ | ◌์︀ | ฿ |
Były | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌็ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌ํ | ◌๎ | ๏ |
Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ¢ | ¬ | ¦ | NBSP |
Strona kodowa 1161
Strona kodowa 1161 ( CP1161 , IBM-1161 ), jest wariantem strony kodowej IBM 874. Jedyną różnicą jest znak euro (€) w pozycji DE hex (222).
Strona kodowa 874 (Microsoft) / 1162
Strona kodowa Windows 874 ( windows-874 , MS874 , x-windows-874 ), znana jako strona kodowa 1162 ( CP1162 , IBM-1162 ) przez IBM, jest używana przez Microsoft Windows. Różni się od ISO/IEC 8859-11 tylko dziewięcioma symbolami, jak pokazano w poniższej tabeli:
Strona kodowa 1162 (IBM) / 874 (Microsoft): różnica w stosunku do ISO-8859-11 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
8x | € | … | ||||||||||||||
9x | ' | ' | “ | ” | • | – | — |
Mac OS tajski
Jest to wariant używany w klasycznym systemie Mac OS .
Mac OS tajski | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
8x | « | » | … | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | “ | ” | ◌ํ |
9x | • | ◌ั | ◌็ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ' | ' | ||
Topór | NBSP | ก | ข | ฃ | ¸ | ฅ | ฆ | § | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ |
Bx | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
Cx | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
Dx | ะ | ◌ั | า | ำ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌ุ | ◌ู | ◌ฺ | WJ | ZWSP | – | — | ฿ |
Były | เ | แ | โ | ใ | ไ | ๅ | ๆ | ◌็ | ◌่ | ◌้ | ◌๊ | ◌๋ | ◌์ | ◌ํ | ™ | ๏ |
Fx | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ® | © |
Zobacz też
przypisy
Linki zewnętrzne
- ISO/IEC 8859-11:2001
- ISO / IEC 8859-11: 1999 - 8-bitowe jednobajtowe kodowane zestawy znaków graficznych, część 11: zestaw znaków łacińskich / tajskich (projekt z 22 czerwca 1999 r.; zastąpiony przez ISO / IEC 8859-11: 2001, opublikowany 15 grudnia , 2001)
- Strona kodowa systemu Windows 874
- Tajski zestaw znaków ISO-IR 166 (13 lipca 1992, z Thai Standard TIS 620-2533 (1990))
- Standaryzacja i implementacje języka tajskiego PDF 175 tys