VISCII
MIME / IANA | VISCII |
---|---|
Języki) | wietnamski , angielski |
Stworzone przez | Grupa Viet-Std |
Definicje | RFC1456 _ |
Klasyfikacja | 8-bitowy SBCS |
Oparte na | ASCII |
VISCII to nieoficjalnie zdefiniowane zmodyfikowane kodowanie znaków ASCII do używania języka wietnamskiego z komputerami . Nie należy go mylić z podobnie nazwanym, oficjalnie zarejestrowanym VSCII . VISCII zachowuje niezmodyfikowane 95 drukowalnych znaków ASCII, ale zastępuje 6 z 33 znaków kontrolnych znakami drukowalnymi. Dodaje 128 wstępnie skomponowanych znaków . Unicode i strona kodowa Windows-1258 są obecnie używane dla praktycznie wszystkich wietnamskich danych komputerowych, [ potrzebne źródło ] , ale starsze pliki VSCII i VISCII mogą wymagać konwersji.
Historia i nazewnictwo
VISCII został zaprojektowany przez wietnamską grupę roboczą ds. normalizacji (Viet-Std Group) kierowaną przez Christophera Cuonga T. Nguyena, Cuonga M. Bui i Hoc D. Ngo z siedzibą w Dolinie Krzemowej w Kalifornii w 1992 r., podczas gdy oni pracowali z konsorcjum Unicode nad zawierać wstępnie skomponowane wietnamskie znaki w standardzie Unicode. VISCII wraz z VIQR , został po raz pierwszy opublikowany w dwujęzycznym raporcie we wrześniu 1992 r., w którym został nazwany „wietnamskim standardowym kodem wymiany informacji”. W raporcie odnotowano wzrost wykorzystania komputerów w Wietnamie i rosnącą liczbę komunikacji komputerowej wśród Wietnamczyków za granicą, że istniejące aplikacje wykorzystywały kodowanie specyficzne dla dostawcy, które nie było w stanie ze sobą współpracować, w związku z czym konieczna była standaryzacja między dostawcami . Pomyślne włączenie złożonego i wstępnie skomponowanego języka wietnamskiego do Unicode 1.0 było wynikiem wniosków wyciągniętych z rozwoju 8-bitowego VISCII i 7-bitowego VIQR.
W następnym roku, w 1993, Wietnam przyjął TCVN 5712 , swój pierwszy krajowy standard w dziedzinie technologii informatycznych . To zdefiniowało kodowanie znaków o nazwie VSCII , które zostało opracowane przez Komitet Techniczny TCVN ds. Technologii Informatycznych (TCVN / TC1), a jego nazwa oznacza „Wietnamski standardowy kod wymiany informacji”. VSCII jest niekompatybilny z wcześniej opublikowanym VISCII, a poza tym nie jest z nim powiązany. W przeciwieństwie do VISCII, VSCII jest „normą wietnamską” w sensie normy krajowej .
VISCII i VIQR zostały zatwierdzone jako RFC 1456 o statusie informacyjnym , przypisane grupie Viet-Std i datowane na maj 1993 r. Podobnie jak w przypadku RFC IETF, RFC 1456 odnotowuje, że są to „konwencje” używane przez wietnamskich mówców z zagranicy w Usenecie , i że „nie określa żadnego poziomu standardu”. Mimo to nadal nazywa VISCII „wietnamskim standardowym kodem wymiany informacji” (ta sama nazwa została przyjęta przez VSCII). Etykiety VISCII
i csVISCII
są zarejestrowane w IANA dla VISCII, w odniesieniu do RFC 1456. (Z drugiej strony nie ma oficjalnej etykiety IANA dla TCVN 5712 / VSCII, chociaż x-viet-tcvn5712
był wcześniej obsługiwany przez Mozilla Firefox .)
Projekt
Tradycyjny rozszerzony zestaw znaków ASCII składa się z zestawu ASCII plus maksymalnie 128 znaków. Wietnamski wymaga 134 dodatkowych kombinacji liter i znaków diakrytycznych, czyli o sześć za dużo. Istnieją (oprócz obsługi znaków opuszczania tonu dla wielkich liter, jak w VSCII-3 ) zasadniczo cztery różne sposoby radzenia sobie z tym problemem:
- Użyj kodowania o zmiennej szerokości (podobnie jak UTF-8 )
- Uwzględnij łączenie znaków diakrytycznych dla znaków tonowych (jak VSCII-2 i Windows-1258 ) lub ogólnie dla znaków diakrytycznych (jak robią to ANSEL i VNI )
- Zastąp niektóre znaki interpunkcyjne ASCII, najlepiej interpunkcyjne, które nie są niezmienne w ISO 646 (podobnie jak VNI dla DOS )
- Zastąp co najmniej sześć podstawowych znaków sterujących ASCII (podobnie jak VPS i VSCII-1 )
VISCII zdecydował się na ostatnią opcję, zastępując sześć najmniej problematycznych (np. najmniej prawdopodobnych do rozpoznania przez aplikację i specjalnego działania) kodów kontrolnych C0 (STX, ENQ, ACK, DC4, EM i RS) sześcioma z najmniej używane kombinacje wielkich liter i znaków diakrytycznych. Chociaż ta opcja może powodować nieprawidłowe działanie programów korzystających z tych kodów kontrolnych podczas obsługi tekstu VISCII, stwarza mniej komplikacji niż pozostałe dwie opcje (projektanci zauważają, że nie-8-bitowa czysta transmisja okazała się stwarzać większe trudności w praktyce niż ponowne użycie znaków kontrolnych). Niemniej jednak lokalizacje zarówno znaków kontrolnych C0, jak i C1 oraz kodów używanych do spacje nierozdzielające w ISO-8859-1 , Mac OS Roman i OEM-US zostały celowo przypisane do wielkich liter, z zamiarem wykorzystania małych liter z czcionką pisanymi wielkimi literami jako użytecznego obejścia, gdyby nie można było wyświetlić znaków graficznych za te kody.
Jednak wykorzystanie wszystkich rozszerzonych punktów kodowych dla liter akcentowanych nie pozostawiło miejsca na dodanie użytecznych symboli, liczb w indeksie górnym, zakrzywionych cudzysłowów, właściwych myślników itp., Podobnie jak większość innych rozszerzonych zestawów znaków ASCII.
Umiejscowienie znaków celowo jest w większości zgodne z normą ISO-8859-1 , gdzie między dwiema stronami kodowymi występują znaki wspólne ( wyjątek stanowi wielka litera Õ ), motywowane względami przyjazności dla użytkownika.
Wsparcie
VISCII jest częściowo wspierany przez TriChlor Software Group w Kalifornii, która wydała różne pakiety oprogramowania zgodne z VISCII, biblioteki i czcionki dla MS-DOS, Windows, Unix i Macintosh. Oprogramowanie zgodne ze standardem VISCII jest dostępne w wielu witrynach FTP .
VISCII był historycznie oferowany jako kodowanie poczty wychodzącej przez Mozillę Thunderbird . Był również obsługiwany przez wietnamskie oprogramowanie klawiatury Windows, WinVNKey, stworzone przez Christophera Cuonga T. Nguyena, a później zaktualizowane w różnych wersjach systemu Windows przez Hoc D. Ngo i innych.
VISCII był używany głównie przez wietnamskich mówców z zagranicy, przy czym VSCII (TCVN) był bardziej popularny w północnym Wietnamie, a VNI w południowym Wietnamie.
Zestaw znaków
VISCII | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | mi | F | |
0x | NUL | SOH |
Ẳ 1EB2 |
ETX | OT |
Ẵ 1EB4 |
Ẫ 1EAA |
BEL | BS | HT | LF | VT | FF | CR | WIĘC | SI |
1x | DLE | DC1 | ST2 | DC3 |
Ỷ 1EF6 |
NAK | SYN | ETB | MÓC |
Ỹ 1EF8 |
POD | WYJŚCIE | FS | GS |
Ỵ 1EF4 |
NAS |
2x | Sp | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | mi | F | G | H | I | J | k | Ł | M | N | O |
5x | P | Q | R | S | T | u | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | A | B | C | D | mi | F | G | H | I | J | k | l | M | N | o |
7x | P | Q | R | S | T | u | w | w | X | y | z | { | | | } | ~ | DEL |
8x |
Ạ 1EA0 |
Ắ 1EAE |
Ằ 1EB0 |
Ặ 1EB6 |
Ấ 1EA4 |
Ầ 1EA6 |
Ẩ 1EA8 |
Ậ 1EAC |
Ẽ 1EBC |
Ẹ 1EB8 |
Ế 1EBE |
Ề 1EC0 |
1EC2 _ |
Ễ 1EC4 |
Ệ 1EC6 |
Ố 1ED0 |
9x |
Ồ 1ED2 |
Ổ 1ED4 |
1ED6 _ |
Ộ 1ED8 |
1EE2 _ |
Ớ 1EDA |
Ờ 1EDC |
Ở 1EDE |
1ECA _ |
Ỏ 1ECE |
1ECC _ |
Ỉ 1EC8 |
Ủ 1EE6 |
Ũ 0168 |
Ụ 1EE4 |
Ỳ 1EF2 |
Topór |
00D5 _ |
ắ 1EAF |
ằ 1EB1 |
ặ 1EB7 |
ấ 1EA5 |
ầ 1EA7 |
ẩ 1EA9 |
ậ 1EAD |
ẽ 1EBD |
ẹ 1EB9 |
ế 1EBF |
ề 1EC1 |
ể 1EC3 |
ễ 1EC5 |
1EC7 _ |
ố 1ED1 |
Bx |
ồ 1ED3 |
ổ 1ED5 |
ỗ 1ED7 |
1EE0 _ |
01A0 _ |
ộ 1ED9 |
ờ 1EDD |
ở 1EDF |
ị 1ECB |
Ự 1EF0 |
Ứ 1EE8 |
Ừ 1EOG |
Ử 1 EWG |
01A1 _ |
ớ 1EDB |
01AF _ |
Cx | A | A | A | A |
Ả 1EA2 |
Ă 0102 |
ẳ 1EB3 |
ẵ 1EB5 |
MI | MI | MI |
Ẻ 1EBA |
I | I |
Ĩ 0128 |
ỳ 1EF3 |
Dx |
Đ 0110 |
ứ 1EE9 |
Ò | O | Ô |
ạ 1EA1 |
ỷ 1EF7 |
ừ 1EEB |
ử 1EED |
Ù | U |
ỹ 1EF9 |
ỵ 1EF5 |
Ý |
ỡ 1EE1 |
01B0 _ |
Były | A | A | A | A |
ả 1EA3 |
ă 0103 |
ữ 1EEF |
ẫ 1EAB |
mi | mi | mi |
ẻ 1EBB |
I | I |
ĩ 0129 |
ỉ 1EC9 |
Fx |
đ 0111 |
ự 1EF1 |
O | ó | ô | õ |
ỏ 1ECF |
ọ 1ECD |
ụ 1EE5 |
u | u |
ũ 0169 |
ủ 1EE7 |
ý |
ợ 1EE3 |
Ữ 1EEE |
Zobacz też
- ASCII
- Wietnamski cytowany do odczytu (VIQR)
- Wietnamski standardowy kod wymiany informacji (VSCII)
- Windows-1258
Dalsza lektura
- Flohr, Guido (2016) [2006]. "Locale::RecodeData::VISCII - Procedury konwersji dla VISCII" . CPAN libintl-perl . Zarchiwizowane od oryginału w dniu 14.01.2017 . Źródło 2017-01-14 .
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
Linki zewnętrzne
- RFC 1456 — Konwencje dotyczące kodowania języka wietnamskiego
- Wietnamska Grupa Robocza ds. Standaryzacji z siedzibą w Kalifornii
- Raport Viet-Std 1992
- Oprogramowanie AnGiang
- Oprogramowanie i czcionki zgodne ze standardem VISCII dla systemów MS-DOS i Windows
- Oprogramowanie zgodne ze standardem VISCII, biblioteki i czcionki dla systemu Unix
- WinVNKey , wietnamski sterownik klawiatury dla systemu Windows obsługujący wielonarodowe zestawy znaków, w tym VISCII
- MacVNKey , sterownik klawiatury zgodny ze standardem VISCII dla Macintosh classic