VISCII

VISCII
MIME / IANA VISCII
Języki) wietnamski , angielski
Stworzone przez Grupa Viet-Std
Definicje   RFC1456 _
Klasyfikacja 8-bitowy SBCS
Oparte na ASCII

VISCII to nieoficjalnie zdefiniowane zmodyfikowane kodowanie znaków ASCII do używania języka wietnamskiego z komputerami . Nie należy go mylić z podobnie nazwanym, oficjalnie zarejestrowanym VSCII . VISCII zachowuje niezmodyfikowane 95 drukowalnych znaków ASCII, ale zastępuje 6 z 33 znaków kontrolnych znakami drukowalnymi. Dodaje 128 wstępnie skomponowanych znaków . Unicode i strona kodowa Windows-1258 są obecnie używane dla praktycznie wszystkich wietnamskich danych komputerowych, [ potrzebne źródło ] , ale starsze pliki VSCII i VISCII mogą wymagać konwersji.

Historia i nazewnictwo

VISCII został zaprojektowany przez wietnamską grupę roboczą ds. normalizacji (Viet-Std Group) kierowaną przez Christophera Cuonga T. Nguyena, Cuonga M. Bui i Hoc D. Ngo z siedzibą w Dolinie Krzemowej w Kalifornii w 1992 r., podczas gdy oni pracowali z konsorcjum Unicode nad zawierać wstępnie skomponowane wietnamskie znaki w standardzie Unicode. VISCII wraz z VIQR , został po raz pierwszy opublikowany w dwujęzycznym raporcie we wrześniu 1992 r., w którym został nazwany „wietnamskim standardowym kodem wymiany informacji”. W raporcie odnotowano wzrost wykorzystania komputerów w Wietnamie i rosnącą liczbę komunikacji komputerowej wśród Wietnamczyków za granicą, że istniejące aplikacje wykorzystywały kodowanie specyficzne dla dostawcy, które nie było w stanie ze sobą współpracować, w związku z czym konieczna była standaryzacja między dostawcami . Pomyślne włączenie złożonego i wstępnie skomponowanego języka wietnamskiego do Unicode 1.0 było wynikiem wniosków wyciągniętych z rozwoju 8-bitowego VISCII i 7-bitowego VIQR.

W następnym roku, w 1993, Wietnam przyjął TCVN 5712 , swój pierwszy krajowy standard w dziedzinie technologii informatycznych . To zdefiniowało kodowanie znaków o nazwie VSCII , które zostało opracowane przez Komitet Techniczny TCVN ds. Technologii Informatycznych (TCVN / TC1), a jego nazwa oznacza „Wietnamski standardowy kod wymiany informacji”. VSCII jest niekompatybilny z wcześniej opublikowanym VISCII, a poza tym nie jest z nim powiązany. W przeciwieństwie do VISCII, VSCII jest „normą wietnamską” w sensie normy krajowej .

  VISCII i VIQR zostały zatwierdzone jako RFC 1456 o statusie informacyjnym , przypisane grupie Viet-Std i datowane na maj 1993 r. Podobnie jak w przypadku RFC IETF, RFC 1456 odnotowuje, że są to „konwencje” używane przez wietnamskich mówców z zagranicy w Usenecie , i że „nie określa żadnego poziomu standardu”. Mimo to nadal nazywa VISCII „wietnamskim standardowym kodem wymiany informacji” (ta sama nazwa została przyjęta przez VSCII). Etykiety VISCII i csVISCII są zarejestrowane w IANA dla VISCII, w odniesieniu do RFC 1456. (Z drugiej strony nie ma oficjalnej etykiety IANA dla TCVN 5712 / VSCII, chociaż x-viet-tcvn5712 był wcześniej obsługiwany przez Mozilla Firefox .)

Projekt

Tradycyjny rozszerzony zestaw znaków ASCII składa się z zestawu ASCII plus maksymalnie 128 znaków. Wietnamski wymaga 134 dodatkowych kombinacji liter i znaków diakrytycznych, czyli o sześć za dużo. Istnieją (oprócz obsługi znaków opuszczania tonu dla wielkich liter, jak w VSCII-3 ) zasadniczo cztery różne sposoby radzenia sobie z tym problemem:

  1. Użyj kodowania o zmiennej szerokości (podobnie jak UTF-8 )
  2. Uwzględnij łączenie znaków diakrytycznych dla znaków tonowych (jak VSCII-2 i Windows-1258 ) lub ogólnie dla znaków diakrytycznych (jak robią to ANSEL i VNI )
  3. Zastąp niektóre znaki interpunkcyjne ASCII, najlepiej interpunkcyjne, które nie są niezmienne w ISO 646 (podobnie jak VNI dla DOS )
  4. Zastąp co najmniej sześć podstawowych znaków sterujących ASCII (podobnie jak VPS i VSCII-1 )

VISCII zdecydował się na ostatnią opcję, zastępując sześć najmniej problematycznych (np. najmniej prawdopodobnych do rozpoznania przez aplikację i specjalnego działania) kodów kontrolnych C0 (STX, ENQ, ACK, DC4, EM i RS) sześcioma z najmniej używane kombinacje wielkich liter i znaków diakrytycznych. Chociaż ta opcja może powodować nieprawidłowe działanie programów korzystających z tych kodów kontrolnych podczas obsługi tekstu VISCII, stwarza mniej komplikacji niż pozostałe dwie opcje (projektanci zauważają, że nie-8-bitowa czysta transmisja okazała się stwarzać większe trudności w praktyce niż ponowne użycie znaków kontrolnych). Niemniej jednak lokalizacje zarówno znaków kontrolnych C0, jak i C1 oraz kodów używanych do spacje nierozdzielające w ISO-8859-1 , Mac OS Roman i OEM-US zostały celowo przypisane do wielkich liter, z zamiarem wykorzystania małych liter z czcionką pisanymi wielkimi literami jako użytecznego obejścia, gdyby nie można było wyświetlić znaków graficznych za te kody.

Jednak wykorzystanie wszystkich rozszerzonych punktów kodowych dla liter akcentowanych nie pozostawiło miejsca na dodanie użytecznych symboli, liczb w indeksie górnym, zakrzywionych cudzysłowów, właściwych myślników itp., Podobnie jak większość innych rozszerzonych zestawów znaków ASCII.

Umiejscowienie znaków celowo jest w większości zgodne z normą ISO-8859-1 , gdzie między dwiema stronami kodowymi występują znaki wspólne ( wyjątek stanowi wielka litera Õ ), motywowane względami przyjazności dla użytkownika.

Wsparcie

VISCII jest częściowo wspierany przez TriChlor Software Group w Kalifornii, która wydała różne pakiety oprogramowania zgodne z VISCII, biblioteki i czcionki dla MS-DOS, Windows, Unix i Macintosh. Oprogramowanie zgodne ze standardem VISCII jest dostępne w wielu witrynach FTP .

VISCII był historycznie oferowany jako kodowanie poczty wychodzącej przez Mozillę Thunderbird . Był również obsługiwany przez wietnamskie oprogramowanie klawiatury Windows, WinVNKey, stworzone przez Christophera Cuonga T. Nguyena, a później zaktualizowane w różnych wersjach systemu Windows przez Hoc D. Ngo i innych.

VISCII był używany głównie przez wietnamskich mówców z zagranicy, przy czym VSCII (TCVN) był bardziej popularny w północnym Wietnamie, a VNI w południowym Wietnamie.

Zestaw znaków

VISCII
0 1 2 3 4 5 6 7 8 9 A B C D mi F
0x NUL SOH
1EB2
ETX OT
1EB4

1EAA
BEL BS HT LF VT FF CR WIĘC SI
1x DLE DC1 ST2 DC3
1EF6
NAK SYN ETB MÓC
1EF8
POD WYJŚCIE FS GS
1EF4
NAS
2x  Sp  ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D mi F G H I J k Ł M N O
5x P Q R S T u V W X Y Z [ \ ] ^ _
6x ` A B C D mi F G H I J k l M N o
7x P Q R S T u w w X y z { | } ~ DEL
8x
1EA0

1EAE

1EB0

1EB6

1EA4

1EA6

1EA8

1EAC

1EBC

1EB8

1EBE

1EC0

1EC2 _

1EC4

1EC6

1ED0
9x
1ED2

1ED4

1ED6 _

1ED8

1EE2 _

1EDA

1EDC

1EDE

1ECA _

1ECE

1ECC _

1EC8

1EE6

Ũ 0168

1EE4

1EF2
Topór
00D5 _

1EAF

1EB1

1EB7

1EA5

1EA7

1EA9

1EAD

1EBD

1EB9

ế 1EBF

1EC1

1EC3

1EC5

1EC7 _

1ED1
Bx
1ED3

1ED5

1ED7

1EE0 _

01A0 _

1ED9

1EDD

1EDF

1ECB

1EF0

1EE8

1EOG

1 EWG

01A1 _

1EDB

01AF _
Cx A A A A
1EA2

Ă 0102

1EB3

1EB5
MI MI MI
1EBA
I I
Ĩ 0128

1EF3
Dx
Đ 0110

1EE9
Ò O Ô
1EA1

1EF7

1EEB

1EED
Ù U
1EF9

1EF5
Ý
1EE1

01B0 _
Były A A A A
1EA3

ă 0103

1EEF

1EAB
mi mi mi
1EBB
I I
ĩ 0129

1EC9
Fx
đ 0111

1EF1
O ó ô õ
1ECF

1ECD

1EE5
u u
ũ 0169

1EE7
ý
1EE3

1EEE
  Różnice w stosunku do ISO-8859-1

Zobacz też

Dalsza lektura

Linki zewnętrzne