Tagi (blok Unicode)

Tagi
Zakres
U+E0000..U+E007F (128 punktów kodowych)
Samolot SSP
Skrypty Wspólny
Przydzielony 97 punktów kodowych
Nie używany
31 zarezerwowanych punktów kodowych 1 wycofane
Historia wersji Unicode
3,1 (2001) 97 (+97)
Uwaga :

Tagi to blok Unicode zawierający formatujące znaki znaczników. Blok jest przeznaczony do odzwierciedlania ASCII . Pierwotnie był przeznaczony do tagów językowych, ale teraz został ponownie wykorzystany jako modyfikatory emoji, szczególnie dla flag regionów.

Starsze użycie

U+E0001, U+E0020–U+E007F były pierwotnie przeznaczone do niewidocznego oznaczania tekstów według języka, ale takie użycie nie jest już zalecane. Wszystkie te znaki zostały wycofane w Unicode 5.1.

Wraz z wydaniem Unicode 8.0 znaki U+E0020–U+E007E nie są już przestarzałymi znakami. Zmiana została wprowadzona „aby utorować drogę do potencjalnego wykorzystania znaków znaczników w przyszłości do celów innych niż reprezentowanie znaczników językowych”. Unicode stwierdza, że ​​​​„użycie znaków znaczników do reprezentowania znaczników językowych w strumieniu zwykłego tekstu jest nadal przestarzałym mechanizmem przekazywania informacji językowych o tekście”.

Obecne wykorzystanie

Wraz z wydaniem Unicode 9.0, U+E007F nie jest już przestarzałym znakiem. (ZNAK JĘZYKA U + E0001 pozostaje przestarzały). Wydanie Emoji 5.0 w maju 2017 r. Uznaje te znaki za emotikony do użycia jako modyfikatory w specjalnych sekwencjach.

Jedynym określonym zastosowaniem jest reprezentowanie flag regionów, obok użycia regionalnych symboli wskaźników dla flag narodowych. Sekwencje te składają się z U+1F3F4 🏴 WAVING BLACK FLAG , po którym następuje sekwencja znaczników odpowiadających regionowi zakodowanemu w CLDR , a następnie U+E007F CANCEL TAG . Na przykład użycie tagów dla „gbeng” (🏴구연이이은 저 저 저 저 저 저 저 바저 ) spowoduje, że niektóre systemy będą wyświetlać flagę Anglii , a te dla „gbsct” (🏴twitter ( 🏴twitter. , a te dla „gbwls” ( 🏴twitter. eur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ) .

Sekwencje znaczników pochodzą z ISO 3166-2 , ale przy użyciu tego mechanizmu możliwe są również sekwencje reprezentujące inne flagi subnarodowe (na przykład stany USA ). Jednak od wersji 12.0 Unicode tylko trzy sekwencje flag wymienione powyżej są „zalecane do ogólnej wymiany” przez konsorcjum Unicode, co oznacza, że ​​„najprawdopodobniej będą szeroko obsługiwane na wielu platformach”.

Blok Unicode


Tagi Oficjalny wykres kodu konsorcjum Unicode (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D mi F
U+E000x ZACZYNAĆ
U+E001x
U+E002x Sp ! " # $ % & ' ( ) * + , - . /
U+E003x   0   1 2 3 4 5 6 7 8 9 : ; < = > ?
U+E004x @ A B C D mi F G H I J k Ł M N O
U+E005x P Q R S T u V W X Y Z [ \ ] ^ _
U+E006x ` A B C D mi F G H I J k l M N o
U+E007x P Q R S T u w w X y z { | } ~ KONIEC
1. ^ Od wersji 15.0 Unicode
2. ^ Szare obszary oznaczają nieprzypisane punkty kodowe
3. ^ Punkty kodowe Unicode U + E0001 i U + E0020 do U + E007F były przestarzałe w wersji 5.1 Unicode, jednak od wersji 9.0 Unicode tylko U +E0001 pozostaje przestarzały

Historia

Poniższe dokumenty związane z Unicode opisują cel i proces definiowania określonych znaków w bloku Znaczniki:

Wersja Końcowe punkty kodowe Liczyć Identyfikator L2 Identyfikator grupy WG2 Dokument
3.1 U+E0001 1 L2/97-203 Whistler, Ken; Adams, Glenn (1997-08-05), Plane 14 znaków dla ogólnych tagów
L2/97-171R2 Whistler, Ken (18.09.1997), Samolot 14 znaków dla ogólnych tagów
L2/97-256 Allouche, Mati (1997-10-20), Komentarze do dokumentu dotyczącego stanowiska samolotu 14
L2/97-255R Aliprand, Joan (1997-12-03), „3.B. Lekkie tagowanie języka”, zatwierdzony protokół - wspólne spotkanie UTC #73 i L2 #170, Palo Alto, Kalifornia - 4-5 sierpnia 1997
L2/98-027 N1670 Płaszczyzna 14 znaków dla znaczników językowych , 12.12.1997
L2/98-039 Alirand, Joan; Winkler, Arnold (24.02.1998), „POPRAWIONE PROPOZYCJE 2.C”, Protokoły wstępne – UTC #74 i L2 #171, Mountain View, Kalifornia – 5 grudnia 1997
L2/98-286 N1703 Umamaheswaran, VS; Ksar, Mike (1998-07-02), „7.4”, niepotwierdzony protokół ze spotkania, spotkanie WG 2 nr 34, Redmond, WA, USA; 1998-03-16--20
L2/98-281R (pdf , html ) Aliprand, Joan (1998-07-31), "IETF and W3C Issues (VI)", niepotwierdzone protokoły - UTC #77 & NCITS Subgroup L2 #174 WSPÓLNE SPOTKANIE, Redmond, WA -- 29-31 lipca 1998
L2/00-010 N2103 Umamaheswaran, VS (2000-01-05), "9.1", Protokół ze spotkania WG 2 37, Kopenhaga, Dania: 1999-09-13--16
L2/01-301 Whistler, Ken (01.08.2001), „Znaki tagów” ​​, Analiza wycofania znaków w standardzie Unicode
L2/02-166R2 Moore, Lisa (09.08.2002), „Deprecjonowanie postaci”, UTC # 91 minut
U+E0020..E007F 96 L2/16-042 Czcionki, Augustyn; Pournader, Roozbeh (26.01.2015), Wymagane wyjaśnienia dotyczące „Pełnych danych emotikonów” i flag emotikonów
L2/15-145R Edberg, Peter (2015-05-07), Propozycja dodatkowych regionalnych symboli wskaźników
L2/15-107 Moore, Lisa (12.05.2015), „Propozycja E.1.3 dotycząca dodatkowych regionalnych symboli wskaźników”, UTC #143 minut
L2/15-190 Edberg, Peter (29.06.2015), PRI nr 299 Tło: Reprezentowanie dodatkowych typów flag
L2/15-206 Davis, Mark (2015-07-25), Ważność regionu / podpodziału dla flag
L2/16-180R Burge, Jeremy ; Williams, Owen (07.07.2016), Propozycja dołączenia flag Emoji dla Anglii, Szkocji i Walii
L2/17-016 Moore, Lisa (2017-02-08), „Action item 150-A59”, UTC #150 Minutes , Dodaj trzy sekwencje flag udokumentowane w L2/16-180R do emoji-sequences.txt dla emoji 5.0.
L2/17-048 Pournader, Roozbeh (24.01.2017), Opinia na temat PRI 343 (Unicode Emoji 5.0)
L2/17-086 Burge, Jeremy; i in. (2017-03-27), Dodaj ZWJ, VS-16, nasadki klawiszy i tagi do Emoji_Component
L2/17-103 Moore, Lisa (18.05.2017), „E.1.7 Dodaj ZWJ, VS-16, nasadki klawiszy i tagi do Emoji_Component”, UTC #151 minut