Łączący grafemowy łącznik

Łączący łącznik grafemowy (CGJ), U + 034F ͏ ŁĄCZONY ŁĄCZNIK GRAPHEME to znak Unicode , który nie ma widocznego glifu i jest „domyślnie ignorowany” przez aplikacje. Jego nazwa jest myląca i nie opisuje jego funkcji: postać nie łączy grafemów. Jego celem jest semantyczne oddzielenie znaków, które nie powinny być uważane za dwuznaki , a także zablokowanie kanonicznej zmiany kolejności znaków łączących podczas normalizacji .

Na przykład w kontekście języka węgierskiego sąsiadujące litery c i s byłyby zwykle uważane za równoważne digrafowi cs . Jeśli zostaną oddzielone przez CGJ, będą traktowane jako dwa oddzielne grafemy. Jednak w przeciwieństwie do łącznika o zerowej szerokości i podobnych znaków, CGJ nie wpływa na to, czy dwie litery są renderowane osobno, czy jako ligatura lub połączone kursywą - domyślne zachowanie jest określane przez czcionkę.

CGJ jest również potrzebny w przypadku złożonych skryptów . Na przykład, w większości przypadków metheg z hebrajskim akcentem kantylacyjnym powinien pojawić się na lewo od punktu samogłoski i domyślnie większość systemów wyświetlania odtworzy go w ten sposób, nawet jeśli zostanie wpisany przed samogłoską. Ale w niektórych słowach w biblijnym języku hebrajskim metheg pojawia się na prawo od samogłoski i aby silnik wyświetlania nakazał wyświetlanie go poprawnie po prawej stronie, CGJ musi być wpisany między metheg a samogłoską. Porównywać:

On ה
ścieżka (samogłoska) ַ
met ֽ
on + pathah + metheg הַֽ
on + meteg + ścieżka הַֽ
on + metheg + CGJ + pathah הֽ͏ַ

W przypadku kilku następujących po sobie łączących znaków diakrytycznych interweniujący CGJ wskazuje, że nie powinny one podlegać kanonicznej zmianie kolejności.

W przeciwieństwie do tego „ bez łączenia o zerowej szerokości ” przy U + 200C w zakresie ogólnej interpunkcji , co zapobiega przekształceniu dwóch sąsiednich znaków w ligaturę.

Linki zewnętrzne