Łączący grafemowy łącznik
Łączący łącznik grafemowy (CGJ), U + 034F ͏ ŁĄCZONY ŁĄCZNIK GRAPHEME to znak Unicode , który nie ma widocznego glifu i jest „domyślnie ignorowany” przez aplikacje. Jego nazwa jest myląca i nie opisuje jego funkcji: postać nie łączy grafemów. Jego celem jest semantyczne oddzielenie znaków, które nie powinny być uważane za dwuznaki , a także zablokowanie kanonicznej zmiany kolejności znaków łączących podczas normalizacji .
Na przykład w kontekście języka węgierskiego sąsiadujące litery c i s byłyby zwykle uważane za równoważne digrafowi cs . Jeśli zostaną oddzielone przez CGJ, będą traktowane jako dwa oddzielne grafemy. Jednak w przeciwieństwie do łącznika o zerowej szerokości i podobnych znaków, CGJ nie wpływa na to, czy dwie litery są renderowane osobno, czy jako ligatura lub połączone kursywą - domyślne zachowanie jest określane przez czcionkę.
CGJ jest również potrzebny w przypadku złożonych skryptów . Na przykład, w większości przypadków metheg z hebrajskim akcentem kantylacyjnym powinien pojawić się na lewo od punktu samogłoski i domyślnie większość systemów wyświetlania odtworzy go w ten sposób, nawet jeśli zostanie wpisany przed samogłoską. Ale w niektórych słowach w biblijnym języku hebrajskim metheg pojawia się na prawo od samogłoski i aby silnik wyświetlania nakazał wyświetlanie go poprawnie po prawej stronie, CGJ musi być wpisany między metheg a samogłoską. Porównywać:
On | ה |
ścieżka (samogłoska) | ַ |
met | ֽ |
on + pathah + metheg | הַֽ |
on + meteg + ścieżka | הַֽ |
on + metheg + CGJ + pathah | הֽ͏ַ |
W przypadku kilku następujących po sobie łączących znaków diakrytycznych interweniujący CGJ wskazuje, że nie powinny one podlegać kanonicznej zmianie kolejności.
W przeciwieństwie do tego „ bez łączenia o zerowej szerokości ” przy U + 200C w zakresie ogólnej interpunkcji , co zapobiega przekształceniu dwóch sąsiednich znaków w ligaturę.