Dwuznak (ortografia)

W języku walijskim dwuznaki ⟨Ll⟩, ⟨ll⟩ połączyły się na pewien czas w ligaturę .

Dwuznak lub digram (ze starogreckiego : δίς dís , podwójny” i γράφω gráphō , „pisać”) to para znaków używanych w ortografii języka do zapisania pojedynczego fonemu (wyraźny dźwięk) lub sekwencja fonemów, która nie odpowiada normalnym wartościom dwóch połączonych znaków.

Niektóre digrafy reprezentują fonemy, których nie można przedstawić za pomocą pojedynczego znaku w systemie pisma języka, jak angielskie sh w ship i fish . Inne digrafy reprezentują fonemy, które mogą być również reprezentowane przez pojedyncze znaki. Dwuznak, który ma taką samą wymowę jak pojedynczy znak, może być reliktem z wcześniejszego okresu języka, kiedy dwuznak miał inną wymowę, lub może reprezentować rozróżnienie, które występuje tylko w niektórych dialektach, takich jak angielski wh . Niektóre takie dwuznaki są używane z powodów czysto etymologicznych , jak rh w języku angielskim.

Dwuznaki są używane w niektórych schematach latynizacji , na przykład zh często używane do reprezentowania rosyjskiej litery ж . Jako alternatywę dla dwuznaków, ortografie i schematy latynizacji czasami używają liter ze znakami diakrytycznymi , jak czeskie i słowackie š , które ma taką samą funkcję jak angielski dwuznak sh, jak rumuńskie Ț , które ma taką samą funkcję jak słowiańskie C , litera Ť używana w języku czeskim i słowackim, która ma taką samą funkcję jak węgierski dwuznak Ty , oraz litera z cedillą w kilku językach tureckich, które mają tę samą funkcję co litera z cedillą poniżej, po której następuje litera h w Na przykład po angielsku ç zmieni się na ch , a ş na sh po angielsku.

W ortografiach niektórych języków dwuznaki (a czasami trygrafy ) są uważane za pojedyncze litery , co oznacza, że ​​mają swoje własne miejsce w alfabecie i nie można ich rozdzielić na składowe grafemy podczas sortowania , skracania lub dzielenia wyrazów. Przykłady tego można znaleźć w języku węgierskim ( cs, dz, dzs, gy, ly, ny, sz, ty, zs ), czeskim ( ch ), słowackim ( ch , dz , ), albańskim ( dh , gj , ll , nj , rr , sh , th , xh , zh ), łaciński alfabet Gaja ( lj , nj , dž ) oraz w języku uzbeckim (sh, ch, ng) . Kazachski używał również formy alfabetu łacińskiego, w której jest kilka dwuznaków i jeden tetragraf, a konkretnie wersja kazachskiego alfabetu łacińskiego z 2018 roku ( sh, ch, shch, ıo) , aw nowej wersji nadal jest jeden dwuznak Alfabet łaciński (şç) . W języku niderlandzkim, gdy dwuznak ij jest pisany wielką literą, oba znaki są pisane wielkimi literami ( IJ ). W języku Maorysów istnieją dwa dwuznaki w języku, które nadal są częścią alfabetu, a mianowicie ng i wh . W języku walijskim w oficjalnym alfabecie występuje osiem dwuznaków (ch, dd, ff, ng, ll, ph, rh, th) .

W języku maltańskim istnieją dwa dwuznaki będące częścią oficjalnego alfabetu ( i ie ). Latynizacja cyrylicy, zwłaszcza używanej w niektórych językach słowiańskich, w tym rosyjskim, spowodowała, że ​​niektóre litery stawały się niekiedy dwuznakami, czyli literami (ё, ж, х, ц, ч, ш, щ, ю, я) i mogą być transliterowane na ( jo/yo , zh, kh, ts, ch, sh, shch, yu/ju, ya/ja ), podczas gdy czasami latynizacja liter odbywa się poprzez dodanie znaków diakrytycznych, z wyjątkiem kh i ts, które dla kh, czasami staje się ch lub x, a ts czasami staje się c (ë, ž, č, š), wciąż z pewnymi dwuznakami (šč, ju/yu, ja/ya). Alfabet czeski miał wiele dwuznaków kilkaset lat temu, ale w wyniku ewolucji te dwuznaki ostatecznie stały się literami ze znakami diakrytycznymi, chociaż w języku czeskim nadal zachowało się kilka dwuznaków, ponieważ te litery ze znakami diakrytycznymi nie umożliwiają wymowy odpowiednich dwuznaków (rozdz. , dz, dž), co jest również w przypadku alfabetu słowackiego, który ma wiele dwuznaków w alfabecie, a następnie ewoluuje, aby stać się literą diakrytyczną i zachowuje niektóre, gdy litery diakrytyczne nie mogą zapewnić wymowy odpowiednie dwuznaki.

Digrafy mogą przekształcić się w ligatury , ale jest to odrębna koncepcja: ligatura obejmuje graficzną kombinację dwóch znaków, na przykład gdy a i e są połączone w æ , a gdy o i e są połączone w œ . Te dwie ligatury są nadal używane w niektórych językach. Æ jest zwykle używane w językach skandynawskich, w szczególności w islandzkim, norweskim i duńskim. Szwedzki miał kiedyś literę Æ, ale ta litera została zmieniona na Ę. Œ jest zwykle używane w języku francuskim, ale zwykle jest wpisywane dwoma naciśnięciami klawiszy (OE/oe), zamiast specjalnego klawisza na francuskiej klawiaturze lub za pomocą klawisza AltGr. W Kanadzie układ klawiatury (Canadian Multilingual Standard) został zmodyfikowany tak, aby można było używać prawego klawisza Ctrl do uzyskiwania większej liczby znaków, w tym œ i innych obcych znaków, czasami martwego klawisza do wprowadzania kilku rodzajów znaków diakrytycznych w niektórych literach do wpisz język, w którym używany jest dany znak diakrytyczny. Dwuznak ij jest szczególnym przypadkiem, zwłaszcza w języku niderlandzkim, ponieważ gdy jest pisany odręcznie, wielka wersja (IJ) staje się bardzo podobna, jeśli nie nie do odróżnienia, od kursywnej litery Y, ale jeśli jest napisana zwykłą, małą literą wersja, to będzie wyglądać jak litera Y z diaerezą/umlautem (ÿ).

Podwójne litery

Digrafy mogą składać się z dwóch różnych znaków (digrafy heterogeniczne) lub dwóch wystąpień tego samego znaku (digrafy jednorodne). W tym drugim przypadku są one ogólnie nazywane podwójnymi (lub podwójnymi ) literami .

Podwójne litery samogłoskowe są powszechnie używane do wskazania długiego dźwięku samogłoski . Tak jest na przykład w języku fińskim i estońskim , gdzie ⟨uu⟩ reprezentuje dłuższą wersję samogłoski oznaczonej ⟨u⟩, ⟨ää⟩ reprezentuje dłuższą wersję samogłoski oznaczonej ⟨ä⟩ i tak dalej. W średnioangielskim sekwencje ⟨ee⟩ i ⟨oo⟩ były używane w podobny sposób, aby przedstawić odpowiednio wydłużone dźwięki „e” i „o”; obie pisownie zostały zachowane we współczesnej ortografii angielskiej , ale Wielkie Przesunięcie Samogłoski i inne historyczne zmiany dźwiękowe oznaczają, że współczesna wymowa znacznie różni się od oryginalnej.

Podwojonych liter spółgłosek można również użyć do wskazania długiego lub bliźniaczego dźwięku spółgłoski. Na przykład w języku włoskim spółgłoski pisane podwójnie wymawia się dłużej niż pojedyncze. Było to pierwotne użycie podwójnych liter spółgłoskowych w staroangielskim , ale w okresie średnioangielskim i wczesnoangielskim długość spółgłoski fonemicznej została utracona i rozwinęła się konwencja pisowni, w której podwójna spółgłoska służy do wskazania, że ​​poprzedzająca samogłoska ma być wymawiana krótki. Na przykład we współczesnym angielskim ⟨pp⟩ stukania odróżnia dźwięk pierwszej samogłoski od tapingu . W rzadkich przypadkach podwójne litery spółgłosek reprezentują prawdziwą bliźniaczą spółgłoskę we współczesnym języku angielskim; może się to zdarzyć, gdy dwa wystąpienia tej samej spółgłoski pochodzą z różnych morfemów , na przykład ⟨nn⟩ w nienaturalnym ( un + natural ).

W niektórych przypadkach dźwięk reprezentowany przez podwójną spółgłoskę różni się w inny sposób niż długość od dźwięku odpowiadającej mu pojedynczej spółgłoski:

W kilku europejskich systemach pisma, w tym w angielskim, podwojenie litery ⟨c⟩ lub ⟨k⟩ jest reprezentowane jako heterogeniczny dwuznak ⟨ck⟩ zamiast odpowiednio ⟨cc⟩ lub ⟨kk⟩. W rodzimych niemieckich słowach podwojenie ⟨z⟩, które odpowiada / ts / , jest zastąpione dwuznakiem ⟨tz⟩.

Digrafy pan-dialektyczne

Niektóre języki mają ujednoliconą ortografię z dwuznakami, które reprezentują różne wymowy w różnych dialektach ( diafonemy ). Na przykład w języku bretońskim istnieje dwuznak ⟨zh⟩, który reprezentuje [z] w większości dialektów, ale [h] w Vannetais. Podobnie, francuski dialekt Saintongeais ma dwuznak ⟨jh⟩, który reprezentuje [h] w słowach odpowiadających [ʒ] w standardowym francuskim. Podobnie kataloński ma dwuznak ⟨ix⟩, który reprezentuje [ʃ] we wschodnim katalońskim , ale [jʃ] lub [js] w zachodnio-katalońskim - walenckim .

Dzielone digrafy

Para liter tworzących fonem nie zawsze sąsiaduje ze sobą. Tak jest w przypadku angielskiego niemego e . Na przykład sekwencja a_e ma dźwięk / eɪ / w języku angielskim cake. Jest to wynikiem trzech historycznych zmian brzmieniowych: pierwotnie cake brzmiało /kakə/ , sylabę otwartą /ka/ zaczęto wymawiać długą samogłoską , a później końcowa schwa odpadła, pozostawiając /kaːk/ . Jeszcze później samogłoska / aː / stała się / eɪ / . Istnieje sześć takich dwuznaków w języku angielskim, ⟨a_e, e_e, i_e, o_e, u_e, y_e⟩.

Jednak alfabety mogą być również zaprojektowane z nieciągłymi dwuznakami. Na przykład w cyrylicy tatarskiej litera ю jest używana do zapisywania zarówno /ju/, jak i /jy/ . Zwykle różnica jest widoczna w pozostałej części słowa, ale kiedy tak nie jest, sekwencja ю...ь jest używana dla /jy/ , jak w юнь /jyn/ 'tani'.

Alfabety indyjskie wyróżniają się nieciągłymi samogłoskami, takimi jak tajski เ...อ / ɤː / w เกอ / kɤː / . Technicznie jednak można je uznać za znaki diakrytyczne , a nie pełne litery; to, czy są to digrafy, jest zatem kwestią definicji.

Niejednoznaczne sekwencje liter

Niektóre pary liter nie powinny być interpretowane jako dwuznaki, ale pojawiają się z powodu złożenia : hogshead i współpracuj . Często nie są one w żaden sposób oznaczone i dlatego należy je zapamiętać jako wyjątki. Jednak niektórzy autorzy wskazują to albo przez rozbicie dwuznaku myślnikiem , jak w hogs-head , co-operate , albo przez znak trema , jak w coöperate , ale użycie diaeresis spadło w języku angielskim w ciągu ostatnich wiek. Kiedy występuje w nazwach takich jak Clapham , Townshend i Hartshorne, nigdy nie jest w żaden sposób oznaczany. Alternatywne glify pozycyjne mogą pomóc w ujednoznacznieniu w niektórych przypadkach: gdy okrągłe, ⟨s⟩ było używane jako ostateczny wariant długiego ⟨ſ⟩, a angielski dwuznak przypominający / ʃ / zawsze byłby ⟨ſh⟩.

W latynizacji języka japońskiego dźwięki składowe ( morae ) są zwykle oznaczane dwuznakami, ale niektóre są oznaczone pojedynczą literą, a niektóre trygrafem. Przypadek niejednoznaczności to sylabiczny , który jest zapisywany jako n (lub czasami m ), z wyjątkiem przed samogłoskami lub y , gdzie następuje apostrof jako n' . Na przykład imię じ ゅ ん い ち ろ う jest latynizowane jako Jun'ichirō, więc jest analizowane jako „Jun-i-chi-rou”, a nie jako „Ju-ni-chi-rou”. Podobne użycie apostrofu jest widoczne w pinyin , gdzie 嫦娥 jest napisane Chang'e , ponieważ g należy do końca (-ang) pierwszej sylaby, a nie do początku drugiej sylaby. Bez apostrofu Zmiana byłaby rozumiana jako sylaba chan (końcowe -an), po której następuje sylaba ge (początkowe g-).

W kilku językach słowiańskich , np. czeskim , podwójne litery mogą występować w wyrazach złożonych, ale nie są one uważane za dwuznaki. Przykłady: bezzubý „bezzębny”, cenný „cenny”, černooký „czarnooki”.

W alfabetyzacji

W niektórych językach niektóre dwuznaki i trygrafy są liczone same w sobie jako odrębne litery i przypisywane do określonego miejsca w alfabecie , niezależnie od sekwencji znaków, która je tworzy, dla celów ortografii i zestawiania . Na przykład:

Większość innych języków, w tym angielski, francuski, niemiecki, polski itp., traktuje dwuznaki jako kombinacje oddzielnych liter dla celów alfabetycznych.

Przykłady

pismo łacińskie

język angielski

Angielski ma zarówno jednorodne digrafy (podwójne litery), jak i heterogeniczne dwuznaki (digrafy składające się z dwóch różnych liter). Do tego ostatniego typu należą:

Dwuznaki mogą również składać się z samogłosek. Niektóre litery ⟨a, e, o⟩ są preferowane na pierwszej pozycji, inne na drugiej ⟨i, u⟩. Te ostatnie mają allografy ⟨y, w⟩ w ortografii angielskiej .

Angielskie dwuznaki wokalne

druga litera → pierwsza litera ↓
⟨...mi⟩ ⟨...i⟩ ¦ ⟨...y⟩ ⟨...u⟩ ¦ ⟨...w⟩ ⟨...A⟩ ⟨...o⟩
⟨o...⟩ ⟨oe¦œ⟩ > ⟨e⟩ – / i / ⟨oi¦oy⟩ – / ɔɪ / ⟨ou¦ow⟩ – /aʊ¦uː¦oʊ/ ⟨oa⟩ – /oʊ¦ɔː/ ⟨oo⟩ – /uː¦ʊ(¦ʌ)/
⟨A...⟩ ⟨ae¦æ⟩ > ⟨e⟩ – / i / ⟨ai¦ay⟩ – /eɪ¦ɛ/
⟨au¦aw⟩ - / ɔː / (w zapożyczeniach: / aʊ / )
(w zapożyczeniach i rzeczownikach własnych: ⟨aa⟩ - / ə¦ɔː¦ɔl / ) (w zapożyczeniach z chińskiego: ⟨ao⟩ - / aʊ / )
⟨mi...⟩ ⟨ee⟩ – / iː / ⟨ei¦ey⟩ – /aɪ¦eɪ¦(iː)/ ⟨eu¦ew⟩ – /juː¦uː/ ⟨ea⟩ – /iː¦ɛ¦(eɪ¦ɪə)/
⟨u...⟩ ⟨ue⟩ – /uː¦u/ ⟨ui⟩ – /ɪ¦uː/
⟨I...⟩ ⟨ie⟩ – /iː(¦aɪ)/

Inne języki używające alfabetu łacińskiego

po serbsko-chorwacku :

Zwróć uwagę, że w ortografii cyrylicy dźwięki te są reprezentowane przez pojedyncze litery (љ, њ, џ).

po czesku i słowacku :

po duńsku i norwesku :

  • Dwuznak ⟨ aa ⟩ reprezentował / ɔ / do 1917 roku w Norwegii i 1948 w Danii, ale dziś jest zapisywany jako ⟨ å ⟩. Dwuznak jest nadal używany w starszych nazwach, ale sortowany tak, jakby to była litera ze znakiem diakrytycznym.

W języku norweskim kilka dźwięków można przedstawić tylko za pomocą dwuznaku lub kombinacji liter. Są to najczęstsze kombinacje, ale istnieją skrajne różnice regionalne, zwłaszcza w przypadku dialektów wschodnich . Godną uwagi różnicą jest aspiracja rs we wschodnich dialektach, gdzie odpowiada ona skj i sj . Wśród wielu młodych ludzi, zwłaszcza w zachodnich regionach Norwegii oraz w dużych miastach lub wokół nich, różnica między ç i ʃ została całkowicie zatarta i teraz wymawia się je tak samo.

  • ⟨kj⟩ reprezentuje / ç / jak w ch w języku niemieckim i ch lub x w Mé x ico.
  • ⟨tj⟩ reprezentuje / ç / jak w ch w języku niemieckim i ch lub x w Mé x ico.
  • ⟨skj⟩ reprezentuje / ʃ / jak w sh w angielskim she .
  • ⟨sj⟩ reprezentuje / ʃ / jak w sh w angielskim she .
  • ⟨sk⟩ reprezentuje / ʃ / (przed i lub y), jak w sh w angielskim she .
  • ng ⟩ reprezentuje / ŋ / jak w ng w angielskim thi ng .

po katalońsku :

po niderlandzku :

po francusku :

Francuskie dwuznaki wokalne
⟨...I⟩ ⟨...u⟩
⟨A...⟩ ⟨ai⟩ – /ɛ¦e/ ⟨au⟩ – / o /
⟨mi...⟩ ⟨ei⟩ – / ɛ / ⟨eu⟩ – /œ¦ø/
⟨o...⟩ ⟨oi⟩ – / wa / ⟨ty⟩ – /u(¦w)/

Zobacz także fonologię francuską .

po niemiecku :

po węgiersku :

po włosku :

W języku gaelickim Manx ⟨ch⟩ reprezentuje /χ/ , ale ⟨çh⟩ reprezentuje / tʃ/ .

po polsku :

po portugalsku :

po hiszpańsku :

  • ⟨ll⟩ jest tradycyjnie (ale teraz zwykle nie) wymawiane / ʎ /
  • ⟨ch⟩ reprezentuje / tʃ / ( bezdźwięczny afrykat pozapęcherzykowy ). Od 2010 roku żadne z nich nie jest uważane za część alfabetu. Kiedyś były sortowane jako oddzielne listy, ale reforma przeprowadzona w 1994 roku przez Hiszpańską Akademię Królewską pozwoliła na podzielenie ich na listy składowe w celu zestawienia. Dwuznak ⟨ rr ⟩, wymawiany jako odrębny tryl zębodołowy , nigdy nie był oficjalnie uważany za literę alfabetu hiszpańskiego i to samo dotyczy ⟨gu⟩ i ⟨qu⟩ (odpowiednio dla / ɡ / i / k / przed ⟨ e⟩ lub ⟨i⟩).

po walijsku :

Wymienione powyżej dwuznaki reprezentują różne fonemy i są traktowane jako oddzielne litery do celów zestawiania. Natomiast dwuznaki ⟨ mh ⟩, ⟨ nh ⟩ i trygraf ⟨ ngh ⟩, które oznaczają spółgłoski bezdźwięczne , ale występują tylko na początku wyrazów w wyniku mutacji nosowej , nie są traktowane jako osobne litery, i dlatego nie są ujęte w alfabecie.

Daighi tongiong pingim , system transkrypcji używany w tajwańskim Hokkien , obejmuje lub który reprezentuje / ə / ( środkowa samogłoska środkowa ) lub / o / ( samogłoska zamknięta środkowa tylna zaokrąglona ), a także inne dwuznaki.

po joruba :

  • ⟨gb⟩ to alfabet, a spółgłoska zwarta najdokładniej wymawia się, próbując powiedzieć /g/ i /b/ w tym samym czasie.

cyrylica

Współczesne języki słowiańskie pisane cyrylicą w niewielkim stopniu wykorzystują dwuznaki oprócz ⟨дж⟩ dla / dʐ/ , ⟨дз⟩ dla / dz / (w języku ukraińskim, białoruskim i bułgarskim) oraz ⟨жж⟩ i ⟨зж⟩ dla rzadki fonem rosyjski / ʑː / . W języku rosyjskim sekwencje ⟨дж⟩ i ⟨дз⟩ występują (głównie w zapożyczeniach), ale są wymawiane jako kombinacje implozji (czasami traktowanej jako afrykata) i frykaty; implozje są traktowane jako alofony liczby spółgłoskowej /d̪/, więc ciągi te nie są uważane za dwuznaki. Cyrylica ma niewiele dwuznaków, chyba że jest używana do pisania języków niesłowiańskich, zwłaszcza języków kaukaskich .

Pismo arabskie

Ponieważ samogłoski na ogół nie są zapisywane, dwuznaki są rzadkie w abjadach , takich jak arabski. Na przykład, jeśli zamiast š użyto sh , to sekwencja sh mogłaby oznaczać albo ša , albo saha. Jednak dwuznaki są używane dla spółgłosek przydechowych i szeptanych (tych pisanych z h- digrafami w transkrypcji łacińskiej) w językach Azji Południowej, takich jak urdu , które są pisane w alfabecie arabskim specjalną formą litery h , która jest używana tylko dla dwuznaków aspiracji, co widać w przypadku następujących spółgłosek łączących (kh) i niełączących (ḍh) :

urdu złączony   niełączący
dwuznak: کھا /kʰɑː/ ڈھا / ɖʱ ɑː /
sekwencja: کہا /kəɦɑː/ ڈہا /ɖəɦɑː/

ormiański

W języku ormiańskim dwuznak ու ⟨ou⟩ zastępuje / u / , konwencję wywodzącą się z języka greckiego.

gruziński

Alfabet gruziński używa kilku dwuznaków do zapisu w innych językach. Na przykład w języku Svan / ø / jest zapisywane jako ჳე ⟨we⟩, a / y / jako ჳი ⟨wi⟩.

grecki

Współczesna greka ma następujące dwuznaki:

  • αι ( ai ) reprezentuje /e̞/
  • ει ( ei ) reprezentuje /i/
  • οι ( oi ) reprezentuje / i /
  • ου ( oy ) reprezentuje /u/
  • υι ( yi ) reprezentuje /i/

języku greckim nazywa się je „dyftongami” ; w czasach klasycznych większość z nich reprezentowała dyftongi i nazwa się przyjęła.

  • γγ ( gg ) reprezentuje /ŋɡ/ lub /ɡ/
  • τσ ( ts ) reprezentuje afrykat / ts /
  • τζ ( tz ) reprezentuje afrykat /dz/
  • Inicjał γκ ( gk ) reprezentuje / ɡ /
  • Początkowe μπ ( mp ) reprezentuje /b/
  • Początkowe ντ ( nt ) reprezentuje /d/

Starożytna greka również miała wymienione powyżej „dyftongi”, chociaż ich wymowa w starożytności jest kwestionowana. Ponadto starożytna greka również używała litery γ w połączeniu ze stoperem welarnym, aby utworzyć następujące dwuznaki:

  • γγ ( gg ) reprezentuje /ŋɡ/
  • γκ ( gk ) reprezentuje /ŋɡ/
  • γχ ( gkh ) reprezentuje /ŋkʰ/

Tsakonian ma kilka dodatkowych dwuznaków:

  • ρζ ( rz ) / ʒ / (historycznie być może tryl frykcyjny )
  • κχ ( kkh ) reprezentuje /kʰ/
  • τθ ( tth ) reprezentuje /tʰ/
  • πφ ( pph ) reprezentuje /pʰ/
  • σχ ( skh ) reprezentuje / ʃ /

Ponadto spółgłoski podniebienne są oznaczone literą samogłoski ι , co jest jednak w dużej mierze przewidywalne. Gdy /n/ i /l/ nie są spalatalizowane przed ι , są zapisywane jako νν i λλ .

W Bactrian dwuznaki ββ , δδ i γγ były używane odpowiednio dla /b/ , /d/ i /ŋg/ .

hebrajski

י W alfabecie hebrajskim תס ‎ i תש ‎ można czasami znaleźć dla צ <a i=9>/ / ts / . Współczesny hebrajski używa również dwuznaków wykonanych z ׳ dla dźwięków obcych: ג׳ <a i=17>/ / / , ז׳ <a i=23>/ / ʒ / , צ׳ <a i=29>/ / / ; i inne dwuznaki liter, gdy jest napisane bez samogłosek: וו ‎ dla spółgłoski ו ‎ w środku wyrazu i יי ‎ dla / aj / lub / aji / itp., czyli spółgłoski <a i=43>י w miejscach, w których można się było tego nie spodziewać. Jidysz ma własną tradycję transkrypcji i dlatego używa różnych dwuznaków dla niektórych z tych samych dźwięków: דז <a i=49>/ / dz / , זש <a i=55>/ / ʒ / , טש <a i=61>/ / / i דזש (dosłownie dzš ) dla / / , וו <a i=76>/ / v / , dostępny również jako pojedynczy znak Unicode װ , וי ‎ lub jako pojedynczy znak w Unicode ױ <a i=87>‎ / oj/ , יי ‎ lub ײ <a i=93>‎ / ej/ i ײַ <a i=97>‎ / aj/ . Jednoznakowe dwuznaki nazywane są w Unicode „ ligaturami ”. י ‎ może być również użyte po spółgłosce w celu wskazania palatalizacji w zapożyczeniach słowiańskich.

Ind

Większość pism indyjskich ma złożone znaki diakrytyczne samogłosek , których nie można przewidzieć na podstawie ich poszczególnych elementów. Można to zilustrować za pomocą języka tajskiego , w którym znak diakrytyczny เ, wymawiany samodzielnie / eː/ , modyfikuje wymowę innych samogłosek:

pojedynczy znak samogłoskowy: กา / kaː / , เก /keː/ , กอ /kɔː/
znak samogłoski plus เ: เกา /kaw/ , แก /kɛː/ , เกอ /kɤː/

Ponadto kombinacja รร wymawiana jest jako /a/ lub /an/ , są słowa, w których kombinacje ทร i ศร oznaczają /s/ , a litera ห, jako przedrostek spółgłoski, zmienia jej klasę toniczną na wysoki, modyfikując ton sylaby.

Eskimosów

Sylaby Inuktitut dodają dwa dwuznaki do Cree:

rk dla q
qai , ᕿ qi , ᖁ qu , ᖃ qa , ᖅ q

I

ng dla ŋ
ng

Ten ostatni tworzy trygrafy i tetragrafy.

Znaki CJK

chiński

Kilka kombinacji chińskich znaków (Hanzi) utworzonych z dwóch lub więcej różnych znaków, zwanych dwuznakami.

język japoński

Dwie kana można połączyć w sylabę CV przez dodanie drugiej; konwencja anuluje samogłoskę pierwszego. Jest to powszechnie wykonywane w przypadku sylab CyV zwanych yōon , jak w ひ ょ (ひ ) hyo ⟨hi yo ⟩. Nie są to dwuznaki, ponieważ zachowują normalny sekwencyjny odczyt dwóch glifów. Jednak niektóre przestarzałe sekwencje nie zachowują już tego czytania, jak wくゎ kwa, ぐゎ gwa iむゎ mwa, teraz wymawiane ka, ga, ma . Ponadto digrafy niesekwencyjne są używane w przypadku pożyczek zagranicznych, które nie są zgodne z normalnymi japońskimi asybilacji , takimi jakティ ti ,トゥ tu ,チェ tye / che ,スェ swe ,ウィ wi ,ツォ tso ,ズィ zi . (Patrz katakana i transkrypcja na język japoński dla pełnych tabel).

Długie samogłoski są zapisywane przez dodanie kana dla tej samogłoski, w efekcie ją podwajając. Jednak długie ō można zapisać oo lub ou , jak w と う き ょ う toukyou [toːkʲoː] 'Tōkyō'. Dla dialektów, które nie rozróżniają ē i ei , ta ostatnia pisownia jest używana dla długiego e , jak w へいせい heisei [heːseː] ' Heisei '. W zapożyczeniach chōonpu , linia zgodna z kierunkiem tekstu, jak w ビ ー ル bīru [bi: ru] bīru 'piwo'. Z wyjątkiem sylab rozpoczynających się na literę n , podwójne spółgłoski są zapisywane przez poprzedzenie mniejszej wersji tsu (pisanej odpowiednio っ i ッ w hiraganie i katakanie), jak w き っ て kitte „pieczęć”. Spółgłoski zaczynające się na literę n używają zamiast tego znaku kana n (pisanego ん lub ン) jako przedrostka.

Istnieje kilka konwencji kana z Okinawy , które obejmują dwuznaki lub ligatury w indeksie dolnym. Na przykład w systemie Uniwersytetu Ryukyu ウ to / ʔu / , ヲ to / o / , ale ヲ ゥ (ヲ ) to / u / .

koreański

Podobnie jak w przypadku języka greckiego, koreański ma samogłoski wywodzące się z dyftongów, które nadal są pisane dwiema literami. Te dwuznaki, ㅐ /ɛ/ i ㅔ /e/ (również ㅒ /jɛ/ , ㅖ /je/ ), aw niektórych dialektach ㅚ /ø/ i ㅟ /y/ , wszystkie kończą się na historycznym ㅣ /i/ .

Hangul został zaprojektowany z serią dwuznaków do reprezentowania „ mętnych ” spółgłosek: ㅃ *[b] , ㄸ *[d] , ㅉ *[dz] , ㄲ *[ɡ] , ㅆ *[z] , ㆅ *[ɣ] ; również ᅇ o niepewnej wartości. Te wartości są już przestarzałe, ale większość podwójnych liter została wskrzeszona w XIX wieku, aby pisać spółgłoski, które nie istniały, gdy wymyślono hangul: ㅃ / p͈/ , ㄸ / t͈/ , ㅉ / t͈ɕ/ , ㄲ / k͈/ , ㅆ /s͈/ .

Ligatury i nowe litery

Dwuznaki czasami są zapisywane jako pojedyncza ligatura. Z biegiem czasu ligatury mogą ewoluować w nowe litery lub litery ze znakami diakrytycznymi. Na przykład sz stało się ß w języku niemieckim, a „nn” stało się ñ w języku hiszpańskim.

W Unikodzie

Ogólnie rzecz biorąc, dwuznak jest po prostu reprezentowany za pomocą dwóch znaków w Unicode . Jednak z różnych powodów Unicode czasami zapewnia oddzielny punkt kodowy dla dwuznaku, zakodowany jako pojedynczy znak.

Dwuznaki DZ i IJ oraz dwuznaki serbsko-chorwackie DŽ, LJ i NJ mają oddzielne punkty kodowe w Unicode.

Dwa glify Dwuznak Punkt kodu Unicode HTML
DZ, dz, dz DZ, Dz, dz U+01F1 U+01F2 U+01F3 DZ Dz dz
DŽ, Dž, dž DŽ, Dž, dž U+01C4 U+01C5 U+01C6 DŽ Dž dž
IJ, ij IJ, ij U+0132 U+0133 IJ ij
LJ, Lj, lj LJ, Lj, lj U+01C7 U+01C8 U+01C9 LJ Lj lj
NJ, Nj, nj NJ, Nj, nj U+01CA U+01CB U+01CC NJ Nj nj
cz U+1D7A

Zobacz także Ligatury w Unicode .

Zobacz też