Dwuznak (ortografia)
Dwuznak lub digram (ze starogreckiego : δίς dís , „ podwójny” i γράφω gráphō , „pisać”) to para znaków używanych w ortografii języka do zapisania pojedynczego fonemu (wyraźny dźwięk) lub sekwencja fonemów, która nie odpowiada normalnym wartościom dwóch połączonych znaków.
Niektóre digrafy reprezentują fonemy, których nie można przedstawić za pomocą pojedynczego znaku w systemie pisma języka, jak angielskie sh w ship i fish . Inne digrafy reprezentują fonemy, które mogą być również reprezentowane przez pojedyncze znaki. Dwuznak, który ma taką samą wymowę jak pojedynczy znak, może być reliktem z wcześniejszego okresu języka, kiedy dwuznak miał inną wymowę, lub może reprezentować rozróżnienie, które występuje tylko w niektórych dialektach, takich jak angielski wh . Niektóre takie dwuznaki są używane z powodów czysto etymologicznych , jak rh w języku angielskim.
Dwuznaki są używane w niektórych schematach latynizacji , na przykład zh często używane do reprezentowania rosyjskiej litery ж . Jako alternatywę dla dwuznaków, ortografie i schematy latynizacji czasami używają liter ze znakami diakrytycznymi , jak czeskie i słowackie š , które ma taką samą funkcję jak angielski dwuznak sh, jak rumuńskie Ț , które ma taką samą funkcję jak słowiańskie C , litera Ť używana w języku czeskim i słowackim, która ma taką samą funkcję jak węgierski dwuznak Ty , oraz litera z cedillą w kilku językach tureckich, które mają tę samą funkcję co litera z cedillą poniżej, po której następuje litera h w Na przykład po angielsku ç zmieni się na ch , a ş na sh po angielsku.
W ortografiach niektórych języków dwuznaki (a czasami trygrafy ) są uważane za pojedyncze litery , co oznacza, że mają swoje własne miejsce w alfabecie i nie można ich rozdzielić na składowe grafemy podczas sortowania , skracania lub dzielenia wyrazów. Przykłady tego można znaleźć w języku węgierskim ( cs, dz, dzs, gy, ly, ny, sz, ty, zs ), czeskim ( ch ), słowackim ( ch , dz , dž ), albańskim ( dh , gj , ll , nj , rr , sh , th , xh , zh ), łaciński alfabet Gaja ( lj , nj , dž ) oraz w języku uzbeckim (sh, ch, ng) . Kazachski używał również formy alfabetu łacińskiego, w której jest kilka dwuznaków i jeden tetragraf, a konkretnie wersja kazachskiego alfabetu łacińskiego z 2018 roku ( sh, ch, shch, ıo) , aw nowej wersji nadal jest jeden dwuznak Alfabet łaciński (şç) . W języku niderlandzkim, gdy dwuznak ij jest pisany wielką literą, oba znaki są pisane wielkimi literami ( IJ ). W języku Maorysów istnieją dwa dwuznaki w języku, które nadal są częścią alfabetu, a mianowicie ng i wh . W języku walijskim w oficjalnym alfabecie występuje osiem dwuznaków (ch, dd, ff, ng, ll, ph, rh, th) .
W języku maltańskim istnieją dwa dwuznaki będące częścią oficjalnego alfabetu ( għ i ie ). Latynizacja cyrylicy, zwłaszcza używanej w niektórych językach słowiańskich, w tym rosyjskim, spowodowała, że niektóre litery stawały się niekiedy dwuznakami, czyli literami (ё, ж, х, ц, ч, ш, щ, ю, я) i mogą być transliterowane na ( jo/yo , zh, kh, ts, ch, sh, shch, yu/ju, ya/ja ), podczas gdy czasami latynizacja liter odbywa się poprzez dodanie znaków diakrytycznych, z wyjątkiem kh i ts, które dla kh, czasami staje się ch lub x, a ts czasami staje się c (ë, ž, č, š), wciąż z pewnymi dwuznakami (šč, ju/yu, ja/ya). Alfabet czeski miał wiele dwuznaków kilkaset lat temu, ale w wyniku ewolucji te dwuznaki ostatecznie stały się literami ze znakami diakrytycznymi, chociaż w języku czeskim nadal zachowało się kilka dwuznaków, ponieważ te litery ze znakami diakrytycznymi nie umożliwiają wymowy odpowiednich dwuznaków (rozdz. , dz, dž), co jest również w przypadku alfabetu słowackiego, który ma wiele dwuznaków w alfabecie, a następnie ewoluuje, aby stać się literą diakrytyczną i zachowuje niektóre, gdy litery diakrytyczne nie mogą zapewnić wymowy odpowiednie dwuznaki.
Digrafy mogą przekształcić się w ligatury , ale jest to odrębna koncepcja: ligatura obejmuje graficzną kombinację dwóch znaków, na przykład gdy a i e są połączone w æ , a gdy o i e są połączone w œ . Te dwie ligatury są nadal używane w niektórych językach. Æ jest zwykle używane w językach skandynawskich, w szczególności w islandzkim, norweskim i duńskim. Szwedzki miał kiedyś literę Æ, ale ta litera została zmieniona na Ę. Œ jest zwykle używane w języku francuskim, ale zwykle jest wpisywane dwoma naciśnięciami klawiszy (OE/oe), zamiast specjalnego klawisza na francuskiej klawiaturze lub za pomocą klawisza AltGr. W Kanadzie układ klawiatury (Canadian Multilingual Standard) został zmodyfikowany tak, aby można było używać prawego klawisza Ctrl do uzyskiwania większej liczby znaków, w tym œ i innych obcych znaków, czasami martwego klawisza do wprowadzania kilku rodzajów znaków diakrytycznych w niektórych literach do wpisz język, w którym używany jest dany znak diakrytyczny. Dwuznak ij jest szczególnym przypadkiem, zwłaszcza w języku niderlandzkim, ponieważ gdy jest pisany odręcznie, wielka wersja (IJ) staje się bardzo podobna, jeśli nie nie do odróżnienia, od kursywnej litery Y, ale jeśli jest napisana zwykłą, małą literą wersja, to będzie wyglądać jak litera Y z diaerezą/umlautem (ÿ).
Podwójne litery
Digrafy mogą składać się z dwóch różnych znaków (digrafy heterogeniczne) lub dwóch wystąpień tego samego znaku (digrafy jednorodne). W tym drugim przypadku są one ogólnie nazywane podwójnymi (lub podwójnymi ) literami .
Podwójne litery samogłoskowe są powszechnie używane do wskazania długiego dźwięku samogłoski . Tak jest na przykład w języku fińskim i estońskim , gdzie ⟨uu⟩ reprezentuje dłuższą wersję samogłoski oznaczonej ⟨u⟩, ⟨ää⟩ reprezentuje dłuższą wersję samogłoski oznaczonej ⟨ä⟩ i tak dalej. W średnioangielskim sekwencje ⟨ee⟩ i ⟨oo⟩ były używane w podobny sposób, aby przedstawić odpowiednio wydłużone dźwięki „e” i „o”; obie pisownie zostały zachowane we współczesnej ortografii angielskiej , ale Wielkie Przesunięcie Samogłoski i inne historyczne zmiany dźwiękowe oznaczają, że współczesna wymowa znacznie różni się od oryginalnej.
Podwojonych liter spółgłosek można również użyć do wskazania długiego lub bliźniaczego dźwięku spółgłoski. Na przykład w języku włoskim spółgłoski pisane podwójnie wymawia się dłużej niż pojedyncze. Było to pierwotne użycie podwójnych liter spółgłoskowych w staroangielskim , ale w okresie średnioangielskim i wczesnoangielskim długość spółgłoski fonemicznej została utracona i rozwinęła się konwencja pisowni, w której podwójna spółgłoska służy do wskazania, że poprzedzająca samogłoska ma być wymawiana krótki. Na przykład we współczesnym angielskim ⟨pp⟩ stukania odróżnia dźwięk pierwszej samogłoski od tapingu . W rzadkich przypadkach podwójne litery spółgłosek reprezentują prawdziwą bliźniaczą spółgłoskę we współczesnym języku angielskim; może się to zdarzyć, gdy dwa wystąpienia tej samej spółgłoski pochodzą z różnych morfemów , na przykład ⟨nn⟩ w nienaturalnym ( un + natural ).
W niektórych przypadkach dźwięk reprezentowany przez podwójną spółgłoskę różni się w inny sposób niż długość od dźwięku odpowiadającej mu pojedynczej spółgłoski:
- W walijskim i grenlandzkim ⟨ll⟩ oznacza bezdźwięczną spółgłoskę boczną , podczas gdy w hiszpańskim i katalońskim oznacza spółgłoskę podniebienną .
- W kilku językach Europy Zachodniej, w tym angielskim, francuskim , portugalskim i katalońskim, dwuznak ⟨ss⟩ jest używany między samogłoskami do reprezentowania bezdźwięcznej sybilanty / s / , ponieważ samo ⟨s⟩ między samogłoskami zwykle reprezentuje dźwięczny sybilant / z / .
- W języku hiszpańskim, katalońskim i baskijskim ⟨rr⟩ jest używane między samogłoskami dla trylu pęcherzykowego / r / , ponieważ samo ⟨r⟩ między samogłoskami reprezentuje klapkę zębodołową / ɾ / (te dwa są różnymi fonemami w tych językach).
- W języku hiszpańskim dwuznak ⟨nn⟩ poprzednio oznaczał / ɲ / ( nos podniebienny ); rozwinął się w literę ñ .
- W języku baskijskim podwójne litery spółgłoskowe generalnie oznaczają spalatalizowane wersje pojedynczej spółgłoski, jak w ⟨dd⟩ , ⟨ll⟩, ⟨tt⟩ . Jednak ⟨rr⟩ to tryl, który kontrastuje z jednoliterową klapką, jak w języku hiszpańskim, a podniebienna wersja ⟨n⟩ jest zapisana ⟨ñ⟩.
W kilku europejskich systemach pisma, w tym w angielskim, podwojenie litery ⟨c⟩ lub ⟨k⟩ jest reprezentowane jako heterogeniczny dwuznak ⟨ck⟩ zamiast odpowiednio ⟨cc⟩ lub ⟨kk⟩. W rodzimych niemieckich słowach podwojenie ⟨z⟩, które odpowiada / ts / , jest zastąpione dwuznakiem ⟨tz⟩.
Digrafy pan-dialektyczne
Niektóre języki mają ujednoliconą ortografię z dwuznakami, które reprezentują różne wymowy w różnych dialektach ( diafonemy ). Na przykład w języku bretońskim istnieje dwuznak ⟨zh⟩, który reprezentuje [z] w większości dialektów, ale [h] w Vannetais. Podobnie, francuski dialekt Saintongeais ma dwuznak ⟨jh⟩, który reprezentuje [h] w słowach odpowiadających [ʒ] w standardowym francuskim. Podobnie kataloński ma dwuznak ⟨ix⟩, który reprezentuje [ʃ] we wschodnim katalońskim , ale [jʃ] lub [js] w zachodnio-katalońskim - walenckim .
Dzielone digrafy
Para liter tworzących fonem nie zawsze sąsiaduje ze sobą. Tak jest w przypadku angielskiego niemego e . Na przykład sekwencja a_e ma dźwięk / eɪ / w języku angielskim cake. Jest to wynikiem trzech historycznych zmian brzmieniowych: pierwotnie cake brzmiało /kakə/ , sylabę otwartą /ka/ zaczęto wymawiać długą samogłoską , a później końcowa schwa odpadła, pozostawiając /kaːk/ . Jeszcze później samogłoska / aː / stała się / eɪ / . Istnieje sześć takich dwuznaków w języku angielskim, ⟨a_e, e_e, i_e, o_e, u_e, y_e⟩.
Jednak alfabety mogą być również zaprojektowane z nieciągłymi dwuznakami. Na przykład w cyrylicy tatarskiej litera ю jest używana do zapisywania zarówno /ju/, jak i /jy/ . Zwykle różnica jest widoczna w pozostałej części słowa, ale kiedy tak nie jest, sekwencja ю...ь jest używana dla /jy/ , jak w юнь /jyn/ 'tani'.
Alfabety indyjskie wyróżniają się nieciągłymi samogłoskami, takimi jak tajski เ...อ / ɤː / w เกอ / kɤː / . Technicznie jednak można je uznać za znaki diakrytyczne , a nie pełne litery; to, czy są to digrafy, jest zatem kwestią definicji.
Niejednoznaczne sekwencje liter
Niektóre pary liter nie powinny być interpretowane jako dwuznaki, ale pojawiają się z powodu złożenia : hogshead i współpracuj . Często nie są one w żaden sposób oznaczone i dlatego należy je zapamiętać jako wyjątki. Jednak niektórzy autorzy wskazują to albo przez rozbicie dwuznaku myślnikiem , jak w hogs-head , co-operate , albo przez znak trema , jak w coöperate , ale użycie diaeresis spadło w języku angielskim w ciągu ostatnich wiek. Kiedy występuje w nazwach takich jak Clapham , Townshend i Hartshorne, nigdy nie jest w żaden sposób oznaczany. Alternatywne glify pozycyjne mogą pomóc w ujednoznacznieniu w niektórych przypadkach: gdy okrągłe, ⟨s⟩ było używane jako ostateczny wariant długiego ⟨ſ⟩, a angielski dwuznak przypominający / ʃ / zawsze byłby ⟨ſh⟩.
W latynizacji języka japońskiego dźwięki składowe ( morae ) są zwykle oznaczane dwuznakami, ale niektóre są oznaczone pojedynczą literą, a niektóre trygrafem. Przypadek niejednoznaczności to sylabiczny ん , który jest zapisywany jako n (lub czasami m ), z wyjątkiem przed samogłoskami lub y , gdzie następuje apostrof jako n' . Na przykład imię じ ゅ ん い ち ろ う jest latynizowane jako Jun'ichirō, więc jest analizowane jako „Jun-i-chi-rou”, a nie jako „Ju-ni-chi-rou”. Podobne użycie apostrofu jest widoczne w pinyin , gdzie 嫦娥 jest napisane Chang'e , ponieważ g należy do końca (-ang) pierwszej sylaby, a nie do początku drugiej sylaby. Bez apostrofu Zmiana byłaby rozumiana jako sylaba chan (końcowe -an), po której następuje sylaba ge (początkowe g-).
W kilku językach słowiańskich , np. czeskim , podwójne litery mogą występować w wyrazach złożonych, ale nie są one uważane za dwuznaki. Przykłady: bezzubý „bezzębny”, cenný „cenny”, černooký „czarnooki”.
W alfabetyzacji
W niektórych językach niektóre dwuznaki i trygrafy są liczone same w sobie jako odrębne litery i przypisywane do określonego miejsca w alfabecie , niezależnie od sekwencji znaków, która je tworzy, dla celów ortografii i zestawiania . Na przykład:
- W alfabecie łacińskim Gaja używanym do zapisu serbsko-chorwackiego dwuznaki ⟨dž⟩ , ⟨lj⟩ i ⟨nj⟩ , które odpowiadają pojedynczym literom cyrylicy ⟨џ⟩, ⟨љ⟩, ⟨њ⟩, są traktowane jako odrębne litery .
- W alfabecie czeskim i słowackim ⟨ch⟩ jest traktowane jako odrębna litera, występująca po ⟨h⟩ w alfabecie. Również w alfabecie słowackim stosunkowo rzadkie dwuznaki ⟨dz⟩ i ⟨dž⟩ są traktowane jako odrębne litery.
- W alfabecie duńskim i norweskim dawny dwuznak ⟨aa⟩ , w którym występuje w starszych nazwach, jest posortowany tak, jakby był literą ⟨å⟩ , która go zastąpiła.
- W alfabecie norweskim istnieje kilka dwuznaków i kombinacji liter reprezentujących izolowany dźwięk.
- W alfabecie niderlandzkim dwuznak ⟨ij⟩ jest czasami zapisywany jako ligatura i można go sortować za pomocą ⟨y⟩ (w Holandii , chociaż zwykle nie w Belgii ); jednak niezależnie od tego, gdzie jest używany, kiedy holenderskie słowo zaczynające się na „ij” jest pisane wielką literą, cały dwuznak jest pisany wielką literą ( IJmeer , IJmuiden ). Inne niderlandzkie dwuznaki nigdy nie są traktowane jako pojedyncze litery.
- W języku węgierskim dwuznaki ⟨cs⟩ , ⟨dz⟩ , ⟨gy⟩ , ⟨ly⟩ , ⟨ny⟩ , ⟨sz⟩ , ⟨ty⟩ , ⟨zs⟩ i trygraf ⟨dzs⟩ mają swoje własne miejsca w alfabet (gdzie ⟨cs⟩ następuje po ⟨c⟩, ⟨dz⟩ i ⟨dzs⟩ następuje po ⟨d⟩ itd.)
- W języku hiszpańskim dwuznaki ⟨ch⟩ i ⟨ll⟩ były wcześniej traktowane jako odrębne litery, ale teraz są podzielone na litery składowe.
- W języku walijskim alfabet zawiera dwuznaki ⟨ch⟩ , ⟨dd⟩ , ⟨ff⟩ , ⟨ll⟩ , ⟨ng⟩ , ⟨ph⟩ , ⟨rh⟩ , ⟨th⟩ . Jednak ⟨mh⟩ , ⟨nh⟩ i ⟨ngh⟩ , które reprezentują zmutowane spółgłoski bezdźwięczne, nie są traktowane jako odrębne litery.
- W latynizacji kilku krajów słowiańskich, które używają cyrylicy, litery takie jak ш, ж i ч mogą być zapisywane jako sh, zh i ch, jednak czasami wynik latynizacji może zmienić literę na literę diakrytyczną zamiast litery dwuznak.
- W języku maltańskim używane są dwa dwuznaki, għ, który występuje zaraz po g, a więc zaraz po i.
Większość innych języków, w tym angielski, francuski, niemiecki, polski itp., traktuje dwuznaki jako kombinacje oddzielnych liter dla celów alfabetycznych.
Przykłady
pismo łacińskie
język angielski
Angielski ma zarówno jednorodne digrafy (podwójne litery), jak i heterogeniczne dwuznaki (digrafy składające się z dwóch różnych liter). Do tego ostatniego typu należą:
- ⟨sc⟩ normalnie reprezentuje / s / ( bezdźwięczna szczelina zębodołowa - scena ) lub / ʃ / ( bezdźwięczna szczelina pozapęcherzykowa - świadoma ) przed ⟨e⟩ lub ⟨i⟩.
- ⟨ng⟩ reprezentuje /ŋ/ ( welarny nosowy ) jak w rzecz .
- ⟨ ch ⟩ zwykle odpowiada / tʃ / ( bezdźwięczna afrykata pozapęcherzykowa - kościół ), / k / ( bezdźwięczna spółgłoska welarna ), gdy jest używana jako dwuznak etymologiczny w słowach pochodzenia greckiego ( chrystus ), rzadziej / ʃ / ( bezdźwięczna pozapęcherzykowa fricative ) słowami pochodzenia francuskiego ( szampan ).
- ⟨ck⟩ odpowiada / k / jak w czeku .
- ⟨ gh ⟩ reprezentuje / ɡ / ( dźwięczna spółgłoska welarna ) na początku słów ( duch ), reprezentuje / f / ( bezdźwięczna szczelina wargowo - zębowa w wystarczającym stopniu ) lub milczy na końcu słów ( westchnienie ).
- ⟨ph⟩ reprezentuje / f / ( bezdźwięczna szczelina wargowo-zębowa ), jak w syfonie .
- ⟨rh⟩ reprezentuje angielskie / r / słowami pochodzenia greckiego, takimi jak rytm .
- ⟨ sh ⟩ reprezentuje / ʃ / ( bezdźwięczna szczelina pozapęcherzykowa ), jak u owiec .
- ⟨ti⟩ zwykle reprezentuje / ʃ / słowo-środkowo przed samogłoską, jak w edukacji .
- ⟨ th ⟩ zwykle odpowiada / θ / ( bezdźwięczna szczelina międzyzębowa ) w cienkim lub / ð / ( dźwięczna szczelina międzyzębowa ) w następnie . Zobacz także Wymowa języka angielskiego ⟨th⟩ .
- ⟨wh⟩ reprezentuje / hw / w niektórych konserwatywnych dialektach; /w/ w innych dialektach ( while ); i / h / w kilku słowach, w których następuje ⟨o⟩, na przykład kto i całość . Zobacz także historię fonologiczną ⟨wh⟩ .
- ⟨zh⟩ reprezentuje / ʒ / słowami transliterowanymi z języków słowiańskich [ które? ] , aw amerykańskim słowniku pisownia wymowy.
- ⟨ci⟩ zwykle pojawia się jako / ʃ / przed samogłoskami, jak w twarzowych i sztucznych . W przeciwnym razie jest to / si / jak w przypadku hodowcy i bardziej lodowatego lub / sɪ / jak w przypadku kwasu i zjełczałego .
- ⟨wr⟩ reprezentuje / r / . Pierwotnie oznaczało labializowany , podczas gdy ⟨r⟩ bez ⟨w⟩ nie było labializowane, ale rozróżnienie to zostało utracone w większości dialektów, oba dźwięki łączą się w jeden aproksymant zębodołowy , alofonicznie labializowany na początku sylab, jak na czerwono [ɹʷɛd] . Zobacz także spółgłoskę rotyczną .
- ⟨qu⟩ zwykle reprezentuje / kw / ; Po ⟨q⟩ zwykle następuje ⟨u⟩ i litera samogłoskowa, jak w quick , z pewnymi wyjątkami.
Dwuznaki mogą również składać się z samogłosek. Niektóre litery ⟨a, e, o⟩ są preferowane na pierwszej pozycji, inne na drugiej ⟨i, u⟩. Te ostatnie mają allografy ⟨y, w⟩ w ortografii angielskiej .
druga litera → pierwsza litera ↓ |
⟨...mi⟩ | ⟨...i⟩ ¦ ⟨...y⟩ | ⟨...u⟩ ¦ ⟨...w⟩ | ⟨...A⟩ | ⟨...o⟩ |
---|---|---|---|---|---|
⟨o...⟩ | ⟨oe¦œ⟩ > ⟨e⟩ – / i / | ⟨oi¦oy⟩ – / ɔɪ / | ⟨ou¦ow⟩ – /aʊ¦uː¦oʊ/ | ⟨oa⟩ – /oʊ¦ɔː/ | ⟨oo⟩ – /uː¦ʊ(¦ʌ)/ |
⟨A...⟩ | ⟨ae¦æ⟩ > ⟨e⟩ – / i / | ⟨ai¦ay⟩ – /eɪ¦ɛ/ |
⟨au¦aw⟩ - / ɔː / (w zapożyczeniach: / aʊ / ) |
(w zapożyczeniach i rzeczownikach własnych: ⟨aa⟩ - / ə¦ɔː¦ɔl / ) | (w zapożyczeniach z chińskiego: ⟨ao⟩ - / aʊ / ) |
⟨mi...⟩ | ⟨ee⟩ – / iː / | ⟨ei¦ey⟩ – /aɪ¦eɪ¦(iː)/ | ⟨eu¦ew⟩ – /juː¦uː/ | ⟨ea⟩ – /iː¦ɛ¦(eɪ¦ɪə)/ | |
⟨u...⟩ | ⟨ue⟩ – /uː¦u/ | ⟨ui⟩ – /ɪ¦uː/ | |||
⟨I...⟩ | ⟨ie⟩ – /iː(¦aɪ)/ |
Inne języki używające alfabetu łacińskiego
po serbsko-chorwacku :
- ⟨ lj ⟩ odpowiada / ʎ / , ( przybliżenie boczne podniebienia )
- ⟨ nj ⟩ odpowiada / ɲ / ( podniebienie nosowe )
- ⟨ dž ⟩ odpowiada / d͡ʒ / ( dźwięczny afrykat pozapęcherzykowy )
Zwróć uwagę, że w ortografii cyrylicy dźwięki te są reprezentowane przez pojedyncze litery (љ, њ, џ).
- ⟨ ch ⟩ odpowiada / x / ( bezdźwięczna szczelina welarna ), liczona jako odrębna litera
- ⟨ dz ⟩ odpowiada / d͡z / ( dźwięczny afrykat zębodołowy ), liczony jako odrębna litera w języku słowackim, stosunkowo rzadki dwuznak
- ⟨ dž ⟩ odpowiada / d͡ʒ / ( dźwięczny afrykat pozapęcherzykowy ), liczony jako odrębna litera w języku słowackim, stosunkowo rzadki dwuznak
po duńsku i norwesku :
- Dwuznak ⟨ aa ⟩ reprezentował / ɔ / do 1917 roku w Norwegii i 1948 w Danii, ale dziś jest zapisywany jako ⟨ å ⟩. Dwuznak jest nadal używany w starszych nazwach, ale sortowany tak, jakby to była litera ze znakiem diakrytycznym.
W języku norweskim kilka dźwięków można przedstawić tylko za pomocą dwuznaku lub kombinacji liter. Są to najczęstsze kombinacje, ale istnieją skrajne różnice regionalne, zwłaszcza w przypadku dialektów wschodnich . Godną uwagi różnicą jest aspiracja rs we wschodnich dialektach, gdzie odpowiada ona skj i sj . Wśród wielu młodych ludzi, zwłaszcza w zachodnich regionach Norwegii oraz w dużych miastach lub wokół nich, różnica między ç i ʃ została całkowicie zatarta i teraz wymawia się je tak samo.
- ⟨kj⟩ reprezentuje / ç / jak w ch w języku niemieckim i ch lub x w Mé x ico.
- ⟨tj⟩ reprezentuje / ç / jak w ch w języku niemieckim i ch lub x w Mé x ico.
- ⟨skj⟩ reprezentuje / ʃ / jak w sh w angielskim she .
- ⟨sj⟩ reprezentuje / ʃ / jak w sh w angielskim she .
- ⟨sk⟩ reprezentuje / ʃ / (przed i lub y), jak w sh w angielskim she .
- ⟨ ng ⟩ reprezentuje / ŋ / jak w ng w angielskim thi ng .
po katalońsku :
- ⟨ll⟩ reprezentuje / ʎ / ( podniebienny boczny przybliżony )
- ⟨ny⟩ reprezentuje / ɲ / ( nos podniebienny )
- ⟨rr⟩ reprezentuje / r / ( tryl post-pęcherzykowy )
- ⟨ss⟩ reprezentuje / s / ( bezdźwięczny syczący wyrostek zębodołowy )
- ⟨qu⟩ reprezentuje / k / ( bezdźwięczna welarna spółgłoska zwarta )
- ⟨gu⟩ reprezentuje / g / ( dźwięczna welarna spółgłoska zwarta )
- postwokaliczny ⟨ix⟩ reprezentuje / ʃ / ( bezdźwięczna szczelina pozapęcherzykowa ) w dialektach wschodnich , w dialektach zachodnich reprezentuje / jʃ /.
po niderlandzku :
- ⟨ ij ⟩ odpowiada / ɛi / (patrz powyżej jego możliwy status jako oddzielna litera).
- ⟨ ng ⟩ reprezentuje / ŋ / ( welarny nosowy )
- ⟨ ch ⟩ reprezentuje / x / ( bezdźwięczna szczelina welarna )
- ⟨sj⟩ reprezentuje / ʃ / ( bezdźwięczna szczelina pozapęcherzykowa )
- ⟨ie⟩ reprezentuje / i / ( samogłoska przednia zamknięta niezaokrąglona )
- ⟨oe⟩ reprezentuje /u/ ( zamknięta zaokrąglona samogłoska )
- ⟨eu⟩ reprezentuje / ø / ( samogłoska zaokrąglona przednia blisko środkowa )
po francusku :
- ⟨ch⟩ reprezentuje / ʃ / ( bezdźwięczna szczelina pozapęcherzykowa )
- ⟨gn⟩ reprezentuje / ɲ / ( nos podniebienny )
- ⟨qu⟩ reprezentuje / k / ( bezdźwięczny zwarty welarny ), zwykle przed historycznymi samogłoskami przednimi
Francuskie dwuznaki wokalne ⟨...I⟩ ⟨...u⟩ ⟨A...⟩ ⟨ai⟩ – /ɛ¦e/ ⟨au⟩ – / o / ⟨mi...⟩ ⟨ei⟩ – / ɛ / ⟨eu⟩ – /œ¦ø/ ⟨o...⟩ ⟨oi⟩ – / wa / ⟨ty⟩ – /u(¦w)/
Zobacz także fonologię francuską .
po niemiecku :
- ⟨ ch ⟩ reprezentuje / x / ( bezdźwięczna szczelina welarna ) lub / ç / ( bezdźwięczna szczelina podniebienna )
- ⟨ck⟩ reprezentuje / k / ( bezdźwięczna welarna spółgłoska zwarta )
- ⟨ei⟩ reprezentuje / a͡ɪ / ( samogłoska otwarta przednia niezaokrąglona ), po której następuje ( samogłoska prawie bliska przednia niezaokrąglona )
- ⟨eu⟩ reprezentuje / ɔ͡ʏ / ( samogłoska otwarta środkowa tylna zaokrąglona ), po której następuje ( samogłoska zaokrąglona prawie zamknięta blisko przodu )
po węgiersku :
- ⟨ cs ⟩ reprezentuje / tʃ / ( bezdźwięczny afrykat pozapęcherzykowy )
- ⟨ zs ⟩ reprezentuje / ʒ / ( dźwięczna szczelina pozapęcherzykowa )
- ⟨ gy ⟩ reprezentuje / ɟ / ( dźwięczna podniebienna zwarta )
- ⟨ ly ⟩ pierwotnie reprezentowane / ʎ / ( przybliżenie podniebienia bocznego ), ale we współczesnym języku oznacza / j/ ( przybliżenie podniebienia )
- ⟨ ny ⟩ reprezentuje / ɲ / ( podniebienny nosowy )
- ⟨ ty ⟩ reprezentuje / c / ( bezdźwięczna podniebienna zwarta )
- ⟨ dz ⟩ reprezentuje / dz / ( dźwięczny afrykat pozapęcherzykowy )
- ⟨ sz ⟩ reprezentuje / s / ( bezdźwięczna szczelina zębodołowa ) (⟨s⟩ wymawia się / ʃ / )
- Alfabet węgierski zawiera dodatkowo trygraf ⟨ dzs ⟩ / dʒ / .
po włosku :
- ⟨sc⟩ odpowiada / ʃ / , ( bezdźwięczna pozapęcherzykowa szczelina zębodołowa ) przed -i i -e (ale / sk / przed innymi literami)
- ⟨ch⟩ odpowiada / k / (tylko przed i, e)
- ⟨gh⟩ odpowiada / ɡ / (tylko przed i, e)
- ⟨gl⟩ reprezentuje / ʎ / , podniebienny boczny przybliżony , przed -i (z pewnymi wyjątkami)
- ⟨gn⟩ reprezentuje / ɲ / ( nos podniebienny )
W języku gaelickim Manx ⟨ch⟩ reprezentuje /χ/ , ale ⟨çh⟩ reprezentuje / tʃ/ .
po polsku :
- ⟨ ch ⟩ odpowiada / x / ( bezdźwięczna szczelina welarna )
- ⟨ cz ⟩ odpowiada / tʂ / ( bezdźwięczna retrofleksyjna afrykata )
- ⟨ dz ⟩ odpowiada / dz / ( dźwięczny afrykat zębodołowy )
- ⟨ dź ⟩ odpowiada / dʑ / ( dźwięczny afrykat zębodołowo-podniebienny )
- ⟨ dż ⟩ odpowiada / dʐ / ( dźwięczna afrykata retrofleksyjna )
- ⟨ rz ⟩ odpowiada / ʐ / ( dźwięczna retrofleksyjna szczelina )
- ⟨ sz ⟩ odpowiada / ʂ / ( bezdźwięczna retrofleksyjna szczelina )
po portugalsku :
- ⟨ ch ⟩ odpowiada / ʃ / ( bezdźwięczna szczelina pozapęcherzykowa )
- ⟨ lh ⟩ odpowiada / ʎ / ( przybliżenie boczne podniebienia )
- ⟨ nh ⟩ odpowiada / ɲ / ( podniebienie nosowe )
- ⟨qu⟩ zwykle reprezentuje / k / ( bezdźwięczny zwarty welarny )
po hiszpańsku :
- ⟨ll⟩ jest tradycyjnie (ale teraz zwykle nie) wymawiane / ʎ /
- ⟨ch⟩ reprezentuje / tʃ / ( bezdźwięczny afrykat pozapęcherzykowy ). Od 2010 roku żadne z nich nie jest uważane za część alfabetu. Kiedyś były sortowane jako oddzielne listy, ale reforma przeprowadzona w 1994 roku przez Hiszpańską Akademię Królewską pozwoliła na podzielenie ich na listy składowe w celu zestawienia. Dwuznak ⟨ rr ⟩, wymawiany jako odrębny tryl zębodołowy , nigdy nie był oficjalnie uważany za literę alfabetu hiszpańskiego i to samo dotyczy ⟨gu⟩ i ⟨qu⟩ (odpowiednio dla / ɡ / i / k / przed ⟨ e⟩ lub ⟨i⟩).
po walijsku :
- ⟨ng⟩ reprezentuje / ŋ / ( welar nosowy ), ten sam dźwięk co w języku angielskim (ale w niektórych słowach wymawia się / ng / ).
- ⟨ch⟩ reprezentuje / χ / ( bezdźwięczna szczelina języczkowa )
- ⟨rh⟩ reprezentuje / r̥/ ( bezdźwięczny tryl zębodołowy ), wymawiane z grubsza jak kombinacja hr .
- ⟨th⟩ reprezentuje / θ / ( bezdźwięczna szczelina międzyzębowa )
- ⟨ dd ⟩ reprezentuje / ð / ( dźwięczny fricative dentystyczny ), podobnie jak angielskie ⟨th⟩ w tamtym czasie (ale w wielu kontekstach jest wymawiane jako bezdźwięczne).
- ⟨ ff ⟩ reprezentuje / f / ( bezdźwięczna szczelina wargowo-zębowa ), jak angielskie ⟨f⟩, ponieważ walijskie ⟨f⟩ wymawia się / v / jak angielskie ⟨v⟩.
- ⟨ph⟩ reprezentuje również / f / (bezdźwięczna szczelina wargowo-zębowa), ale we współczesnej ortografii jest używane tylko do mutacji aspiracyjnej słów zaczynających się na ⟨p⟩.
- ⟨ ll ⟩ reprezentuje / ɬ / ( bezdźwięczna szczelina boczna zębodołowa )
Wymienione powyżej dwuznaki reprezentują różne fonemy i są traktowane jako oddzielne litery do celów zestawiania. Natomiast dwuznaki ⟨ mh ⟩, ⟨ nh ⟩ i trygraf ⟨ ngh ⟩, które oznaczają spółgłoski bezdźwięczne , ale występują tylko na początku wyrazów w wyniku mutacji nosowej , nie są traktowane jako osobne litery, i dlatego nie są ujęte w alfabecie.
Daighi tongiong pingim , system transkrypcji używany w tajwańskim Hokkien , obejmuje lub który reprezentuje / ə / ( środkowa samogłoska środkowa ) lub / o / ( samogłoska zamknięta środkowa tylna zaokrąglona ), a także inne dwuznaki.
po joruba :
- ⟨gb⟩ to alfabet, a spółgłoska zwarta najdokładniej wymawia się, próbując powiedzieć /g/ i /b/ w tym samym czasie.
cyrylica
Współczesne języki słowiańskie pisane cyrylicą w niewielkim stopniu wykorzystują dwuznaki oprócz ⟨дж⟩ dla / dʐ/ , ⟨дз⟩ dla / dz / (w języku ukraińskim, białoruskim i bułgarskim) oraz ⟨жж⟩ i ⟨зж⟩ dla rzadki fonem rosyjski / ʑː / . W języku rosyjskim sekwencje ⟨дж⟩ i ⟨дз⟩ występują (głównie w zapożyczeniach), ale są wymawiane jako kombinacje implozji (czasami traktowanej jako afrykata) i frykaty; implozje są traktowane jako alofony liczby spółgłoskowej /d̪/, więc ciągi te nie są uważane za dwuznaki. Cyrylica ma niewiele dwuznaków, chyba że jest używana do pisania języków niesłowiańskich, zwłaszcza języków kaukaskich .
Pismo arabskie
Ponieważ samogłoski na ogół nie są zapisywane, dwuznaki są rzadkie w abjadach , takich jak arabski. Na przykład, jeśli zamiast š użyto sh , to sekwencja sh mogłaby oznaczać albo ša , albo saha. Jednak dwuznaki są używane dla spółgłosek przydechowych i szeptanych (tych pisanych z h- digrafami w transkrypcji łacińskiej) w językach Azji Południowej, takich jak urdu , które są pisane w alfabecie arabskim specjalną formą litery h , która jest używana tylko dla dwuznaków aspiracji, co widać w przypadku następujących spółgłosek łączących (kh) i niełączących (ḍh) :
urdu złączony niełączący dwuznak: کھا /kʰɑː/ ڈھا / ɖʱ ɑː / sekwencja: کہا /kəɦɑː/ ڈہا /ɖəɦɑː/
ormiański
W języku ormiańskim dwuznak ու ⟨ou⟩ zastępuje / u / , konwencję wywodzącą się z języka greckiego.
gruziński
Alfabet gruziński używa kilku dwuznaków do zapisu w innych językach. Na przykład w języku Svan / ø / jest zapisywane jako ჳე ⟨we⟩, a / y / jako ჳი ⟨wi⟩.
grecki
Współczesna greka ma następujące dwuznaki:
- αι ( ai ) reprezentuje /e̞/
- ει ( ei ) reprezentuje /i/
- οι ( oi ) reprezentuje / i /
- ου ( oy ) reprezentuje /u/
- υι ( yi ) reprezentuje /i/
języku greckim nazywa się je „dyftongami” ; w czasach klasycznych większość z nich reprezentowała dyftongi i nazwa się przyjęła.
- γγ ( gg ) reprezentuje /ŋɡ/ lub /ɡ/
- τσ ( ts ) reprezentuje afrykat / ts /
- τζ ( tz ) reprezentuje afrykat /dz/
- Inicjał γκ ( gk ) reprezentuje / ɡ /
- Początkowe μπ ( mp ) reprezentuje /b/
- Początkowe ντ ( nt ) reprezentuje /d/
Starożytna greka również miała wymienione powyżej „dyftongi”, chociaż ich wymowa w starożytności jest kwestionowana. Ponadto starożytna greka również używała litery γ w połączeniu ze stoperem welarnym, aby utworzyć następujące dwuznaki:
- γγ ( gg ) reprezentuje /ŋɡ/
- γκ ( gk ) reprezentuje /ŋɡ/
- γχ ( gkh ) reprezentuje /ŋkʰ/
Tsakonian ma kilka dodatkowych dwuznaków:
- ρζ ( rz ) / ʒ / (historycznie być może tryl frykcyjny )
- κχ ( kkh ) reprezentuje /kʰ/
- τθ ( tth ) reprezentuje /tʰ/
- πφ ( pph ) reprezentuje /pʰ/
- σχ ( skh ) reprezentuje / ʃ /
Ponadto spółgłoski podniebienne są oznaczone literą samogłoski ι , co jest jednak w dużej mierze przewidywalne. Gdy /n/ i /l/ nie są spalatalizowane przed ι , są zapisywane jako νν i λλ .
W Bactrian dwuznaki ββ , δδ i γγ były używane odpowiednio dla /b/ , /d/ i /ŋg/ .
hebrajski
י W alfabecie hebrajskim תס i תש można czasami znaleźć dla צ <a i=9>/ / ts / . Współczesny hebrajski używa również dwuznaków wykonanych z ׳ dla dźwięków obcych: ג׳ <a i=17>/ / dʒ / , ז׳ <a i=23>/ / ʒ / , צ׳ <a i=29>/ / tʃ / ; i inne dwuznaki liter, gdy jest napisane bez samogłosek: וו dla spółgłoski ו w środku wyrazu i יי dla / aj / lub / aji / itp., czyli spółgłoski <a i=43>י w miejscach, w których można się było tego nie spodziewać. Jidysz ma własną tradycję transkrypcji i dlatego używa różnych dwuznaków dla niektórych z tych samych dźwięków: דז <a i=49>/ / dz / , זש <a i=55>/ / ʒ / , טש <a i=61>/ / tʃ / i דזש (dosłownie dzš ) dla / dʒ / , וו <a i=76>/ / v / , dostępny również jako pojedynczy znak Unicode װ , וי lub jako pojedynczy znak w Unicode ױ <a i=87> / oj/ , יי lub ײ <a i=93> / ej/ i ײַ <a i=97> / aj/ . Jednoznakowe dwuznaki nazywane są w Unicode „ ligaturami ”. י może być również użyte po spółgłosce w celu wskazania palatalizacji w zapożyczeniach słowiańskich.
Ind
Większość pism indyjskich ma złożone znaki diakrytyczne samogłosek , których nie można przewidzieć na podstawie ich poszczególnych elementów. Można to zilustrować za pomocą języka tajskiego , w którym znak diakrytyczny เ, wymawiany samodzielnie / eː/ , modyfikuje wymowę innych samogłosek:
pojedynczy znak samogłoskowy: กา / kaː / , เก /keː/ , กอ /kɔː/ znak samogłoski plus เ: เกา /kaw/ , แก /kɛː/ , เกอ /kɤː/
Ponadto kombinacja รร wymawiana jest jako /a/ lub /an/ , są słowa, w których kombinacje ทร i ศร oznaczają /s/ , a litera ห, jako przedrostek spółgłoski, zmienia jej klasę toniczną na wysoki, modyfikując ton sylaby.
Eskimosów
Sylaby Inuktitut dodają dwa dwuznaki do Cree:
- rk dla q
- ᙯ qai , ᕿ qi , ᖁ qu , ᖃ qa , ᖅ q
I
- ng dla ŋ
- ᖕ ng
Ten ostatni tworzy trygrafy i tetragrafy.
Znaki CJK
chiński
Kilka kombinacji chińskich znaków (Hanzi) utworzonych z dwóch lub więcej różnych znaków, zwanych dwuznakami.
język japoński
Dwie kana można połączyć w sylabę CV przez dodanie drugiej; konwencja anuluje samogłoskę pierwszego. Jest to powszechnie wykonywane w przypadku sylab CyV zwanych yōon , jak w ひ ょ (ひ よ ) hyo ⟨hi yo ⟩. Nie są to dwuznaki, ponieważ zachowują normalny sekwencyjny odczyt dwóch glifów. Jednak niektóre przestarzałe sekwencje nie zachowują już tego czytania, jak wくゎ kwa, ぐゎ gwa iむゎ mwa, teraz wymawiane ka, ga, ma . Ponadto digrafy niesekwencyjne są używane w przypadku pożyczek zagranicznych, które nie są zgodne z normalnymi japońskimi asybilacji , takimi jakティ ti ,トゥ tu ,チェ tye / che ,スェ swe ,ウィ wi ,ツォ tso ,ズィ zi . (Patrz katakana i transkrypcja na język japoński dla pełnych tabel).
Długie samogłoski są zapisywane przez dodanie kana dla tej samogłoski, w efekcie ją podwajając. Jednak długie ō można zapisać oo lub ou , jak w と う き ょ う toukyou [toːkʲoː] 'Tōkyō'. Dla dialektów, które nie rozróżniają ē i ei , ta ostatnia pisownia jest używana dla długiego e , jak w へいせい heisei [heːseː] ' Heisei '. W zapożyczeniach chōonpu , linia zgodna z kierunkiem tekstu, jak w ビ ー ル bīru [bi: ru] bīru 'piwo'. Z wyjątkiem sylab rozpoczynających się na literę n , podwójne spółgłoski są zapisywane przez poprzedzenie mniejszej wersji tsu (pisanej odpowiednio っ i ッ w hiraganie i katakanie), jak w き っ て kitte „pieczęć”. Spółgłoski zaczynające się na literę n używają zamiast tego znaku kana n (pisanego ん lub ン) jako przedrostka.
Istnieje kilka konwencji kana z Okinawy , które obejmują dwuznaki lub ligatury w indeksie dolnym. Na przykład w systemie Uniwersytetu Ryukyu ウ to / ʔu / , ヲ to / o / , ale ヲ ゥ (ヲ ウ ) to / u / .
koreański
Podobnie jak w przypadku języka greckiego, koreański ma samogłoski wywodzące się z dyftongów, które nadal są pisane dwiema literami. Te dwuznaki, ㅐ /ɛ/ i ㅔ /e/ (również ㅒ /jɛ/ , ㅖ /je/ ), aw niektórych dialektach ㅚ /ø/ i ㅟ /y/ , wszystkie kończą się na historycznym ㅣ /i/ .
Hangul został zaprojektowany z serią dwuznaków do reprezentowania „ mętnych ” spółgłosek: ㅃ *[b] , ㄸ *[d] , ㅉ *[dz] , ㄲ *[ɡ] , ㅆ *[z] , ㆅ *[ɣ] ; również ᅇ o niepewnej wartości. Te wartości są już przestarzałe, ale większość podwójnych liter została wskrzeszona w XIX wieku, aby pisać spółgłoski, które nie istniały, gdy wymyślono hangul: ㅃ / p͈/ , ㄸ / t͈/ , ㅉ / t͈ɕ/ , ㄲ / k͈/ , ㅆ /s͈/ .
Ligatury i nowe litery
Dwuznaki czasami są zapisywane jako pojedyncza ligatura. Z biegiem czasu ligatury mogą ewoluować w nowe litery lub litery ze znakami diakrytycznymi. Na przykład sz stało się ß w języku niemieckim, a „nn” stało się ñ w języku hiszpańskim.
W Unikodzie
Ogólnie rzecz biorąc, dwuznak jest po prostu reprezentowany za pomocą dwóch znaków w Unicode . Jednak z różnych powodów Unicode czasami zapewnia oddzielny punkt kodowy dla dwuznaku, zakodowany jako pojedynczy znak.
Dwuznaki DZ i IJ oraz dwuznaki serbsko-chorwackie DŽ, LJ i NJ mają oddzielne punkty kodowe w Unicode.
Dwa glify Dwuznak Punkt kodu Unicode HTML DZ, dz, dz DZ, Dz, dz U+01F1 U+01F2 U+01F3 DZ Dz dz DŽ, Dž, dž DŽ, Dž, dž U+01C4 U+01C5 U+01C6 DŽ Dž dž IJ, ij IJ, ij U+0132 U+0133 IJ ij LJ, Lj, lj LJ, Lj, lj U+01C7 U+01C8 U+01C9 LJ Lj lj NJ, Nj, nj NJ, Nj, nj U+01CA U+01CB U+01CC NJ Nj nj cz ᵺ U+1D7A
Zobacz także Ligatury w Unicode .
Zobacz też
- Multigraf (ortografia)
- trygraf
- Tetragraf
- Pentagraf
- Heksagraf
- biggram
- Dyftong
- Lista liter łacińskich
- Digraf (programowanie)