sylabizacja
Syllabizacja ( / , s ɪ ˌ l æ b ɪ f ɪ k eɪ ʃ ən / ) lub sylabizacja ( / , s ɪ ˌ l æ b ɪ k eɪ ʃ ən / ) znany również jako dzielenie wyrazów to oddzielenie słowa na sylab , zarówno mówionych, pisanych, jak i podpisanych.
Przegląd
Pisemny podział na sylaby jest zwykle oznaczany łącznikiem, gdy używana jest ortografia angielska (np. syl-la-ble) oraz kropka podczas transkrypcji faktycznie wymawianych sylab w międzynarodowym alfabecie fonetycznym (np. [ˈsɪl.ə.bᵊɫ] ) . Do celów prezentacji typografowie mogą używać interpunkcji ( znak Unicode U+00B7, np. sylaba), specjalnego „kropki dzielenia wyrazów” (U+2027, np. sylaba) lub spacji (np. sylaba).
Na końcu wersu wyraz jest pisemnie rozdzielany na części, umownie zwane „sylabami”, jeśli nie mieści się w wierszu i jeśli przeniesienie go do następnego wiersza spowodowałoby, że pierwszy wiersz byłby znacznie krótszy niż pozostałe. Może to stanowić szczególny problem w przypadku bardzo długich słów i wąskich kolumn w gazetach. Przetwarzanie tekstów zautomatyzowało proces justowania , sprawiając, że sylabizacja krótszych słów jest często zbędna.
W niektórych językach sylaby mówione są również podstawą sylabizacji w piśmie. Jednak prawdopodobnie ze względu na słabą zgodność między dźwiękami i literami w pisowni współczesnego języka angielskiego, pisemna sylabizacja w języku angielskim opiera się głównie na zasadach etymologicznych lub morfologicznych , a nie fonetycznych . Na przykład nie jest możliwe sylabizacja „uczenia się” jako uczenia się zgodnie z poprawną sylabizacją żywego języka. Widząc tylko jasne- na końcu wiersza może wprowadzić czytelnika w błąd i spowodować nieprawidłową wymowę słowa, ponieważ dwuznak ea może mieć wiele różnych wartości . Historia ortografii angielskiej wyjaśnia takie zjawiska.
Dlatego angielska sylabizacja pisana dotyczy pojęcia „sylaby”, które nie odpowiada językowej koncepcji jednostki fonologicznej (w przeciwieństwie do morfologicznej).
W rezultacie nawet większość rodzimych użytkowników języka angielskiego nie jest w stanie sylabizować słów zgodnie z ustalonymi zasadami bez konsultacji ze słownikiem lub korzystania z edytora tekstu. Szkoły zwykle nie udzielają o wiele więcej porad na ten temat niż zajrzenie do słownika. Ponadto istnieją różnice między brytyjską i amerykańską sylabizacją, a nawet między słownikami tej samej odmiany języka angielskiego.
W fińskim , włoskim , portugalskim , japońskim ( romaji ) i innych językach, których pisownia jest prawie fonemiczna, pisarze mogą w zasadzie poprawnie sylabizować każde istniejące lub nowo utworzone słowo, stosując jedynie ogólne zasady. W Finlandii dzieci są najpierw uczone dzielenia wyrazów, aż do momentu, gdy niezawodnie utworzą poprawną sylabę, po czym łączniki można pominąć.
Algorytm
Czy istnieje idealny algorytm sylabizacji w języku angielskim?
Algorytm dzielenia wyrazów to zestaw reguł, zwłaszcza jeden skodyfikowany do implementacji w programie komputerowym, który decyduje o tym, w których punktach słowo może zostać podzielone na dwie linie łącznikiem. Na przykład algorytm dzielenia wyrazów może zadecydować, że impeachment można podzielić na impeachment lub impeachment, ale nie impeachment .
Jednym z powodów złożoności zasad dzielenia słów jest to, że różne dialekty języka angielskiego mają tendencję do różnic w dzieleniu wyrazów [ potrzebne źródło ] : amerykański angielski ma tendencję do pracy nad dźwiękiem, ale brytyjski angielski ma tendencję do patrzenia na pochodzenie słowa a potem brzmieć. Istnieje również duża liczba wyjątków, co dodatkowo komplikuje sprawę.
Niektóre praktyczne zasady można znaleźć w książce Majora Keary'ego „O dzieleniu wyrazów – anarchia pedanterii”. Wśród algorytmicznych podejść do dzielenia wyrazów szeroko stosowane jest to zaimplementowane w systemie składu TeX . Jest to dokładnie udokumentowane w pierwszych dwóch tomach Computers and Typesetting autorstwa Donalda Knutha oraz w rozprawie Franklina Marka Lianga. Celem pracy Lianga było uzyskanie tak dokładnego algorytmu, jak to tylko możliwe, i utrzymanie małego słownika wyjątków.
W oryginalnych wzorcach dzielenia wyrazów TeX-a dla amerykańskiego angielskiego lista wyjątków zawiera tylko 14 słów.
W TeX-u
Porty algorytmu dzielenia wyrazów TeX są dostępne jako biblioteki dla kilku języków programowania, w tym Haskell , JavaScript , Perl , PostScript , Python , Ruby , C # i TeX można ustawić tak, aby wyświetlały łączniki w dzienniku za pomocą polecenia \showhyphens
.
W LaTeX użytkownicy mogą dodawać poprawki dzielenia wyrazów za pomocą:
\hyphenation{słowa}
Polecenie \hyphenation
deklaruje dozwolone punkty dzielenia wyrazów, w których słowa są listą słów oddzielonych spacjami, w których każdy punkt dzielenia wyrazów jest oznaczony znakiem -
. Na przykład,
\hyphenation{fortran er-go-no-mic}
oświadcza, że w obecnym zadaniu „fortran” nie powinien być dzielony, a jeśli „ergonomiczny” musi być dzielony, to w jednym ze wskazanych punktów.
Istnieje jednak kilka ograniczeń. Na przykład polecenie stock \hyphenation
akceptuje domyślnie tylko litery ASCII , więc nie można go używać do poprawiania dzielenia wyrazów ze znakami spoza zestawu ASCII (takimi jak ä , é , ç ), które są bardzo powszechne w prawie wszystkich językach z wyjątkiem angielskiego. Istnieją jednak proste obejścia.
Pracowałem
- Fonotaktyka
- Głoski taautosylabiczne, heterosylabowe i ambisylabowe
- Struktura sylab w fonologii angielskiej
Notatki
Linki zewnętrzne
- Online Lyric Hyphenator : Dzieli angielski tekst na sylaby
- Narzędzie dzielenia wyrazów online : Algorytmy dzielenia wyrazów dla kilku języków
- Narzędzie do dzielenia wyrazów w języku francuskim : Dzieli wyrazy francuskie z wyjaśnieniem