Różnorodność leksykalna

Różnorodność leksykalna jest jednym z aspektów „bogactwa leksykalnego” i odnosi się do stosunku różnych unikalnych rdzeni słów (typów) do całkowitej liczby słów ( tokenów ). Termin ten jest używany w lingwistyce stosowanej i jest obliczany ilościowo przy użyciu wielu różnych miar, w tym stosunku typu do tokena (TTR), vocd i miary tekstowej różnorodności leksykalnej (MTLD).

Częstym problemem związanym z miarami różnorodności leksykalnej, zwłaszcza TTR, jest to, że próbki tekstu zawierające dużą liczbę tokenów dają niższe wartości TTR, ponieważ często pisarz lub mówca musi ponownie użyć kilku słów funkcyjnych . Jedną z konsekwencji tego jest to, że różnorodność leksykalna jest lepiej wykorzystywana do porównywania tekstów o równej długości. Nowsze miary różnorodności leksykalnej próbują uwzględnić wrażliwość na długość tekstu.

Definicje

W artykule z 2013 roku Scott Jarvis zaproponował, że różnorodność leksykalna, podobnie jak różnorodność w ekologii, jest zjawiskiem percepcyjnym. Redundancja leksykalna jest pozytywnym odpowiednikiem różnorodności leksykalnej w taki sam sposób, w jaki zmienność leksykalna jest lustrzanym odbiciem powtórzeń. Zgodnie z modelem Jarvisa różnorodność leksykalna obejmuje zmienność, głośność, równość, rzadkość, rozproszenie i rozbieżność.

Według Jarvisa sześć właściwości różnorodności leksykalnej należy mierzyć za pomocą następujących wskaźników.

Nieruchomość Mierzyć
Zmienność Miara tekstowej różnorodności leksykalnej (MTLD)
Tom Całkowita liczba słów w tekście
Równość Odchylenie standardowe tokenów według typu
Rzadkość Średni stopień BNC
Dyspersja Średnia odległość między tokenami typu
Różnica Średnia liczba słów na sens lub utajona analiza semantyczna
  1. Bibliografia _ Jarvis, Scott (2007). „vocd: ocena teoretyczna i empiryczna”. Testy językowe . 24 (4): 459–488. doi : 10.1177/0265532207080767 .
  2. ^ McCarthy, Phillip (2005). „Ocena zakresu i przydatności miar różnorodności leksykalnej oraz potencjału miary różnorodności tekstowej, leksykalnej (MTLD)”. Rozprawa doktorska – za pośrednictwem rozpraw i rozpraw Proquest. (numer UMI 3199485).
  3. ^ Różnorodność leksykalna i gęstość leksykalna w mowie i piśmie: perspektywa rozwojowa - V Johansson - Working Papers in Linguistics, 2009
  4. ^ Jarvis, Scott (2013). „Uchwycenie różnorodności w różnorodności leksykalnej” . Nauka języka . 63 : 87–106. doi : 10.1111/j.1467-9922.2012.00739.x .