Podstawienie leksykalne

Podstawianie leksykalne to zadanie identyfikacji substytutu słowa w kontekście zdania. Na przykład, biorąc pod uwagę następujący tekst: „Po meczu uzupełnij pozostały niedobór płynów, aby zapobiec chronicznemu odwodnieniu przez cały turniej”, może zostać podana gra zastępcza.

Podstawianie leksykalne jest ściśle związane z ujednoznacznieniem sensu słów (WSD), ponieważ oba mają na celu określenie znaczenia słowa . Jednakże, podczas gdy WSD polega na automatycznym przypisywaniu odpowiedniego znaczenia z inwentarza ustalonego znaczenia, podstawienie leksykalne nie nakłada żadnych ograniczeń na to, który substytut wybrać jako najlepiej reprezentatywny dla słowa w kontekście. Nie przepisując inwentarza, substytucja leksykalna przezwycięża problem ziarnistości rozróżnień sensownych i zapewnia równe szanse dla systemów automatycznych, które automatycznie nabywają znaczenia słów (zadanie określane jako Indukcja sensu słów ).

Ocena

W celu oceny automatycznych systemów zastępowania leksykalnego zorganizowano zadanie na konkursie ewaluacyjnym Semeval-2007, który odbył się w Pradze w 2007 roku . Odbyło się również zadanie Semeval-2010 dotyczące międzyjęzycznej zastępowania leksykalnego.

Model pomijania gramów

Model skip-gram przenosi słowa o podobnym znaczeniu do przestrzeni wektorowej (zbiór obiektów, które można dodawać i mnożyć przez liczby), które znajdują się blisko siebie w N-wymiarach (lista elementów). Różne sieci neuronowe (system komputerowy wzorowany na ludzkim mózgu) powstają razem w wyniku powiązanych ze sobą wektorów i sieci. To wszystko dzieje się w wymiarach słownictwa, które zostało wygenerowane w sieci. Model został wykorzystany w automatyzacji podstawień leksykalnych i algorytmach predykcyjnych. Jeden z takich algorytmów opracowany przez Orena Melamuda, Omera Levy'ego i Ido Dagana wykorzystuje model pomijania gramów, aby znaleźć wektor dla każdego słowa i jego synonimów. Następnie oblicza cosinusową odległość między wektorami, aby określić, które słowa będą najlepszymi substytutami.

Przykład

W zdaniu takim jak „Pies szedł szybkim krokiem” każde słowo ma określony wektor w stosunku do drugiego. Wektorem dla „The” byłoby [1,0,0,0,0,0,0], ponieważ 1 to słownictwo słowne, a zera to słowa otaczające to słownictwo, które tworzą wektor.

Zobacz też

Bibliografia