Podstawienie leksykalne
Podstawianie leksykalne to zadanie identyfikacji substytutu słowa w kontekście zdania. Na przykład, biorąc pod uwagę następujący tekst: „Po meczu uzupełnij pozostały niedobór płynów, aby zapobiec chronicznemu odwodnieniu przez cały turniej”, może zostać podana gra zastępcza.
Podstawianie leksykalne jest ściśle związane z ujednoznacznieniem sensu słów (WSD), ponieważ oba mają na celu określenie znaczenia słowa . Jednakże, podczas gdy WSD polega na automatycznym przypisywaniu odpowiedniego znaczenia z inwentarza ustalonego znaczenia, podstawienie leksykalne nie nakłada żadnych ograniczeń na to, który substytut wybrać jako najlepiej reprezentatywny dla słowa w kontekście. Nie przepisując inwentarza, substytucja leksykalna przezwycięża problem ziarnistości rozróżnień sensownych i zapewnia równe szanse dla systemów automatycznych, które automatycznie nabywają znaczenia słów (zadanie określane jako Indukcja sensu słów ).
Ocena
W celu oceny automatycznych systemów zastępowania leksykalnego zorganizowano zadanie na konkursie ewaluacyjnym Semeval-2007, który odbył się w Pradze w 2007 roku . Odbyło się również zadanie Semeval-2010 dotyczące międzyjęzycznej zastępowania leksykalnego.
Model pomijania gramów
Model skip-gram przenosi słowa o podobnym znaczeniu do przestrzeni wektorowej (zbiór obiektów, które można dodawać i mnożyć przez liczby), które znajdują się blisko siebie w N-wymiarach (lista elementów). Różne sieci neuronowe (system komputerowy wzorowany na ludzkim mózgu) powstają razem w wyniku powiązanych ze sobą wektorów i sieci. To wszystko dzieje się w wymiarach słownictwa, które zostało wygenerowane w sieci. Model został wykorzystany w automatyzacji podstawień leksykalnych i algorytmach predykcyjnych. Jeden z takich algorytmów opracowany przez Orena Melamuda, Omera Levy'ego i Ido Dagana wykorzystuje model pomijania gramów, aby znaleźć wektor dla każdego słowa i jego synonimów. Następnie oblicza cosinusową odległość między wektorami, aby określić, które słowa będą najlepszymi substytutami.
Przykład
W zdaniu takim jak „Pies szedł szybkim krokiem” każde słowo ma określony wektor w stosunku do drugiego. Wektorem dla „The” byłoby [1,0,0,0,0,0,0], ponieważ 1 to słownictwo słowne, a zera to słowa otaczające to słownictwo, które tworzą wektor.
Zobacz też
Bibliografia
- D. McCarthy, R. Navigli. Angielskie zadanie podstawienia leksykalnego . Zasoby językowe i ocena , 43(2), Springer, 2009, s. 139–159.
- D. McCarthy, R. Navigli. SemEval-2007 Zadanie 10: Angielski leksykalny Zadanie . proc. Warsztatów Semeval-2007 (SEMEVAL) na 45. dorocznym spotkaniu Stowarzyszenia Lingwistyki Komputerowej (ACL 2007), Praga, Republika Czeska, 23–24 czerwca 2007 r., s. 48–53.
- D. McCarthy'ego. Podstawianie leksykalne jako zadanie oceny WSD . W Proceedings of the ACL warsztaty na temat ujednoznaczniania sensu słów: ostatnie sukcesy i przyszłe kierunki, Filadelfia, USA, 2002, s. 109–115.
- R. Navigli. Ujednoznacznienie sensu słów: ankieta , ACM Computing Surveys, 41 (2), 2009, s. 1–69.