UBY-LMF

UBY-LMF to format standaryzacji zasobów leksykalnych dla przetwarzania języka naturalnego (NLP). UBY-LMF jest zgodny ze standardem ISO dla leksykonów: LMF , zaprojektowanym w ramach ISO-TC37 , i stanowi tzw. serializację tego abstrakcyjnego standardu. Zgodnie z LMF wszystkie atrybuty i inne terminy językowe wprowadzone w UBY-LMF odnoszą się do znormalizowanych opisów ich znaczenia w ISOCat .

UBY-LMF został zaimplementowany w Javie i jest aktywnie rozwijany jako projekt Open Source w Google Code . W oparciu o tę implementację Javy automatycznie został utworzony wielkoskalowy elektroniczny leksykon UBY - jest to wynik wykorzystania UBY-LMF do standaryzacji szeregu różnorodnych zasobów leksykalnych często używanych w aplikacjach NLP.

W 2013 roku UBY zawiera 10 leksykonów, które są połączone parami na poziomie zmysłów:

Angielski WordNet , Wikisłownik , Wikipedia , FrameNet , VerbNet , OmegaWiki
Niemiecki Wikisłownik , Wikipedia , GermaNet , IMSLex-Subcat i
wielojęzyczne OmegaWiki.

Podzbiór leksykonów zintegrowanych z UBY został przekonwertowany do formatu sieci semantycznej zgodnie z modelem leksykonu cytrynowego. Ta konwersja jest oparta na mapowaniu UBY-LMF na model leksykonu cytryny.

Referencje zewnętrzne