BulNet

Bułgarski WordNet ( BulNet ) to elektroniczny wielojęzyczny słownik zestawów synonimów wraz z ich objaśniającymi definicjami i zbiorami relacji semantycznych z innymi słowami w języku.

Jest zgodny z frameworkiem Princeton WordNet (PWN), który implementuje tradycyjne sieci semantyczne , których struktura składa się z węzłów i relacji między węzłami.

Informacje ogólne

BulNet powstał w ramach finansowanego ze środków UE projektu BalkaNet - wielojęzycznej sieci semantycznej języków bałkańskich. Po ukończeniu BalkaNetu. rozwój BulNet był kontynuowany przy wsparciu rządu bułgarskiego.

Zawartość BulNetu

Kategorie

Od 2015 roku BulNet zawierał ponad 80 000 zestawów synonimów podzielonych na dziewięć części mowy - rzeczowniki, czasowniki, przymiotniki, przysłówki, zaimki, przyimki , spójniki , partykuły i wykrzykniki .

Słowa zawarte w BulNet zostały wybrane według różnych kryteriów. Głównymi kryteriami są analiza częstości występowania słów w dużych korpusach tekstowych oraz włączenie synsetów . Synsety obejmują te, które już występują w sieciach słów innych języków oraz synsety, które odpowiadają sensom słów o wysokiej częstotliwości znalezionym w korpusach równoległych.

Synsets

Każdy synset koduje relację równoważności między pewną liczbą elementów leksykalnych — LITERAŁÓW (co najmniej jeden powinien być jawnie reprezentowany w SYNSET), z których każdy ma unikalne znaczenie (określone wartością SENSE) — które dotyczą jednego i tę samą część mowy (określoną jako wartość POS) i reprezentują jedno i to samo znaczenie leksykalne (określone jako wartość DEF). Każdy synset jest powiązany ze swoim odpowiednikiem w PWN 3.0 za pomocą unikalnego numeru identyfikacyjnego - ID. Wspólne synsety w językach bałkańskich są oznaczone jako podzbiory wspólnych pojęć — BCS .

W jednojęzycznej bazie danych synset powinien być połączony z co najmniej jednym innym synsetem poprzez relację wewnątrzjęzykową. Mogą być również zakodowane informacje nieobowiązkowe, takie jak przykłady użycia, osobliwości stylistyczne, właściwości morfologiczne lub składniowe, dane autora i ostatniej edycji.

Relacje semantyczne

Duża liczba relacji zakodowanych w BulNet skutecznie ilustruje bogactwo semantyczne i derywacyjne języka, które oferuje różnorodne możliwości wielu zastosowań wielojęzycznej bazy danych. BulNet oferuje rozwiązania lingwistyczne na poziomie semantycznym, takie jak opcje doboru synonimów, zapytania o relacje semantyczne wyrazu w systemie leksykalnym języka ( antonimia , holonimia itp.), zapytania o definicje wyjaśniające i ekwiwalenty tłumaczeniowe dla pozycji leksykalnej.

BulNet to elektroniczny wielojęzyczny słownik zestawów synonimów wraz z ich objaśniającymi definicjami i zbiorami relacji semantycznych z innymi wyrazami w języku.

Hydra

Hydra to system niezależny od systemu operacyjnego przeznaczony do tworzenia, sprawdzania poprawności i eksploracji sieci Wordnet. Program umożliwia użytkownikom przeglądanie i edytowanie dowolnej liczby jednojęzycznych sieci słów jednocześnie. Poszczególne sieci słów są zsynchronizowane, dzięki czemu równoważne zestawy synonimów lub synsety mogą być przeglądane i eksplorowane równolegle.

Źródła

Linki zewnętrzne