Integracja semantyczna

Integracja semantyczna to proces łączenia informacji z różnych źródeł, na przykład kalendarzy i list rzeczy do zrobienia, archiwów e-maili, informacji o obecności (fizycznej, psychologicznej i społecznej), wszelkiego rodzaju dokumentów, kontaktów (w tym wykresów społecznościowych), wyników wyszukiwania i wynikające z nich znaczenie reklamowe i marketingowe. Pod tym względem semantyka koncentruje się na organizacji informacji i działaniu na nich, działając jako pośrednik między heterogenicznymi źródłami danych, które mogą kolidować nie tylko ze względu na strukturę, ale także kontekst lub wartość.

Zastosowania i metody

W integracji aplikacji korporacyjnych (EAI) integracja semantyczna może ułatwić, a nawet zautomatyzować komunikację między systemami komputerowymi za pomocą publikowania metadanych . Publikowanie metadanych potencjalnie oferuje możliwość automatycznego łączenia ontologii . Jedno podejście do (pół)automatycznego mapowania ontologii wymaga zdefiniowania odległości semantycznej lub jej odwrotności, semantycznego podobieństwa i odpowiednich reguł. Inne podejścia obejmują tak zwane metody leksykalne , jak również metodologie, które opierają się na wykorzystaniu struktur ontologii. Dla wyraźnego stwierdzenia podobieństwa/równości istnieją specjalne właściwości lub relacje w większości języków ontologii. OWL , na przykład, ma „owl:equivalentClass”, „owl:equivalentProperty” i „owl: sameAs ”.

Ostatecznie w projektach systemów mogą pojawić się architektury komponowalne, w których opublikowane interfejsy oparte na semantyce są łączone w celu udostępnienia nowych i znaczących możliwości ^{[ potrzebne źródło ]} . Można je głównie opisać za pomocą specyfikacji deklaratywnych w czasie projektowania, które ostatecznie można renderować i wykonywać w czasie wykonywania ^{[ potrzebne źródło ]} .

Integrację semantyczną można również wykorzystać do ułatwienia działań związanych z projektowaniem i mapowaniem interfejsu w czasie projektowania. W tym modelu semantyka jest stosowana tylko jawnie do projektowania, a systemy wykonawcze działają na poziomie składni ^{[ potrzebne źródło ]} . To podejście „wczesnego wiązania semantycznego” może poprawić ogólną wydajność systemu, zachowując jednocześnie zalety projektowania opartego na semantyce ^{[ potrzebne źródło ]} .

Semantyczne sytuacje integracyjne

Z branżowego przypadku użycia zaobserwowano, że odwzorowania semantyczne zostały wykonane tylko w zakresie klasy ontologii lub typu danych nieruchomość. Te zidentyfikowane integracje semantyczne to (1) integracja instancji klasy ontologii z inną klasą ontologii bez żadnych ograniczeń, (2) integracja wybranych instancji w jednej klasie ontologii z inną klasą ontologii poprzez ograniczenie zakresu wartości właściwości oraz (3) integracja instancje klasy ontologii do innej klasy ontologii z transformacją wartości właściwości instancji. Każda z nich wymaga określonej relacji odwzorowania, którą są odpowiednio: (1) relacja odwzorowania równoważnego lub podrzędnego, (2) relacja odwzorowania warunkowego ograniczająca wartość właściwości (zakres danych) oraz (3) relacja odwzorowania transformacji przekształcająca wartość właściwość (transformacja jednostek). Każda zidentyfikowana relacja mapowania może być zdefiniowana jako (1) typ mapowania bezpośredniego, (2) typ mapowania zakresu danych lub (3) typ mapowania transformacji jednostek.

Podejścia KG vs. RDB

W przypadku integracji dodatkowego źródła danych,

KG( Graf wiedzy ) formalnie reprezentuje znaczenie informacji poprzez opisywanie pojęć, relacji między rzeczami i kategorii rzeczy. Ta semantyka osadzona w danych oferuje znaczące korzyści, takie jak rozumowanie nad danymi i radzenie sobie z heterogenicznymi źródłami danych. Reguły można zastosować na KG wydajniej za pomocą zapytania grafowego. Na przykład zapytanie grafu dokonuje wnioskowania o danych poprzez połączone relacje, zamiast powtarzać pełne przeszukiwanie tabel w relacyjnej bazie danych. KG ułatwia integrację nowych, heterogenicznych danych, po prostu dodając nowe relacje między istniejącymi informacjami a nowymi podmiotami. To ułatwienie jest podkreślane w przypadku integracji z istniejącymi popularnymi połączonymi otwartymi źródłami danych, takimi jak Wikidata.org.
SQL jest ściśle powiązane i sztywno ograniczone przez typ danych w określonej bazie danych i może łączyć tabele i wyodrębniać dane z tabel, a wynikiem jest ogólnie tabela, a zapytanie może łączyć tabele przez dowolne kolumny pasujące do typu danych. SPARQL query jest standardowym językiem i protokołem zapytań dla Linked Open Data w sieci i jest luźno powiązany z bazą danych, dzięki czemu ułatwia ponowne użycie i może wydobywać dane poprzez relacje wolne od typu danych, a nie tylko wydobywać, ale także generować dodatkowy wykres wiedzy z bardziej wyrafinowane operacje (logika: przechodnia/symetryczna/odwrotna/funkcjonalna). Zapytanie oparte na wnioskowaniu (zapytanie o istniejące stwierdzone fakty bez generowania nowych faktów przez logikę) może być szybkie w porównaniu do zapytania opartego na rozumowaniu (zapytanie o istniejące plus wygenerowane/odkryte fakty w oparciu o logikę).
Integracja informacji heterogenicznych źródeł danych w tradycyjnej bazie danych jest skomplikowana, co wymaga przeprojektowania tabeli bazy danych, takiej jak zmiana struktury i/lub dodanie nowych danych. W przypadku zapytania semantycznego zapytanie SPARQL odzwierciedla relacje między jednostkami w sposób zgodny z rozumieniem domeny przez człowieka, więc intencja semantyczna zapytania może być widoczna w samym zapytaniu. W przeciwieństwie do SPARQL, zapytanie SQL, które odzwierciedla specyficzną strukturę bazy danych i pochodzi z dopasowania odpowiednich kluczy głównych i obcych tabel, traci semantykę zapytania przez pominięcie relacji między jednostkami. Poniżej znajduje się przykład porównujący zapytania SPARQL i SQL dotyczące leków leczących „gruźlicę kręgów”.

WYBIERZ ?leki GDZIE { ?diagnoza przykład:Diagnoza . ?przykład diagnozy:nazwa „gruźlica kręgu” . ?przykład leku:możeLeczyć ?diagnozę . }

WYBIERZ DRUG.medID Z DIAGNOSIS, DRUG, DRUG_DIAGNOSIS WHERE DIAGNOSIS.diagnosisID=DRUG_DIAGNOSIS.diagnosisID AND DRUG.medID=DRUG_DIAGNOSIS.medID AND DIAGNOSIS.name=”TB kręgu”

Przykłady

Pacific Symposium on Biocomputing było miejscem popularyzacji zadania mapowania ontologii w dziedzinie biomedycyny, aw jego materiałach można znaleźć szereg artykułów na ten temat.

Zobacz też

Linki zewnętrzne

Integracja semantyczna: luźne łączenie znaczenia danych
Mapowanie ontologii: stan techniki (artykuł z 2005 r.)
Artykuł Carla Hewitta z 2010 roku
Interfejs OpenCyc do Oracle