Dystrybucyjno-relacyjna baza danych
Dystrybucyjno -relacyjna baza danych lub baza danych wektorów słów to system zarządzania bazą danych (DBMS), który wykorzystuje dystrybucyjne reprezentacje wektorów słów w celu wzbogacenia semantyki danych strukturalnych .
Ponieważ dystrybucyjne wektory słów mogą być budowane automatycznie z korpusów na dużą skalę , to wzbogacenie wspiera budowę baz danych, które mogą osadzać zdroworozsądkową wiedzę podstawową na dużą skalę w swoich operacjach. Modele dystrybucyjno-relacyjne mogą być stosowane do budowy baz danych niezależnych od schematu (baz danych, w których użytkownicy mogą przeszukiwać dane bez znajomości ich schematu ), wyszukiwania semantycznego , integracji schematów oraz wnioskowania indukcyjnego i abdukcyjnego , a także różnych zastosowań, w których potrzebny jest semantycznie elastyczny model reprezentacji wiedzy. Główną zaletą modeli dystrybucyjno-relacyjnych w porównaniu z czysto logicznymi/ semantycznymi modelami sieciowymi jest fakt, że podstawowe powiązania semantyczne mogą być automatycznie przechwytywane z korpusów, w przeciwieństwie do definicji ręcznie tworzonych ontologii i baz wiedzy o regułach.
Modele dystrybucyjno-relacyjne
Modele dystrybucyjno-relacyjne zostały najpierw sformalizowane jako mechanizm radzenia sobie z luką leksykalno-semantyczną między użytkownikami a schematem stojącym za danymi. W tym scenariuszu dystrybucyjne miary powiązań semantycznych w połączeniu z semantyczną heurystyką przestawną mogą wspierać aproksymację między zapytaniami użytkownika (wyrażonymi w ich własnym słownictwie) a danymi (wyrażonymi w słownictwie projektanta).
W tym modelu symbole bazy danych (jednostki i relacje) są osadzone w dystrybucyjnej przestrzeni semantycznej i mają geometryczną interpretację w ukrytej lub jawnej przestrzeni semantycznej. Aspekt geometryczny obsługuje przybliżenie semantyczne między jednostkami z różnych baz danych lub między terminem zapytania a jednostką bazy danych. Dystrybucyjny model relacyjny staje się wówczas dwuwarstwowym modelem, w którym semantyka ustrukturyzowanych danych zapewnia drobnoziarnistą semantykę zamierzoną przez projektanta bazy danych , która jest rozszerzona o dystrybucyjny model semantyczny, który zawiera skojarzenia semantyczne wyrażone w szerszym zastosowaniu. Modele te wspierają uogólnienie od zamkniętego scenariusza komunikacji (w którym projektanci baz danych i użytkownicy żyją w tym samym kontekście, np. w tej samej organizacji) do otwartego scenariusza komunikacji (np. różne organizacje, sieć), tworząc warstwę abstrakcji między użytkownikami a specyficzna reprezentacja modelu pojęciowego.
- ^ Harris, Z. (1954). „Struktura dystrybucyjna”. Słowo. 10 (23): 146–162.
- ^ Metais, Elżbieta; Roche, Mathieu; Teisseire, Maguelonne (2014-06-16). Przetwarzanie języka naturalnego i systemy informacyjne: 19th International Conference on Applications of Natural Language to Information Systems, NLDB 2014, Montpellier, Francja, 18-20 czerwca 2014 r. Materiały . Skoczek. ISBN 978-3-319-07983-7 .
- ^ Freitas, A. „Zapytania niezależne od schematu w bazach danych o dużych schematach: podejście do semantyki dystrybucyjnej”, rozprawa doktorska, 2015
- ^ Freitas, A., Handschuh, S., Curry, E., Distributional-Relational Models: Scalable Semantics for Databases, AAAI Spring Symposium, Knowledge Representation & Reasoning Track, Stanford, 2014