Nauka oparta na wyjaśnieniach

Uczenie się oparte na wyjaśnieniach ( EBL ) jest formą uczenia maszynowego , która wykorzystuje bardzo mocną, a nawet doskonałą teorię domeny ( tzn . teorii ) w celu uogólnień lub tworzenia koncepcji na podstawie przykładów szkoleniowych. Jest również powiązany z kodowaniem (pamięcią), aby pomóc w nauce .

Detale

Przykładem EBL wykorzystującego teorię domeny doskonałej jest program, który uczy się grać w szachy na przykładzie. Określona pozycja szachowa, która zawiera ważną cechę, taką jak „Wymuszona utrata czarnego hetmana w dwóch ruchach”, zawiera wiele nieistotnych cech, takich jak specyficzne rozmieszczenie pionków na szachownicy. EBL może wziąć pojedynczy przykład szkoleniowy i określić, jakie są istotne cechy, aby utworzyć uogólnienie.

Teoria domeny jest doskonała lub kompletna , jeśli zawiera w zasadzie wszystkie informacje potrzebne do rozstrzygnięcia dowolnego pytania dotyczącego dziedziny. Na przykład teoria domeny dla szachów to po prostu zasady gry w szachy. Znając zasady, w zasadzie można wydedukować najlepszy ruch w każdej sytuacji. Jednak faktyczne dokonanie takiego odliczenia jest w praktyce niemożliwe ze względu na eksplozję kombinatoryczną . EBL wykorzystuje przykłady szkoleniowe, aby poszukiwanie dedukcyjnych konsekwencji teorii domeny było skuteczne w praktyce.

Zasadniczo system EBL działa poprzez znalezienie sposobu na wydedukowanie każdego przykładu szkoleniowego z istniejącej bazy danych teorii domeny systemu. Posiadanie krótkiego dowodu przykładu szkoleniowego rozszerza bazę danych teorii dziedzin, umożliwiając systemowi EBL bardzo szybkie znajdowanie i klasyfikowanie przyszłych przykładów podobnych do przykładu szkoleniowego. Minton przeanalizował główną wadę tej metody - koszt zastosowania wyuczonych makr dowodowych, ponieważ jest ich coraz więcej.

Podstawowy preparat

Oprogramowanie EBL pobiera cztery dane wejściowe:

  • przestrzeń hipotez (zbiór wszystkich możliwych wniosków)
  • teoria domeny (aksjomaty dotyczące dziedziny będącej przedmiotem zainteresowania)
  • przykłady szkoleniowe (konkretne fakty, które wykluczają niektóre możliwe hipotezy)
  • kryteria operacyjności (kryteria określające, które cechy w domenie są skutecznie rozpoznawalne, np. które cechy są bezpośrednio wykrywalne za pomocą czujników)

Aplikacja

Szczególnie dobrą domeną aplikacji dla EBL jest przetwarzanie języka naturalnego (NLP). Tutaj bogata teoria dziedzin, tj. gramatyka języka naturalnego — choć nie jest ani doskonała, ani kompletna, jest dostosowywana do konkretnego zastosowania lub określonego użycia języka przy użyciu banku drzew (przykłady szkoleniowe). Rayner był pionierem tej pracy. Pierwszą udaną aplikacją przemysłową był komercyjny interfejs NL do relacyjnych baz danych. Metodę z powodzeniem zastosowano w kilku wielkoskalowych systemach analizy składniowej języka naturalnego, gdzie problem użyteczności został rozwiązany poprzez pominięcie oryginalnej gramatyki (teoria domen) i zastosowanie wyspecjalizowanych technik analizy LR, co dało ogromne przyspieszenie kosztem w zasięgu, ale z korzyścią dla ujednoznacznienia. Techniki podobne do EBL zostały również zastosowane do generowania powierzchni, odwrotności analizy.

Stosując EBL do NLP, kryteria operacyjności mogą być tworzone ręcznie lub można je wywnioskować z banku drzew za pomocą entropii jego or-węzłów lub kompromisu pokrycia docelowego/ujednoznacznienia (= kompromis przywołania/precyzji = f -wynik). EBL może być również używany do kompilowania modeli językowych opartych na gramatyce do rozpoznawania mowy, z ogólnych gramatyk unifikacyjnych. Zwróć uwagę, jak problem użyteczności, po raz pierwszy ujawniony przez Mintona, został rozwiązany przez odrzucenie oryginalnej teorii gramatyki/dziedziny i że cytowane artykuły zwykle zawierają wyrażenie specjalizacja gramatyczna — co jest zupełnym przeciwieństwem pierwotnego terminu uogólnienie oparte na wyjaśnieniach. Być może najlepszą nazwą tej techniki byłaby redukcja przestrzeni wyszukiwania oparta na danych. Inne osoby, które pracowały nad EBL dla NLP, to Guenther Neumann, Aravind Joshi, Srinivas Bangalore i Khalil Sima'an.

Zobacz też