Automatyczna konstrukcja taksonomii
Automatyczna konstrukcja taksonomii (ATC) polega na wykorzystaniu programów komputerowych do generowania klasyfikacji taksonomicznych na podstawie zbioru tekstów zwanego korpusem . ATC to gałąź przetwarzania języka naturalnego , która z kolei jest gałęzią sztucznej inteligencji .
Taksonomia (lub klasyfikacja taksonomiczna) to schemat klasyfikacji , w szczególności klasyfikacja hierarchiczna, w której rzeczy są zorganizowane w grupy lub typy. Taksonomia może służyć między innymi do organizowania i indeksowania wiedzy (przechowywanej jako dokumenty, artykuły, filmy itp.), na przykład w formie bibliotecznego systemu klasyfikacji lub taksonomii wyszukiwarek , dzięki czemu użytkownicy mogą łatwiej znaleźć informacje, których szukają. Wiele taksonomii to hierarchie (a zatem mają wewnętrzną strukturę drzewiastą ), ale nie wszystkie są.
Ręczne opracowywanie i utrzymywanie taksonomii jest pracochłonnym zadaniem wymagającym znacznej ilości czasu i zasobów, w tym znajomości lub wiedzy w dziedzinie taksonomii ( zakres, przedmiot lub dziedzina), co wpływa na koszty i ogranicza zakres takich projektów. Ponadto twórcy modeli domen mają własne punkty widzenia, które nieuchronnie, nawet jeśli nieumyślnie, trafiają do taksonomii. ATC wykorzystuje techniki sztucznej inteligencji do szybkiego automatycznego generowania taksonomii dla domeny w celu uniknięcia tych problemów i usunięcia ograniczeń.
Podchodzi do
Istnieje kilka podejść do ATC. Jednym z podejść jest użycie reguł do wykrywania wzorców w korpusie i wykorzystanie tych wzorców do wnioskowania o relacjach, takich jak hiponimia . Inne podejścia wykorzystują uczenia maszynowego , takie jak wnioskowanie bayesowskie i sztuczne sieci neuronowe .
Ekstrakcja słów kluczowych
Jednym ze sposobów tworzenia taksonomii jest automatyczne gromadzenie słów kluczowych z domeny za pomocą wyodrębniania słów kluczowych , a następnie analizowanie relacji między nimi (patrz Hiponimia poniżej), a następnie układanie ich w taksonomię na podstawie tych relacji.
Hiponimia i relacje „jest-a”.
W programach ATC jednym z najważniejszych zadań jest odkrycie relacji hiperonim i hiponim między słowami. Jednym ze sposobów, aby to zrobić w tekście, jest wyszukanie określonych fraz, takich jak „is a” i „taki jak”.
W językoznawstwie relacje is-a nazywane są hiponimią . Słowa opisujące kategorie nazywane są hiperonimami, a słowa będące przykładami kategorii to hiponimy. Na przykład pies jest hiperonimem, a Fido jest jednym z jego hiponimów. Słowo może być zarówno hiponimem, jak i hiperonimem. Tak więc pies jest hiponimem ssaka , a także hiperonimem Fido .
Taksonomie są często przedstawiane jako hierarchie , w których każdy poziom jest bardziej szczegółowy niż (w języku matematycznym „podzbiór”) poziom powyżej. Na przykład podstawowa taksonomia biologiczna zawierałaby pojęcia takie jak ssak , który jest podzbiorem zwierząt , oraz psy i koty , które są podzbiorami ssaków . Ten rodzaj taksonomii nazywany jest modelem jest, ponieważ określone obiekty są uważane za instancje koncepcji. Na przykład Fido jest przykładem psa koncepcyjnego , a Fluffy jest kotem .
Aplikacje
ATC można wykorzystać do budowania taksonomii dla wyszukiwarek , aby poprawić wyniki wyszukiwania.
Systemy ATC są kluczowym elementem uczenia się ontologii (znanym również jako automatyczna konstrukcja ontologii) i były wykorzystywane do automatycznego generowania dużych ontologii dla domen takich jak ubezpieczenia i finanse. Zostały również wykorzystane do ulepszenia istniejących dużych sieci, takich jak Wordnet, aby uczynić je bardziej kompletnymi i spójnymi.
oprogramowanie ATC
Inne nazwy
Inne nazwy automatycznej konstrukcji taksonomii to:
- Zautomatyzowane budowanie konturów
- Zautomatyzowana konstrukcja konturu
- Automatyczne tworzenie konspektu
- Zautomatyzowana ekstrakcja konturów
- Automatyczne generowanie konturów
- Zautomatyzowana indukcja konturu
- Automatyczne uczenie się konspektu
- Automatyczne tworzenie konturów
- Zautomatyzowane budowanie taksonomii
- Zautomatyzowana konstrukcja taksonomii
- Automatyczne tworzenie taksonomii
- Zautomatyzowana ekstrakcja taksonomii
- Automatyczne generowanie taksonomii
- Zautomatyzowana indukcja taksonomii
- Automatyczne uczenie się taksonomii
- Automatyczne budowanie konturów
- Automatyczne tworzenie konturów
- Automatyczne tworzenie konturów
- Automatyczne wyodrębnianie konturów
- Automatyczne generowanie konturów
- Automatyczna indukcja konturu
- Automatyczne uczenie się konspektu
- Automatyczne budowanie taksonomii
- Automatyczne tworzenie taksonomii
- Automatyczna ekstrakcja taksonomii
- Automatyczne generowanie taksonomii
- Automatyczna indukcja taksonomii
- Automatyczne uczenie się taksonomii
- Automatyzacja konspektu
- Zarys budynku
- Konstrukcja konspektu
- Tworzenie konspektu
- Ekstrakcja konturu
- Generowanie konspektu
- Indukcja konspektu
- Nauka konspektu
- Budowa taksonomii semantycznej
- Konstrukcja taksonomii semantycznej
- Tworzenie taksonomii semantycznej
- Ekstrakcja taksonomii semantycznej
- Generowanie taksonomii semantycznej
- Indukcja taksonomii semantycznej
- Nauka taksonomii semantycznej
- Automatyzacja taksonomii
- Budynek taksonomii
- Budowa taksonomii
- Tworzenie taksonomii
- Ekstrakcja taksonomii
- Generowanie taksonomii
- Indukcja taksonomii
- Nauka taksonomii
Zobacz też
Dalsza lektura
- Automatyczna konstrukcja taksonomii na podstawie słów kluczowych (2012)
- Uczenie się taksonomii domen z tekstu: metoda subsumpcji a klastrowanie hierarchiczne z Data & Knowledge Engineering , tom 83, styczeń 2013, strony 54–69
- Uczenie się relacji taksonomicznych ze zbioru dokumentów tekstowych
- Uczenie się relacji taksonomicznych z heterogenicznych źródeł dowodów
- Ramy oparte na metrykach do automatycznej indukcji taksonomii
- Nowa metoda oceny taksonomii terminologicznych wyuczonych automatycznie
- Problematyzowanie i odnoszenie się do założenia artykułu jako koncepcji w Wikipedii
- Ustrukturyzowane uczenie się do indukcji taksonomii z propagacją przekonań
- Nauka taksonomii za pomocą indukcji sensu słów
Linki zewnętrzne
- Taxonomy 101: The Basics and Getting Started with Taxonomies – pokazuje, gdzie ATC pasuje do ogólnej działalności zarządzania taksonomiami dla przedsiębiorstwa wymagającego zarządzania wiedzą.