Pajęczyna (skupienie)
COBWEB to przyrostowy system do hierarchicznego grupowania pojęciowego . PAJĘCZYNA została wynaleziona przez profesora Douglasa H. Fishera, obecnie na Uniwersytecie Vanderbilt.
COBWEB stopniowo organizuje obserwacje w drzewo klasyfikacyjne . Każdy węzeł w drzewie klasyfikacyjnym reprezentuje klasę (koncepcję) i jest oznaczony koncepcją probabilistyczną, która podsumowuje rozkłady atrybut-wartość obiektów sklasyfikowanych w węźle. To drzewo klasyfikacyjne może służyć do przewidywania brakujących atrybutów lub klasy nowego obiektu.
Istnieją cztery podstawowe operacje, które COBWEB stosuje przy budowaniu drzewa klasyfikacyjnego. To, która operacja zostanie wybrana, zależy od kategorii użyteczności klasyfikacji uzyskanej przez jej zastosowanie. Operacje to:
-
Łączenie dwóch węzłów Łączenie dwóch węzłów oznacza zastąpienie ich węzłem, którego dzieci są sumą zestawów dzieci oryginalnych węzłów i który podsumowuje rozkład wartości atrybutów wszystkich sklasyfikowanych pod nimi obiektów. -
Dzielenie węzła Węzeł jest dzielony przez zastąpienie go jego dziećmi. -
Wstawianie nowego węzła Tworzony jest węzeł odpowiadający wstawianemu obiektowi do drzewa. -
Przekazanie obiektu w dół hierarchii Efektywne wywołanie algorytmu COBWEB na obiekcie i poddrzewie zakorzenionym w węźle.
Algorytm PAJĘCZYNY
COBWEB ( root , rekord ): Wejście: węzeł COBWEB root , instancja do wstawienia rekordu , jeśli root nie ma dzieci , to dzieci := { copy ( root )} nowa kategoria ( rekord ) \\ dodaje dziecko z wartościami cech rekordu. wstaw ( rekord , korzeń ) \\ zaktualizuj statystyki roota else wstaw ( rekord , korzeń ) dla dziecka w korzeniu dzieci oblicz Użyteczność Kategorii dla wstawki ( rekord , dziecko ), ustaw best1 , best2 dzieci w. najlepszy CU. koniec dla jeśli nowakategoria ( rekord ) daje najlepsze CU, a następnie nowakategoria ( rekord ) w przeciwnym razie , jeśli scalanie ( najlepsze1 , najlepsze2 ) daje najlepsze CU, to łączenie ( najlepsze1 , najlepsze2 ) COBWEB ( root , rekord ) inaczej, jeśli podział ( najlepszy1 ) daje najlepsze CU, a następnie rozdziela ( best1 ) COBWEB ( root , rekord ) else COBWEB ( best1 , rekord ) koniec jeśli koniec