Pajęczyna (skupienie)

COBWEB to przyrostowy system do hierarchicznego grupowania pojęciowego . PAJĘCZYNA została wynaleziona przez profesora Douglasa H. Fishera, obecnie na Uniwersytecie Vanderbilt.

COBWEB stopniowo organizuje obserwacje w drzewo klasyfikacyjne . Każdy węzeł w drzewie klasyfikacyjnym reprezentuje klasę (koncepcję) i jest oznaczony koncepcją probabilistyczną, która podsumowuje rozkłady atrybut-wartość obiektów sklasyfikowanych w węźle. To drzewo klasyfikacyjne może służyć do przewidywania brakujących atrybutów lub klasy nowego obiektu.

Istnieją cztery podstawowe operacje, które COBWEB stosuje przy budowaniu drzewa klasyfikacyjnego. To, która operacja zostanie wybrana, zależy od kategorii użyteczności klasyfikacji uzyskanej przez jej zastosowanie. Operacje to:


  • Łączenie dwóch węzłów Łączenie dwóch węzłów oznacza zastąpienie ich węzłem, którego dzieci są sumą zestawów dzieci oryginalnych węzłów i który podsumowuje rozkład wartości atrybutów wszystkich sklasyfikowanych pod nimi obiektów.

  • Dzielenie węzła Węzeł jest dzielony przez zastąpienie go jego dziećmi.

  • Wstawianie nowego węzła Tworzony jest węzeł odpowiadający wstawianemu obiektowi do drzewa.

  • Przekazanie obiektu w dół hierarchii Efektywne wywołanie algorytmu COBWEB na obiekcie i poddrzewie zakorzenionym w węźle.

Algorytm PAJĘCZYNY

  
   
    
       
        
      
   COBWEB  (  root  ,  rekord  ): Wejście: węzeł COBWEB  root  , instancja do wstawienia  rekordu  , jeśli  root  nie ma dzieci  , to  dzieci  := {  copy  (  root  )}  nowa kategoria  (  rekord  ) \\ dodaje dziecko z wartościami cech rekordu.  wstaw  (  rekord  ,  korzeń  ) \\ zaktualizuj statystyki roota  else  wstaw  (  rekord  ,  korzeń  )  dla  dziecka  w  korzeniu  dzieci  oblicz  Użyteczność Kategorii dla  wstawki  (  rekord  ,  dziecko  ), ustaw  best1  ,  best2  dzieci w. najlepszy CU.   koniec dla  jeśli  nowakategoria  (  rekord  ) daje najlepsze CU, a następnie  nowakategoria  (  rekord  )  w przeciwnym razie  , jeśli  scalanie  (  najlepsze1  ,  najlepsze2  ) daje najlepsze CU, to  łączenie  (  najlepsze1  ,  najlepsze2  )  COBWEB  (  root  ,  rekord  )  inaczej, jeśli  podział  (  najlepszy1  ) daje najlepsze CU, a następnie  rozdziela  (  best1  )  COBWEB  (  root  ,  rekord  )  else  COBWEB  (  best1  ,  rekord  )  koniec jeśli  koniec 

Linki zewnętrzne