Podejście przybliżone oparte na dominacji

Podejście zbioru przybliżonego oparte na dominacji ( DRSA ) jest rozszerzeniem teorii zbiorów przybliżonych dla wielokryterialnej analizy decyzyjnej (MCDA), wprowadzonej przez Greco, Matarazzo i Słowińskiego. Główną zmianą w stosunku do klasycznych zbiorów przybliżonych jest zastąpienie relacji nieodróżnialności relacją dominacji, co pozwala uporać się z niespójnościami typowymi dla rozważań klas decyzyjnych uporządkowanych według kryteriów i preferencji .

Klasyfikacja wielokryterialna (sortowanie)

Klasyfikacja wielokryterialna (sortowanie) jest jednym z problemów rozpatrywanych w ramach MCDA i można ją sformułować w następujący sposób: dany zbiór obiektów oceniany przez zestaw kryteriów (atrybuty z domenami kolejności preferencji), przypisać te obiekty do pewnych predefiniowanych i preferowanych -uporządkowane klasy decyzyjne, takie, że każdy obiekt jest przypisany dokładnie do jednej klasy. Ze względu na uporządkowanie preferencji poprawa ocen obiektu na podstawie kryteriów nie powinna pogarszać jego przyporządkowania do klasy. Problem sortowania jest bardzo podobny do problemu klasyfikacji , jednak w tym drugim przypadku obiekty są oceniane według regularnych atrybutów, a klasy decyzyjne niekoniecznie są uporządkowane według preferencji. Problem klasyfikacji wielokryterialnej jest również określany jako problem klasyfikacji porządkowej z ograniczeniami monotoniczności i często pojawia się w rzeczywistych zastosowaniach, gdy porządkowe i monotoniczne wynikają z wiedzy dziedzinowej o problemie.

Jako ilustrujący przykład rozważmy problem ewaluacji w szkole średniej. Dyrektor szkoły chce przypisać uczniów ( obiekty ) do trzech klas: złą , średnią i dobrą (zauważ, że klasa dobra jest preferowana od średniej , a średnia od złej ). Każdy uczeń jest opisany przez trzy kryteria: poziom z Fizyki, Matematyki i Literatury, przy czym każdy przyjmuje jedną z trzech możliwych wartości: zły , średni i dobry . Kryteria są uporządkowane według preferencji i poprawa poziomu z jednego z przedmiotów nie powinna skutkować gorszą oceną ogólną (klasową).

Jako poważniejszy przykład rozważ klasyfikację klientów banków, z punktu widzenia ryzyka bankructwa, na bezpieczne i ryzykowne . Może to dotyczyć takich cech, jak „ zwrot z kapitału własnego (ROE)”, „ zwrot z inwestycji (ROI)” oraz „ zwrot ze sprzedaży (ROS)”. Dziedziny tych atrybutów nie są po prostu uporządkowane, ale wiążą się z kolejnością preferencji, ponieważ z punktu widzenia zarządzających bankami większe wartości ROE, ROI lub ROS są lepsze dla klientów analizowanych pod kątem ryzyka bankructwa. Atrybuty te są zatem kryteriami. Zaniedbywanie tych informacji w odkrywaniu wiedzy może prowadzić do błędnych wniosków.

Reprezentacja danych

Tabela decyzyjna

W DRSA dane są często prezentowane przy użyciu określonej formy tabeli decyzyjnej . Formalnie tabela decyzyjna DRSA jest 4-krotką, gdzie , gdzie to skończony zbiór obiektów, skończony zbiór kryteriów, gdzie kryterium i jest informacyjną taką każdego . Zbiór jest podzielony na kryteria warunkowe ( zestaw i kryterium decyzyjne ( ) { . Zauważ, że według q , podczas gdy obiektu. Przykład tablicy decyzyjnej przedstawiono w Tabeli 1 poniżej.

Przewyższający stosunek

, że dziedzina kryterium całkowicie wstępnie uporządkowana przez relację przewyższającą { y \ kryterium . utraty ogólności zakładamy, że dziedzina jest podzbiorem rzeczywistych i że relacja przewagi to prosty porządek między liczbami rzeczywistymi że zachodzi następująca relacja: . Zależność ta jest prosta dla kryterium zysku („im więcej, tym lepiej”), np. zysku firmy . Dla kryterium rodzaju kosztów („im mniej, tym lepiej”), np. Cena produktu , zależność tę można spełnić, negując wartości z .

Klasy decyzyjne i związki klasowe

Niech } Dziedzina kryterium decyzyjnego składa się z elementów (bez utraty ogólności zakładamy, że podział na klasy { , gdzie . obiekt jest i tylko jednej klasy . Klasy są uporządkowane zgodnie z rosnącą kolejnością indeksów klas, tj. dla wszystkich tak, że , obiekty z stosunku do obiektów z . Z tego powodu możemy rozważyć związki klas w górę iw dół , zdefiniowane odpowiednio jako:

Główne koncepcje

Przewaga

Mówimy, że dominuje względem , oznaczonego przez , jeśli jest lepszy niż każdym kryterium z , . Dla każdego jest i przechodnia , tj . częściowe zamówienie Biorąc pod uwagę i niech i

reprezentują zestaw dominujący P i zbiór dominujący P w odniesieniu odpowiednio do .

Zgrubne przybliżenia

Kluczową ideą filozofii zbioru przybliżonego jest przybliżenie jednej wiedzy przez inną wiedzę. W DRSA aproksymowana wiedza jest zbiorem związków klas decyzyjnych w górę iw dół, a „granulki wiedzy” używane do aproksymacji to zbiory P -dominujące i P -dominujące.

P -górne -dolne i P -górne przybliżenie P P. , oznaczone jako i , odpowiednio, są zdefiniowane jako:

Analogicznie, P i P -górne przybliżenie w odniesieniu do , oznaczony jako i , odpowiednio, są zdefiniowane jako:

Niższe przybliżenia grupują obiekty, które pewnością należą do unii klas odpowiednio do . Ta wynika z faktu, że obiekt należy do przybliżenia (odpowiednio żaden inny obiekt w twierdzeniu , tj. każdy obiekt dominuje , należy do związku klasowego (odpowiednio . Górne obiekty należeć do ( należy do górnego przybliżenia (odpowiednio , jeśli istnieje inny obiekt P -zdominowany przez z unii klas (odpowiednio .

P -dolne i P -górne przybliżenia zdefiniowane jak powyżej spełniają następujące właściwości dla wszystkich dla każdego in :

P -granice ( P-wątpliwe regiony ) i do jako: do

Jakość przybliżeń i redukcji

Stosunek

określa jakość aproksymacji podziału na pomocą zestawu Stosunek ten wyraża stosunek między wszystkimi obiektami poprawnie sklasyfikowanymi P a wszystkimi obiektami w tabeli.

minimalny podzbiór taki że do ) { RED . Tabela decyzyjna może zawierać więcej niż jedną redukcję. Przecięcie wszystkich reduktów jest znane jako rdzeń .

Zasady decyzji

Na podstawie przybliżeń uzyskanych za pomocą relacji dominacji można wyindukować uogólniony opis preferencyjnych informacji zawartych w tablicy decyzyjnej w kategoriach reguł decyzyjnych . Reguły decyzyjne są wyrażeniami w postaci if [warunek] then [następnik], które reprezentują formę zależności między kryteriami warunkowymi a kryteriami decyzyjnymi. Procedury generowania reguł decyzyjnych z tablicy decyzyjnej wykorzystują zasadę uczenia się indukcyjnego. Możemy wyróżnić trzy rodzaje reguł: pewne, możliwe i przybliżone. Pewne reguły są generowane z niższych przybliżeń związków klas; możliwe reguły są generowane z górnych przybliżeń związków klas, a reguły przybliżone są generowane z obszarów granicznych.

Niektóre reguły mają następującą postać:

jeśli i i wtedy

jeśli i i wtedy

składnię, jednak część reguły ma postać do lub do forma: może należeć do do .

Wreszcie przybliżone reguły mają składnię:

jeśli i i i i i wtedy

Pewne, możliwe i przybliżone reguły reprezentują pewną, możliwą i niejednoznaczną wiedzę wydobytą z tablicy decyzyjnej.

Każda reguła decyzyjna powinna być minimalna. Ponieważ reguła decyzyjna jest implikacją, przez minimalną regułę decyzyjną rozumiemy taką implikację, że nie ma innej implikacji z poprzednikiem o co najmniej tej samej słabości (innymi słowy, reguła wykorzystująca podzbiór warunków elementarnych lub/i słabszych elementów elementarnych warunków) i następnik o co najmniej tej samej sile (innymi słowy reguła przypisująca przedmioty do tej samej unii lub podjednostki klas).

Zbiór reguł decyzyjnych jest kompletny , jeśli jest w stanie objąć wszystkie obiekty z tablicy decyzyjnej w taki sposób, że obiekty zgodne są przeklasyfikowane do ich pierwotnych klas, a obiekty niespójne do klastrów klas odnoszących się do tej niespójności. Minimalnym nazywamy każdy zbiór reguł decyzyjnych, który jest zupełny i nieredundantny, tzn. wykluczenie jakiejkolwiek reguły z tego zbioru powoduje, że jest on niekompletny. W celu uzyskania zestawu reguł decyzyjnych można przyjąć jedną z trzech strategii indukcyjnych:

  • generowanie minimalnego opisu, czyli minimalnego zestawu reguł,
  • generowanie wyczerpującego opisu, czyli wszystkich reguł dla danej macierzy danych,
  • generowanie opisu charakterystycznego, czyli zestawu reguł obejmujących relatywnie wiele obiektów każdy, jednak łącznie niekoniecznie wszystkie obiekty z tablicy decyzyjnej

Najpopularniejszym algorytmem indukcji reguł dla podejścia zbioru przybliżonego opartego na dominacji jest DOMLEM, który generuje minimalny zbiór reguł.

Przykład

Rozważmy następujący problem ocen uczniów szkół średnich:

Tabela 1: Przykład — oceny szkół średnich
przedmiot (uczeń)
(Matematyka)

(Fizyka)

(literatura)

(globalny wynik)
średni średni zły zły
Dobry średni zły średni
średni Dobry zły średni
zły średni Dobry zły
zły zły średni zły
zły średni średni średni
Dobry Dobry zły Dobry
Dobry średni średni średni
średni średni Dobry Dobry
Dobry średni Dobry Dobry

trzema kryteriami związanymi z Literatura odpowiednio. Zgodnie z atrybutem decyzyjnym uczniowie są podzieleni na trzy klasy uporządkowane według preferencji: , i . W ten sposób przybliżono następujące związki klas:

  • czyli klasa (co najwyżej) złych uczniów,
  • czyli klasa co najwyżej średnich uczniów,
  • czyli klasa co najmniej średnich uczniów,
  • czyli klasa (co najmniej) dobrych uczniów.

{ \ Displaystyle ma lepsze oceny we wszystkich trzech kryteriach niż globalny.

Dlatego niższe przybliżenia związków klas składają się z następujących obiektów:

Zatem i _ Ich górne przybliżenia są następujące:

podczas gdy ich regiony graniczne to:

Oczywiście i _ , i

Z tablicy decyzyjnej można wywnioskować następujący minimalny zestaw 10 reguł:

  1. s to
  2. L P i wtedy
  3. jeśli to
  4. P Fizyka wtedy
  5. jeśli i to
  6. L M wtedy
  7. do M wtedy
  8. jeśli to
  9. jeśli to
  10. jeśli i wtedy

Ostatnia zasada jest przybliżona, podczas gdy reszta jest pewna.

Rozszerzenia

Wielokryterialne problemy wyboru i rankingu

Pozostałe dwa problemy rozpatrywane w ramach wielokryterialnej analizy decyzyjnej , wielokryterialny wybór i problemy z rankingiem , można również rozwiązać za pomocą podejścia zbioru przybliżonego opartego na dominacji. Odbywa się to poprzez przekształcenie tabeli decyzyjnej w tabelę porównań parami (PCT).

DRSA o zmiennej konsystencji

Definicje przybliżonych przybliżeń opierają się na ścisłym zastosowaniu zasady dominacji. Jednak przy definiowaniu obiektów niejednoznacznych rozsądne jest zaakceptowanie ograniczonej liczby przykładów negatywnych, szczególnie w przypadku dużych tablic decyzyjnych. Tak rozszerzona wersja DRSA nosi nazwę Variable-Consistency DRSA model (VC-DRSA)

Stochastyczny DRSA

W rzeczywistych danych, szczególnie w przypadku dużych zbiorów danych, pojęcia zgrubnych przybliżeń okazały się zbyt restrykcyjne. W związku z tym wprowadzono rozszerzenie DRSA, oparte na modelu stochastycznym ( Stochastic DRSA ), które w pewnym stopniu dopuszcza niespójności. Po przedstawieniu modelu probabilistycznego dla problemów klasyfikacji porządkowej z ograniczeniami monotoniczności, koncepcje niższych przybliżeń rozszerzono na przypadek stochastyczny. Metoda opiera się na szacowaniu prawdopodobieństw warunkowych metodą nieparametrycznej największej wiarygodności , co prowadzi do problemu regresji izotonicznej .

Zbiory przybliżone oparte na dominacji stochastycznej można również uznać za rodzaj modelu o zmiennej spójności.

Oprogramowanie

4eMka2 to system wspomagania decyzji dla wielokryterialnych problemów klasyfikacyjnych opartych na zbiorach przybliżonych opartych na dominacji (DRSA). JAMM to znacznie bardziej zaawansowany następca 4eMka2. Oba systemy są bezpłatnie dostępne dla celów non-profit na Laboratorium Inteligentnych Systemów Wspomagania Decyzji (IDSS) .

Zobacz też

  • Chakhar S., Ishizaka A., Labib A., Saad I. (2016). Oparte na dominacji przybliżone podejście do decyzji grupowych, European Journal of Operational Research, 251(1): 206-224
  • Li S., Li T. Zhang Z., Chen H., Zhang J. (2015). Obliczanie równoległe przybliżeń w podejściu opartym na dominacji, systemy oparte na wiedzy, 87: 102-111
  • Li S., Li T. (2015). Przyrostowa aktualizacja przybliżeń w podejściu zgrubnym opartym na dominacji w ramach zmienności wartości atrybutów, Information Sciences, 294: 348-361
  • Li S., Li T., Liu D. (2013). Dynamiczne utrzymanie przybliżeń w podejściu zgrubnym opartym na dominacji w ramach zmienności zestawu obiektów, International Journal of Intelligent Systems, 28 (8): 729-751

Linki zewnętrzne