Ostry zestaw

W informatyce zbiór przybliżony , po raz pierwszy opisany przez polskiego informatyka Zdzisława I. Pawlaka , jest formalnym przybliżeniem zbioru ostrego (tj. zbioru konwencjonalnego) w kategoriach pary zbiorów, które dają dolne i górne przybliżenie zbioru oryginalny zestaw. W standardowej wersji teorii zbiorów przybliżonych (Pawlak 1991) zbiory dolnego i górnego przybliżenia są zbiorami ostrymi, ale w innych odmianach zbiory przybliżone mogą być zbiorami rozmytymi .

Definicje

Poniższa sekcja zawiera przegląd podstawowych ram teorii zbiorów przybliżonych, zaproponowanych pierwotnie przez Zdzisława I. Pawlaka , wraz z niektórymi kluczowymi definicjami. Więcej własności formalnych i granic zbiorów przybliżonych można znaleźć w Pawlaku (1991) i cytowanej literaturze. Początkowa i podstawowa teoria zbiorów przybliżonych jest czasami określana jako „zbiory przybliżone Pawlaka” lub „klasyczne zbiory przybliżone” , aby odróżnić je od nowszych rozszerzeń i uogólnień.

Ramy systemu informacyjnego

Niech będzie systemem informacyjnym ( system atrybut-wartość ), gdzie niepusty, skończony zbiór obiektów (wszechświat) i \ dla każdego . to zbiór wartości, jakie może przyjąć atrybut Tabela informacyjna przypisuje wartość za każdego atrybutu obiektu we wszechświecie .

każdym istnieje powiązana relacja równoważności }

Relacja _ _ _ Podział rodziną klas równoważności _ (lub ).

Jeśli , to i nie do odróżnienia ( lub nie do odróżnienia) według .

Klasy równoważności relacji są oznaczone .

Przykład: struktura klasy równoważności

Rozważmy na przykład następującą tabelę informacyjną:

Przykładowy system informacyjny
Obiekt
1 2 0 1 1
1 2 0 1 1
2 0 0 1 0
0 0 1 2 1
2 1 0 2 1
0 0 1 2 2
2 0 0 1 0
0 1 2 2 1
2 1 0 2 2
2 0 0 1 0

Gdy pełny zestaw atrybutów jest brane pod uwagę, widzimy, że mamy siedem następujących klas równoważności:

Zatem dwa obiekty w pierwszej klasie równoważności nie mogą być odróżnione od siebie na podstawie dostępnych atrybutów, drugiej klasie od dostępne atrybuty. Pozostałe pięć obiektów można odróżnić od wszystkich innych obiektów.

Oczywiste jest, że różne wybory podzbiorów atrybutów generalnie prowadzą do różnych klas nierozróżnialności. Na przykład, jeśli zostanie wybrany sam atrybut, otrzymamy następującą, znacznie bardziej zgrubną strukturę klas równoważności:

Definicja zbioru przybliżonego

Niech docelowym, który chcemy reprezentować za pomocą podzbioru atrybutów ; to znaczy, powiedziano nam, że dowolny zestaw obiektów pojedynczą klasę i chcemy wyrazić tę klasę (tj. ten podzbiór) za pomocą klas równoważności wywołanych przez . Ogólnie rzecz biorąc, i wykluczać obiekty, których nie można odróżnić na podstawie .

Weźmy na przykład zestaw docelowy i niech podzbiór atrybutów , pełny dostępny zestaw funkcji. Zbiór nie można wyrazić dokładnie, ponieważ w , obiekty są nie do odróżnienia. nie ma sposobu na przedstawienie żadnego zestawu który obejmuje , wyklucza obiekty O i .

Jednak zestaw docelowy przybliżyć tylko użyciu informacji zawartych w konstruując -dolne i -górne przybliżenia :

Dolne przybliżenie i obszar dodatni

przybliżenie lub region dodatni to suma wszystkich klas równoważności w , które są zawarte w (tj. są podzbiorami) P {\ displaystyle P} zestaw docelowy - w przykładzie , suma dwóch klas równoważności w , które są zawarte w zbiorze docelowym. przybliżenie to pełny zestaw obiektów w , który można pozytywnie (tj. sklasyfikować jako należący .

Górne przybliżenie i obszar ujemny

Górne przybliżenie to suma wszystkich klas równoważności w które mają niepuste przecięcie ze zbiorem docelowym - w przykładzie , suma trzech klas równoważności w , które mają niepuste przecięcie ze zbiorem docelowym. Górne przybliżenie kompletny zestaw obiektów, których nie pozytywnie należących do dopełnienia ( ) zestawu docelowego . Innymi , górne przybliżenie to kompletny zestaw obiektów, które prawdopodobnie są członkami zbioru .

Zbiór reprezentuje zatem ujemny zawierający zbiór obiektów, które można zdecydowanie wykluczyć jako

Region graniczny

Obszar graniczny , określony przez ustaloną różnicę wykluczyć, ani wykluczyć jako członkowie zestawu docelowego .

Podsumowując, dolne przybliżenie zbioru docelowego jest przybliżeniem konserwatywnym składającym się tylko z tych obiektów, które można pozytywnie zidentyfikować jako członków zbioru. (Obiekty te nie mają nieodróżnialnych „klonów”, które są wykluczone przez zbiór docelowy). Górne przybliżenie jest przybliżeniem liberalnym , które obejmuje wszystkie obiekty, które mogą należeć do zbioru docelowego. (Niektóre obiekty w górnym przybliżeniu mogą nie należeć do zbioru docelowego). Z perspektywy , dolne przybliżenie zawiera obiekty, które są członkami zbioru docelowego z pewnością (prawdopodobieństwo = 1), podczas gdy górne przybliżenie zawiera obiekty, które są członkami zbioru docelowego z niezerowym prawdopodobieństwem (prawdopodobieństwo > 0).

Gruby zestaw

Krotka z i _ tak więc zbiór przybliżony składa się z dwóch wyraźnych zestawów, z których jeden reprezentuje zbioru docelowego a drugi reprezentuje górną granicę zbioru .

Dokładność przybliżonej reprezentacji zbioru można podać (Pawlak 1991) w następujący sposób: {

Oznacza to, że dokładność reprezentacji zbioru przybliżonego , , to stosunek liczby obiektów, które można pozytywnie umieścić w do liczby obiektów, które można ewentualnie umieścić w – zapewnia to miarę tego, jak bardzo zbiór przybliżony zbliża się do zbioru docelowego. (tj. obszar graniczny pusty), to doskonałe z drugiej strony, gdy dolne przybliżenie jest puste, dokładność wynosi zero (niezależnie od wielkości górnego przybliżenia).

Obiektywna analiza

Teoria zbiorów przybliżonych jest jedną z wielu metod, które można zastosować do analizy niepewnych (w tym niejasnych) systemów, chociaż jest mniej powszechna niż bardziej tradycyjne metody prawdopodobieństwa , statystyki , entropii i teorii Dempstera-Shafera . Jednak kluczową różnicą i wyjątkową siłą stosowania klasycznej teorii zbiorów przybliżonych jest to, że zapewnia ona obiektywną formę analizy (Pawlak i in. 1995). W przeciwieństwie do innych metod, jak te podane powyżej, klasyczna analiza zbiorów przybliżonych nie wymaga żadnych dodatkowych informacji, parametrów zewnętrznych, modeli, funkcji, ocen ani subiektywnych interpretacji w celu określenia przynależności do zbioru – zamiast tego wykorzystuje jedynie informacje przedstawione w ramach danych (Düntsch i Gediga 1995). ). Nowsze adaptacje teorii zbiorów przybliżonych, takie jak oparte na dominacji, oparte na teorii decyzji i rozmyte zbiory przybliżone, wprowadziły do ​​analizy więcej subiektywności.

Definiowalność

Ogólnie rzecz biorąc, górne i dolne przybliżenia nie są równe; takich przypadkach mówimy, że zestaw docelowy nieokreślony z grubsza możliwy do zdefiniowania na zestawie . Gdy górne i dolne przybliżenia są równe (tj. Granica jest pusta), wtedy zestaw docelowy _ _ na zestawie atrybutów . . Możemy wyróżnić następujące szczególne przypadki niedefiniowalności:

  • Zbiór jest wewnętrznie niedefiniowalny , jeśli P . Oznacza to, że w zestawie atrybutów nie ma obiektów, co do których możemy być pewni, że należą do zestawu docelowego P obiekty, które możemy definitywnie wykluczyć ze zbioru .
  • Zbiór jest zewnętrznie niedefiniowalny , jeśli P . Oznacza to, że na zestawie atrybutów istnieją obiekty , co do których możemy być pewni, że należą do zestawu docelowego nie ma ich P obiekty, które możemy definitywnie wykluczyć ze zbioru .
  • Zbiór jest całkowicie niedefiniowalny , jeśli P . Oznacza to, że w zestawie atrybutów nie ma obiektów, co do których możemy być pewni, że należą do zestawu docelowego i nie ma żadnych obiektów obiekty, które możemy definitywnie wykluczyć ze zbioru . Tak więc na zestawie atrybutów członkiem .

Zredukuj i rdzeń

Interesującym pytaniem jest, czy istnieją atrybuty w systemie informacyjnym (tabela atrybut-wartość), które są ważniejsze dla wiedzy reprezentowanej w strukturze klas równoważności niż inne atrybuty. Często zastanawiamy się, czy istnieje podzbiór atrybutów, który sam w sobie może w pełni scharakteryzować wiedzę w bazie danych; taki zestaw atrybutów nazywa się reduktem .

Formalnie redukt jest podzbiorem atrybutów takim, że

  • = , czyli klasy równoważności wywołane przez zredukowany zestaw atrybutów równoważności wywołana przez pełny .
  • zestaw atrybutów minimalny w tym sensie, że dla dowolnego atrybutu ; innymi słowy, żaden atrybut nie może zostać usunięty ze zbioru bez zmiany klas równoważności .

Redukt można traktować jako wystarczający zbiór cech – wystarczający do reprezentowania struktury kategorii. przykładowej tabeli - te atrybuty mają taką samą strukturę klas równoważności, jak ta wyrażona przez pełny zestaw atrybutów:

atrybutów redukcją, struktura klas, w wyniku czego .

Redukcja systemu informacyjnego nie jest czymś wyjątkowym : może istnieć wiele podzbiorów atrybutów, które zachowują strukturę klas równoważności (tj. wiedzę) wyrażoną w systemie informacyjnym. przykładowym systemie informacyjnym klasy jak .

Zbiór atrybutów, który jest wspólny dla wszystkich reduktów, nazywany jest rdzeniem : rdzeń jest zbiorem atrybutów, który posiada każdy redukt, a zatem składa się z atrybutów, których nie można usunąć z systemu informacyjnego bez spowodowania upadku klasy równoważności Struktura. O rdzeniu można myśleć jako o zbiorze niezbędnych atrybutów – niezbędnych, to znaczy do przedstawienia struktury kategorii. W przykładzie jedynym takim atrybutem jest ; każdy z pozostałych atrybutów można usunąć pojedynczo bez uszkodzenia struktury klasy równoważności, a zatem wszystkie są zbędne . Jednak usunięcie zmienia równoważności _ _ atrybut tego systemu informacyjnego, a więc rdzeń.

Rdzeń może być pusty, co oznacza, że ​​nie ma żadnego niezbędnego atrybutu: każdy pojedynczy atrybut w takim systemie informacyjnym można usunąć bez zmiany struktury klas równoważności. W takich przypadkach nie ma istotnego ani koniecznego atrybutu, który jest wymagany do przedstawienia struktury klasowej.

Zależność atrybutu

Jednym z najważniejszych aspektów analizy bazy danych lub akwizycji danych jest odkrycie zależności atrybutów; to znaczy chcemy odkryć, które zmienne są silnie powiązane z jakimi innymi zmiennymi. Ogólnie rzecz biorąc, to właśnie te silne relacje uzasadnią dalsze badania, które ostatecznie będą przydatne w modelowaniu predykcyjnym.

W teorii zbiorów przybliżonych pojęcie zależności definiuje się bardzo prosto. Weźmy dwa (rozłączne) zestawy atrybutów, ustawmy zbadajmy jaki stopień zależności występuje między nimi. Każdy zestaw atrybutów indukuje strukturę klasy równoważności (nieodróżnialności), klasy równoważności wywołane przez podane przez równoważności wywołane przez podany przez .

Niech , gdzie jest daną klasą równoważności ze struktury klas równoważności wywołanej . Następnie zależność zestawu atrybutów na zestawie atrybutów , jest podane przez ,

Oznacza to, że dla każdej klasy równoważności w rozmiar jej dolnego przybliżenia przez atrybuty w , tj. . To przybliżenie (jak powyżej, dla dowolnego zestawu liczba obiektów, które na zestawie atrybutów można pozytywnie zidentyfikować jako należące do zestawu docelowego . Dodany do wszystkich klas równoważności w całkowitą liczbę obiektów, które - na podstawie zestawu atrybutów - można pozytywnie skategoryzować według klasyfikacja wywołana atrybutami . Współczynnik zależności wyraża zatem proporcję (w całym wszechświecie) takich klasyfikowalnych obiektów. Zależność „można interpretować jako proporcję takich obiektów w systemie informacyjnym, dla których wystarczy znać wartości atrybutów w , aby określić wartości atrybutów w ".

jest przyjęcie partycji wywołanej przez klasę docelową i rozważenie zestawu atrybutów, którego chcemy użyć „zrekonstruować” klasę docelową do . Jeśli można całkowicie zrekonstruować to całkowicie zależy od ; jeśli rekonstrukcją , to ogóle nie zależy od

stopień funkcjonalnej (tj. deterministycznej) zależności zestawu atrybutów od zestawu nie jest symetryczny. Związek tego pojęcia zależności atrybutów z bardziej tradycyjnymi koncepcjami informacyjno-teoretycznymi (tj. entropicznymi) pojęciami zależności atrybutów był omawiany w wielu źródłach (np. Pawlak, Wong i Ziarko 1988; Yao i Yao 2002; Wong, Ziarko i Ye 1986, Quafafou i Boussouf 2000).

Ekstrakcja reguł

Wszystkie omówione powyżej reprezentacje kategorii mają charakter ekstensjonalny ; to znaczy kategoria lub klasa złożona jest po prostu sumą wszystkich jej członków. Zatem reprezentowanie kategorii oznacza po prostu możliwość wymienienia lub zidentyfikowania wszystkich obiektów należących do tej kategorii. Jednak ekstensjonalne reprezentacje kategorii mają bardzo ograniczone praktyczne zastosowanie, ponieważ nie dają wglądu w podejmowanie decyzji, czy nowe (nigdy wcześniej nie widziane) obiekty są członkami kategorii.

Ogólnie pożądany jest celowy opis kategorii, reprezentacja kategorii oparta na zestawie reguł opisujących zakres kategorii. Wybór takich reguł nie jest wyjątkowy i na tym polega problem obciążenia indukcyjnego . Zobacz Przestrzeń wersji i Wybór modelu, aby uzyskać więcej informacji o tym problemie.

Istnieje kilka metod wyodrębniania reguł. Zaczniemy od procedury wyodrębniania reguł opartej na Ziarko i Shan (1995).

Macierze decyzyjne

Załóżmy, że chcemy znaleźć minimalny zestaw spójnych reguł ( implikacji logicznych ), które charakteryzują nasz przykładowy system. Dla zestawu atrybutów warunku i atrybut decyzyjny jot lub, przeliterowane,

gdzie _ Jest to forma typowa dla reguł asocjacyjnych , a liczba elementów w , które pasują do warunku/poprzednika, nazywana jest wsparciem dla reguły. Metodą wyodrębniania takich reguł podaną w Ziarko i Shan (1995) jest utworzenie macierzy decyzyjnej każdej decyzyjnego . Nieformalnie macierz decyzyjna dla wartości par atrybut-wartość, które różnią między obiektami posiadającymi i .

Najlepiej wyjaśnić to na przykładzie (co również pozwala uniknąć wielu notacji). Rozważ powyższą tabelę i niech po prawej stronie implikacji) i niech będą zmiennymi warunkującymi (po lewej stronie implikacji). Zauważmy, że zmienna decyzyjna przyjmuje dwie różne wartości, a mianowicie { . Każdą sprawę traktujemy osobno.

przyjrzymy się przypadkowi na mają i te, które mają . (Zauważ, że obiekty z w tym przypadku są po prostu obiektami, które mają , ale ogólnie rzecz biorąc, wszystkie obiekty mające jakąkolwiek wartość inną niż P i może istnieć kilka takich klas obiektów (na przykład te, które mają ).) W tym przypadku obiekty posiadające to { podczas gdy obiekty, które mają to . Macierz decyzyjna dla zawiera wszystkie różnice między obiektami posiadającymi tymi, które mają ; to znaczy macierz decyzyjna zawiera wszystkie różnice między i . Umieściliśmy obiekty „pozytywne” ( wiersze, a obiekty jako kolumny.

Macierz decyzyjna dla
Obiekt

, spójrz na przykład na przecięcie wiersza i kolumny , pokazując w komórce. to, że w odniesieniu do wartości decyzyjnej różni się od obiektu atrybutach i poszczególnych wartościach tych atrybutów dla obiektu pozytywnego i i . To mówi nam że poprawna klasyfikacja do klasy decyzyjnej opiera się na atrybutach i i ; chociaż jeden lub drugi może być zbędny, wiemy, że przynajmniej jeden z tych atrybutów jest zbędny .

Następnie z każdej macierzy decyzyjnej tworzymy zestaw wyrażeń boolowskich , po jednym wyrażeniu dla każdego wiersza macierzy. Elementy w każdej komórce są agregowane rozłącznie, a poszczególne komórki są następnie agregowane koniunkcyjnie. Zatem dla powyższej tabeli mamy pięć następujących wyrażeń boolowskich:

bardzo specyficzną (prawdopodobnie zbyt ) regułą rządzącą członkostwem w klasie obiektu. Na przykład ostatnie stwierdzenie, odnoszące się do obiektu , stwierdza, że ​​muszą być spełnione wszystkie poniższe warunki:

  1. Albo mieć wartość 2, albo musi mieć wartość 0,
  2. musi mieć wartość 0.
  3. Albo mieć wartość 2, albo musi mieć wartość 0,
  4. P lub musi mieć wartość 0 lub musi mieć wartość 0 lub 3 ich kombinacja.
  5. musi mieć wartość 0.

Oczywiste jest, że występuje tu duża nadmiarowość, a następnym krokiem jest uproszczenie przy użyciu tradycyjnej algebry Boole'a . Stwierdzenie odpowiadające obiektom upraszcza się do , co daje implikację

Podobnie zdanie odpowiadające obiektom upraszcza się do . To daje nam implikację

Powyższe implikacje można również zapisać jako następujący zestaw reguł:

Można zauważyć, że każda z pierwszych dwóch reguł ma wsparcie 1 (tj. poprzednik pasuje do dwóch obiektów), podczas gdy każda z dwóch ostatnich reguł ma wsparcie 2. Aby zakończyć pisanie zestawu reguł dla tego systemu wiedzy, taką samą procedurę decyzyjnej) należy zastosować w przypadku , uzyskując ten sposób nowy zestaw implikacji dla tej wartości decyzyjnej (tj. zbiór implikacji z jako konsekwencja). Generalnie procedura będzie powtarzana dla każdej możliwej wartości zmiennej decyzyjnej.

System wprowadzania reguł LERS

System danych LERS (Learning from Examples based on Rough Sets) Grzymala-Busse (1997) może indukować reguły z niespójnych danych, tj. danych ze sprzecznymi obiektami. Dwa obiekty są sprzeczne, gdy charakteryzują się tymi samymi wartościami wszystkich atrybutów, ale należą do różnych pojęć (klas). LERS wykorzystuje teorię zbiorów przybliżonych do obliczania dolnych i górnych przybliżeń dla pojęć związanych z konfliktami z innymi pojęciami.

Reguły wyprowadzone z dolnego przybliżenia pojęcia z pewnością opisują to pojęcie, stąd też takie reguły nazywane są pewnymi . Z drugiej strony reguły wyprowadzone z górnego przybliżenia pojęcia opisują pojęcie możliwie , więc reguły te nazywamy możliwymi . Do indukcji reguł LERS używa trzech algorytmów: LEM1, LEM2 i IRIM.

Algorytm LEM2 LERS jest często używany do indukcji reguł i jest używany nie tylko w LERS, ale także w innych systemach, np. w RSES (Bazan i in. (2004). LEM2 bada przestrzeń poszukiwań par atrybut-wartość. Jego dane wejściowe zbiór danych jest dolnym lub górnym przybliżeniem pojęcia, więc jego zbiór danych wejściowych jest zawsze spójny.Ogólnie rzecz biorąc, LEM2 oblicza pokrycie lokalne, a następnie przekształca je w zbiór reguł.Przytoczymy kilka definicji opisujących algorytm LEM2.

Algorytm LEM2 opiera się na idei bloku pary atrybut-wartość. Niech niepustym dolnym lub górnym przybliżeniem pojęcia reprezentowanego przez parę decyzyjno-wartościową . Zestaw zależy zbioru par atrybut-wartość ,

Zbiór jest minimalnym zespołem X tylko wtedy, gdy T i nie ma odpowiedniego podzbioru T istnieje tak, że od . Niech być niepustym zbiorem niepustych zestawów par atrybut-wartość. Wtedy jest pokryciem wtedy i tylko wtedy, gdy spełnione są następujące trzy warunki:

każdy członek z jest minimalnym kompleksem T {\ displaystyle ,

jest minimalne, tj. ma najmniejszą możliwą liczbę członków.

Dla naszego przykładowego systemu informacyjnego LEM2 wywoła następujące reguły:

Inne metody uczenia się reguł można znaleźć np. u Pawlaka (1991), Stefanowskiego (1998), Bazana i in. (2004) itp.

Niekompletne dane

Teoria zbiorów przybliżonych jest przydatna do wprowadzania reguł z niekompletnych zbiorów danych. Korzystając z tego podejścia, możemy wyróżnić trzy rodzaje brakujących wartości atrybutów: utracone wartości (wartości, które zostały zarejestrowane, ale obecnie są niedostępne), wartości atrybutów-pojęcia (te brakujące wartości atrybutów można zastąpić dowolną wartością atrybutu ograniczoną do tego samego pojęcia) i warunki „nie przejmuj się” (oryginalne wartości były nieistotne). Pojęcie ( klasa ) to zbiór wszystkich obiektów sklasyfikowanych (lub zdiagnozowanych) w ten sam sposób .

Dogłębnie zbadano dwa specjalne zestawy danych z brakującymi wartościami atrybutów: w pierwszym przypadku wszystkie brakujące wartości atrybutów zostały utracone (Stefanowski i Tsoukias, 2001), w drugim przypadku wszystkie brakujące wartości atrybutów były warunkami „nie przejmuj się” (Kryszkiewicz, 1999).

W interpretacji wartości atrybut-pojęcie brakującej wartości atrybutu brakującą wartość atrybutu można zastąpić dowolną wartością domeny atrybutu ograniczonej do pojęcia, do którego należy obiekt z brakującą wartością atrybutu (Grzymala-Busse i Grzymala-Busse, 2007 ). Na przykład, jeśli dla pacjenta brakuje wartości atrybutu Temperatura, ten pacjent jest chory na grypę, a wszyscy pozostali pacjenci chorzy na grypę mają wysokie lub bardzo wysokie wartości Temperatury, gdy stosuje się interpretację brakującej wartości atrybutu jako wartość pojęcia atrybutu, zastąpimy brakującą wartość atrybutu wartością wysoką i bardzo wysoką. Dodatkowo, charakterystyczna relacja , (zob. np. Grzymala-Busse i Grzymala-Busse, 2007) umożliwia przetwarzanie zbiorów danych ze wszystkimi trzema rodzajami brakujących wartości atrybutów jednocześnie: utraconymi, „nie przejmuj się” oraz wartościami atrybut-pojęcie .

Aplikacje

Metody zbiorów przybliżonych mogą być stosowane jako składnik rozwiązań hybrydowych w uczeniu maszynowym i eksploracji danych . Stwierdzono, że są one szczególnie przydatne do wprowadzania reguł i selekcji cech ( redukcja wymiarowości z zachowaniem semantyki ). Zgrubne metody analizy danych oparte na zbiorach są z powodzeniem stosowane w bioinformatyce , ekonomii i finansach, medycynie, multimediach, eksploracji sieci i tekstu , przetwarzaniu sygnałów i obrazów, inżynierii oprogramowania , robotyki i inżynierii (np. systemy zasilania i inżynieria sterowania ). Ostatnio trzy regiony zbiorów przybliżonych są interpretowane jako regiony akceptacji, odrzucenia i odroczenia. Prowadzi to do trójstronnego podejmowania decyzji z modelem, co potencjalnie może prowadzić do interesujących przyszłych zastosowań.

Historia

Idea zbioru przybliżonego została zaproponowana przez Pawlaka (1981) jako nowe narzędzie matematyczne do radzenia sobie z niejasnymi pojęciami. Comer, Grzymala-Busse, Iwiński, Nieminen, Novotny, Pawlak, Obtulowicz i Pomykała badali własności algebraiczne zbiorów przybliżonych. Różne semantyki algebraiczne rozwinęli P. Pagliani, I. Duntsch, MK Chakraborty, M. Banerjee i A. Mani; zostały one rozszerzone na bardziej uogólnione zbiory przybliżone, w szczególności przez D. Cattaneo i A. Mani. Zbiorów przybliżonych można używać do reprezentowania niejednoznaczności , niejasności i ogólnej niepewności .

Rozszerzenia i uogólnienia

Od czasu opracowania zbiorów przybliżonych nadal ewoluują rozszerzenia i uogólnienia. Początkowe prace koncentrowały się na związkach — zarówno podobieństwach, jak i różnicach — ze zbiorami rozmytymi . Podczas gdy część literatury twierdzi, że te koncepcje są różne, inna literatura uważa, że ​​zbiory przybliżone są uogólnieniem zbiorów rozmytych - reprezentowanych przez rozmyte zbiory przybliżone lub przybliżone zbiory rozmyte. Pawlak (1995) uważał, że zbiory rozmyte i przybliżone należy traktować jako wzajemnie się uzupełniające, odnoszące się do różnych aspektów niepewności i niejasności.

Trzy godne uwagi rozszerzenia klasycznych zbiorów przybliżonych to:

  • Podejście zbioru przybliżonego oparte na dominacji (DRSA) jest rozszerzeniem teorii zbiorów przybliżonych dla wielokryterialnej analizy decyzyjnej (MCDA), wprowadzonej przez Greco, Matarazzo i Słowińskiego (2001). Główną zmianą w tym rozszerzeniu klasycznych zbiorów przybliżonych jest zastąpienie relacji nieodróżnialności relacją dominacji , która pozwala formalizmowi uporać się z niespójnościami typowymi dla rozważań klas decyzyjnych uporządkowanych według kryteriów i preferencji.
  • Zbiory przybliżone teorii decyzji (DTRS) to probabilistyczne rozszerzenie teorii zbiorów przybliżonych wprowadzone przez Yao, Wonga i Lingrasa (1990). Wykorzystuje Bayesowską procedurę decyzyjną do podejmowania decyzji przy minimalnym ryzyku. Elementy są uwzględniane w dolnym i górnym przybliżeniu na podstawie tego, czy ich prawdopodobieństwo warunkowe przekracza progi β . Te górne i dolne progi określają włączenie regionu dla elementów. Ten model jest wyjątkowy i potężny, ponieważ same progi są obliczane na podstawie zestawu sześciu funkcji strat reprezentujących ryzyka klasyfikacyjne.
  • Zbiory przybliżone teorii gier (GTRS) to oparte na teorii gier rozszerzenie zbioru przybliżonego, które zostało wprowadzone przez Herberta i Yao (2011). Wykorzystuje środowisko teorii gier do optymalizacji pewnych kryteriów klasyfikacji lub podejmowania decyzji w oparciu o zbiory przybliżone w celu uzyskania efektywnych rozmiarów regionów.

Szorstkie członkostwo

Zbiory przybliżone można również zdefiniować jako uogólnienie, stosując przybliżoną funkcję przynależności zamiast obiektywnego przybliżenia. Zgrubna przynależności wyraża warunkowe prawdopodobieństwo do Można to interpretować jako stopień, który należy do względem informacji o wyrażonej przez .

Członkostwo przybliżone różni się przede wszystkim od członkostwa rozmytego tym, że przynależności do sumy i przecięcia zbiorów nie można generalnie obliczyć na podstawie ich członkostwa składowego, jak ma to miejsce w przypadku zbiorów rozmytych. Pod tym względem przybliżone członkostwo jest uogólnieniem członkostwa rozmytego. Co więcej, przybliżona funkcja przynależności jest bardziej oparta na prawdopodobieństwie niż konwencjonalne koncepcje rozmytej funkcji przynależności.

Inne uogólnienia

Kilka uogólnień zbiorów przybliżonych zostało wprowadzonych, zbadanych i zastosowanych do rozwiązywania problemów. Oto niektóre z tych uogólnień:

  • zgrubne multisety (Grzymala-Busse, 1987)
  • zbiory rozmyte przybliżone rozszerzają koncepcję zbiorów przybliżonych poprzez zastosowanie klas rozmytych równoważności (Nakamura, 1988)
  • Teoria zbiorów przybliżonych alfa (α-RST) - uogólnienie teorii zbiorów przybliżonych, które umożliwia przybliżenie przy użyciu pojęć rozmytych (Quafafou, 2000)
  • intuicjonistyczne rozmyte zbiory przybliżone (Cornelis, De Cock i Kerre, 2003)
  • uogólnione przybliżone zbiory rozmyte (Feng, 2010)
  • zgrubne intuicjonistyczne zbiory rozmyte (Thomas i Nair, 2011)
  • miękkie zbiory rozmyte szorstkie i miękkie zbiory rozmyte szorstkie (Meng, Zhang i Qin, 2011)
  • złożone zbiory przybliżone (Zhang, Li i Chen, 2014)

Zobacz też

  •   Pawlak, Zdzisław (1982). „Szorstkie zestawy”. Międzynarodowy Dziennik Programowania Równoległego . 11 (5): 341–356. doi : 10.1007/BF01001956 . S2CID 9240608 .
  •    Bazan, Jan; Szczuka, Marcin; Wojna, Arkadiusz; Wojnarski, Marcin (2004). O ewolucji systemu eksploracji zbioru przybliżonego . Obrady RSCTC 2004 . Notatki z wykładów z informatyki. Tom. 3066. s. 592–601. CiteSeerX 10.1.1.60.3957 . doi : 10.1007/978-3-540-25929-9_73 . ISBN 978-3-540-22117-3 .
  • Dubois, D.; Prade, H. (1990). „Szorstkie zbiory rozmyte i rozmyte zbiory przybliżone”. Międzynarodowy Dziennik Systemów Ogólnych . 17 (2–3): 191–209. doi : 10.1080/03081079008935107 .
  • Herbert, JP; Yao, JT (2011). „Zestawy przybliżone dla teorii gier” . Podstawy Informatyki . 108 (3–4): 267–286. doi : 10.3233/FI-2011-423 .
  • Greco, Salvatore; Matarazzo, Benedetto; Słowiński, Roman (2001). „Teoria zbiorów przybliżonych do wielokryterialnej analizy decyzji”. Europejski Dziennik Badań Operacyjnych . 129 (1): 1–47. doi : 10.1016/S0377-2217(00)00167-3 .
  • Grzymala-Busse, Jerzy (1997). „Nowa wersja systemu wprowadzania reguł LERS”. Podstawy Informatyki . 31 : 27–39. doi : 10.3233/FI-1997-3113 .
  •   Grzymala-Busse, Jerzy; Grzymala-Busse, Witold (2007). Eksperymentalne porównanie trzech przybliżonych podejść do brakujących wartości atrybutów . Transakcje na zbiorach przybliżonych . Notatki z wykładów z informatyki. Tom. 6. s. 31–50. doi : 10.1007/978-3-540-71200-8_3 . ISBN 978-3-540-71198-8 .
  • Kryszkiewicz, Marzena (1999). „Zasady w systemach niekompletnych”. Nauki informacyjne . 113 (3–4): 271–292. doi : 10.1016/S0020-0255(98)10065-8 .
  • Pawlak, Zdzisław Raport z badań zbiorów przybliżonych PAS 431, Instytut Informatyki Polskiej Akademii Nauk (1981)
  • Pawlak, Zdzisław; Wong, SKM; Ziarko, Wojciech (1988). „Zbiory przybliżone: podejście probabilistyczne a deterministyczne”. International Journal of Man-Machine Studies . 29 : 81–95. doi : 10.1016/S0020-7373(88)80032-4 .
  •   Pawlak, Zdzisław (1991). Zbiory przybliżone: teoretyczne aspekty wnioskowania o danych . Dordrecht: wydawnictwo akademickie Kluwer. ISBN 978-0-7923-1472-1 .
  • Ślęzak, Dominik; Wróblewski, Jakub; Eastwood, Wiktoria; Synak, Piotr (2008). „Brighthouse: hurtownia danych analitycznych do zapytań ad-hoc” (PDF) . Postępowanie fundacji VLDB . 1 (2): 1337–1345. doi : 10.14778/1454159.1454174 .
  • Stefanowski, Jerzy (1998). „O podejściach opartych na zbiorach przybliżonych do indukcji reguł decyzyjnych”. W Polkowskim, Lech; Skowron, Andrzej (red.). Zbiory przybliżone w odkrywaniu wiedzy 1: Metodologia i zastosowania . Heidelberg: Physica-Verlag. s. 500–529.
  •   Stefanowski, Jerzy; Tsoukias, Alexis (2001). „Niepełne tabele informacyjne i zgrubna klasyfikacja” . Inteligencja obliczeniowa . 17 (3): 545–566. doi : 10.1111/0824-7935.00162 . S2CID 22795201 .
  • Wong, SKM; Ziarko, Wojciech; Tak, R. Li (1986). „Porównanie metod zgrubnych i statystycznych w uczeniu się indukcyjnym”. International Journal of Man-Machine Studies . 24 : 53–72. doi : 10.1016/S0020-7373(86)80033-5 .
  • Yao, JT; Yao, YY (2002). „Indukcja reguł klasyfikacji przez obliczenia granularne”. Materiały z trzeciej międzynarodowej konferencji na temat zbiorów przybliżonych i aktualnych trendów w informatyce (TSCTC'02) . Londyn, Wielka Brytania: Springer-Verlag. s. 331–338.
  • Ziarko, Wojciech (1998). „Zbiory przybliżone jako metodologia eksploracji danych”. Zbiory przybliżone w odkrywaniu wiedzy 1: Metodologia i zastosowania . Heidelberg: Physica-Verlag. s. 554–576.
  • Ziarko, Wojciech; Shan, Ning (1995). „Odkrywanie relacji, zależności i reguł atrybutów za pomocą zbiorów przybliżonych”. Materiały z 28. dorocznej Hawajskiej Międzynarodowej Konferencji Nauk Systemowych (HICSS'95) . Hawaje. s. 293–299.
  • Pawlak, Zdzisław (1999). „Reguły decyzyjne, reguła Bayesa i zbiory przybliżone”. Nowy kierunek w zbiorach przybliżonych, eksploracji danych i granularno-miękkich obliczeniach : 1–9.
  • Pawlak, Zdzisław. „Szorstkie relacje, raporty” . 435 . Instytut Informatyki. {{ cite journal }} : Cite journal wymaga |journal= ( pomoc )
  • Orłowska, E. (1987). „Rozumowanie o niejasnych pojęciach”. Biuletyn Polskiej Akademii Nauk . 35 : 643–652.
  • Polkowski, L. (2002). „Zbiory przybliżone: podstawy matematyczne”. Postępy w miękkich komputerach .
  • Skowron, A. (1996). „Szorstkie zestawy i niejasne pojęcia”. Fundamenta Informaticae : 417–431.
  • Burgin M. (1990). Theory of Named Sets as a Foundational Basis for Mathematics, In Structures in matematyczne teorie: Sprawozdania z międzynarodowego sympozjum w San Sebastian, 25–29 września 1990 ( http://www.blogg.org/blog-30140-date-2005- 10-26.html )
  • Burgin, M. (2004). Ujednolicone podstawy matematyki , Preprint Mathematics LO / 0403186, s. 39. (wydanie elektroniczne: https://arxiv.org/ftp/math/papers/0403/0403186.pdf )
  •   Burgin, M. (2011), Theory of Named Sets, Mathematics Research Developments, Nova Science Pub Inc, ISBN 978-1-61122-788-8
  • Cornelis, C., De Cock, M. and Kerre, E. (2003) Intuicjonistyczne rozmyte zbiory przybliżone: na skrzyżowaniu niedoskonałej wiedzy, Expert Systems, 20:5, s. 260–270
  • Düntsch, I. i Gediga, G. (1995) Analiza zależności zbioru przybliżonego w badaniach ewaluacyjnych – zastosowanie w badaniu powtarzających się zawałów serca. University of Ulster, raporty z badań informatycznych nr 10
  • Feng F. (2010). Uogólnione zgrubne zbiory rozmyte oparte na zestawach miękkich, obliczenia miękkie, 14: 9, s. 899–911
  • Grzymala-Busse, J. (1987). Uczenie się na przykładach opartych na przybliżonych multisetach, w Proceedings of the 2nd International Symposium on Methodologies for Intelligent Systems, s. 325–332. Charlotte, Karolina Północna, Stany Zjednoczone
  • Meng, D., Zhang, X. i Qin, K. (2011). Miękkie zgrubne zbiory rozmyte i miękkie rozmyte zbiory zgrubne , Komputery i matematyka z aplikacjami, 62:12, s. 4635–4645
  • Quafafou M. (2000). α-RST: uogólnienie teorii zbiorów przybliżonych, Information Sciences, 124: 1–4, s. 301–316.
  • Quafafou M. i Boussouf M. (2000). Uogólniony wybór cech oparty na zbiorach przybliżonych. Inteligentna analiza danych dziennika, 4: 1 s. 3 – 17
  • Nakamura, A. (1988) Rozmyte zbiory przybliżone, „Uwagi na temat logiki wielowartościowej w Japonii”, 9: 1, s. 1–8
  • Pawlak Z., Grzymała-Busse J., Słowiński R. Ziarko W. (1995). Szorstkie zestawy. Komunikaty ACM, 38:11, s. 88–95
  • Thomas, K. i Nair, L. (2011). Zgrubne intuicjonistyczne zbiory rozmyte w sieci , International Mathematical Forum, 6:27, s. 1327–1335
  • Zhang J., Li T., Chen H. (2014). Złożone zbiory przybliżone do dynamicznej eksploracji danych, Information Sciences, 257, s. 81–100
  • Zhang J., Wong JS, Pan Y, Li T. (2015). Metoda oparta na macierzach równoległych do obliczania przybliżeń w niekompletnych systemach informacyjnych, IEEE Transactions on Knowledge and Data Engineering, 27(2): 326-339
  • Chen H., Li T., Luo C., Horng SJ., Wang G. (2015). Podejście zgrubne oparte na teorii decyzji do eksploracji danych dynamicznych. Transakcje IEEE w systemach rozmytych, 23 (6): 1958-1970
  • Chen H., Li T., Luo C., Horng SJ., Wang G. (2014). Zgrubna metoda oparta na zbiorach do aktualizacji reguł decyzyjnych dotyczących zgrubnego i udoskonalania wartości atrybutów, IEEE Transactions on Knowledge and Data Engineering, 26 (12): 2886-2899
  • Chen H., Li T., Ruan D., Lin J., Hu C, (2013) Zgrubne, przyrostowe podejście do aktualizacji przybliżeń w dynamicznych środowiskach konserwacji. Transakcje IEEE dotyczące wiedzy i inżynierii danych, 25 (2): 274-284

Dalsza lektura

  • Gianpiero Cattaneo i Davide Ciucci, „Heyting Wajsberg Algebras as an Abstract Environment Linking Fuzzy and Rough Sets” w JJ Alpigini i in. (red.): RSCTC 2002, LNAI 2475, s. 77–84, 2002. doi : 10.1007/3-540-45813-1_10

Linki zewnętrzne