Zestaw narzędzi do wyboru funkcji
Deweloperzy | UTIA , Czeska Akademia Nauk |
---|---|
Wersja stabilna | 3.1.1 / 9 września 2012
|
Napisane w | C++ |
System operacyjny | Wieloplatformowy (v3) |
Typ | Uczenie maszynowe , rozpoznawanie wzorców |
Licencja | Darmowy do użytku niekomercyjnego |
Strona internetowa |
Feature Selection Toolbox (FST) to oprogramowanie służące przede wszystkim do selekcji funkcji w domenie uczenia maszynowego , napisane w języku C++ , opracowane w Instytucie Teorii Informacji i Automatyzacji (UTIA) Czeskiej Akademii Nauk .
Wersja 1
Pierwsza generacja Feature Selection Toolbox (FST1) była aplikacją systemu Windows z interfejsem użytkownika umożliwiającym użytkownikom zastosowanie kilku nieoptymalnych, optymalnych i opartych na mieszance metod wyboru funkcji w danych przechowywanych w trywialnym, zastrzeżonym, tekstowym formacie pliku płaskiego.
Wersja 3
Trzecia generacja Feature Selection Toolbox (FST3) była biblioteką bez interfejsu użytkownika, napisaną tak, aby była bardziej wydajna i wszechstronna niż oryginalny FST1.
FST3 obsługuje kilka standardowych zadań eksploracji danych , a dokładniej wstępne przetwarzanie i klasyfikację danych , ale jego główny nacisk kładziony jest na wybór funkcji . W kontekście selekcji cech implementuje kilka powszechnych i mniej typowych technik, ze szczególnym naciskiem na wielowątkową implementację różnych sekwencyjnych metod wyszukiwania (forma wspinaczki górskiej ). Zaimplementowane metody obejmują indywidualny ranking cech, przeszukiwanie zmiennoprzecinkowe, przeszukiwanie oscylacyjne (odpowiednie dla problemów bardzo wielowymiarowych) w postaci losowej lub deterministycznej, metody optymalne typu rozgałęzionego i związanego , probabilistyczne kryteria odległości klas, różne estymatory dokładności klasyfikatorów, optymalizacja wielkości podzbioru cech, wybór cech z zadanymi wagami cech, zespoły kryteriów, metody hybrydowe, wykrywanie wszystkich równoważnych rozwiązań czy optymalizacja dwukryterialna. FST3 jest bardziej wyspecjalizowany niż popularne oprogramowanie, takie jak Waikato Environment for Knowledge Analysis Weka , RapidMiner czy PRTools.
Domyślnie techniki zaimplementowane w zestawie narzędzi opierają się na założeniu, że dane są dostępne jako pojedynczy płaski plik w prostym zastrzeżonym formacie lub w formacie ARFF Weka, gdzie każdy punkt danych jest opisany przez stałą liczbę atrybutów numerycznych. FST3 jest dostarczany bez interfejsu użytkownika i jest przeznaczony do użytku przez użytkowników zaznajomionych zarówno z uczeniem maszynowym , jak i programowaniem w C++ . Starsze oprogramowanie FST1 jest bardziej odpowiednie do prostych eksperymentów lub celów edukacyjnych, ponieważ można go używać bez konieczności pisania kodu w C++.
Historia
- W 1999 r. w UTIA rozpoczęto opracowywanie pierwszej wersji Feature Selection Toolbox w ramach pracy doktorskiej. Pierwotnie został opracowany w środowisku Optima ++ (później przemianowanym na Power ++) RAD C ++.
- W 2002 roku rozwój pierwszej generacji FST został wstrzymany, głównie z powodu zakończenia wsparcia przez Sybase dla używanego wówczas środowiska programistycznego.
- W latach 2002–2008 jądro FST zostało przekodowane i użyte do eksperymentów badawczych wyłącznie w ramach UTIA.
- W 2009 roku rozpoczęło się ponowne kodowanie jądra 3rd FST.
- W 2010 roku FST3 został udostępniony publicznie w postaci biblioteki C++ bez GUI. Towarzysząca strona internetowa zawiera łącza związane z wyborem funkcji, referencje, dokumentację oraz oryginalny FST1 dostępny do pobrania.
- W 2011 roku aktualizacja FST3 do wersji 3.1 obejmowała nowe metody (w szczególności nowatorski ranking funkcji uwzględniający zależności, odpowiedni dla problemów z rozpoznawaniem bardzo dużych wymiarów) oraz ulepszenia podstawowego kodu.
Zobacz też
- Wybór funkcji
- Rozpoznawanie wzorców
- Nauczanie maszynowe
- Eksploracja danych
- OpenNN , otwarta biblioteka sieci neuronowych do analiz predykcyjnych
- Weka , wszechstronne i popularne oprogramowanie typu open source Java z University of Waikato
- RapidMiner , dawniej Yet Another Learning Environment (YALE), komercyjna platforma uczenia maszynowego
- PRTools z Delft University of Technology
- Infosel++ specjalizuje się w selekcji funkcji w oparciu o teorię informacji
- Diagnozuj zestaw narzędzi do rozpoznawania wzorców C++
- Lista oprogramowania do analizy numerycznej