Weka (uczenie maszynowe)
Deweloperzy | Uniwersytet Waikato |
---|---|
Wersja stabilna | 3.8.6 (stabilna) / 28 stycznia 2022 r
|
Wersja podglądu | 3.9.6 / 28 stycznia 2022 r
|
Magazyn | |
Napisane w | Jawa |
System operacyjny | Windows , macOS , Linux |
Platforma | IA-32 , x86-64 , ARM_architektura ; Java SE |
Typ | Nauczanie maszynowe |
Licencja | Powszechna Licencja Publiczna GNU |
Strona internetowa |
Waikato Environment for Knowledge Analysis ( Weka ), opracowane na Uniwersytecie Waikato w Nowej Zelandii , jest wolnym oprogramowaniem na licencji GNU General Public License oraz oprogramowaniem towarzyszącym książce „Data Mining: Practical Machine Learning Tools and Techniques”.
Opis
Weka zawiera zbiór narzędzi wizualizacyjnych i algorytmów do analizy danych i modelowania predykcyjnego , wraz z graficznymi interfejsami użytkownika ułatwiającymi dostęp do tych funkcji. Oryginalna wersja Weka inna niż Java była interfejsem Tcl / Tk do algorytmów modelowania (głównie innych firm) zaimplementowanych w innych językach programowania, a także narzędziami do wstępnego przetwarzania danych w C i plikiem makefile oparty na systemie do przeprowadzania eksperymentów uczenia maszynowego. Ta oryginalna wersja została zaprojektowana przede wszystkim jako narzędzie do analizy danych z domen rolniczych, ale nowsza wersja w pełni oparta na Javie (Weka 3), której rozwój rozpoczęto w 1997 r., jest obecnie używana w wielu różnych obszarach zastosowań, w szczególności w edukacji celów i badań. Zalety Weki to:
- Bezpłatna dostępność w ramach Powszechnej Licencji Publicznej GNU .
- Przenośność, ponieważ jest w pełni zaimplementowana w języku programowania Java , dzięki czemu działa na prawie każdej nowoczesnej platformie komputerowej.
- Obszerny zbiór technik wstępnego przetwarzania i modelowania danych.
- Łatwość obsługi dzięki graficznym interfejsom użytkownika.
Weka obsługuje kilka standardowych zadań eksploracji danych , w szczególności wstępne przetwarzanie danych, grupowanie , klasyfikację , regresję , wizualizację i wybór funkcji . Oczekuje się, że dane wejściowe do Weka będą sformatowane zgodnie z Attribute-Relational File Format i nazwą pliku z rozszerzeniem .arff. Wszystkie techniki Weka opierają się na założeniu, że dane są dostępne jako jeden płaski plik lub relacja, gdzie każdy punkt danych jest opisany przez ustaloną liczbę atrybutów (zwykle atrybuty liczbowe lub nominalne, ale obsługiwane są również inne typy atrybutów) . Weka zapewnia dostęp do baz danych SQL za pomocą Java Database Connectivity i może przetwarzać wynik zwrócony przez zapytanie do bazy danych. Weka zapewnia dostęp do głębokiego uczenia się Uczenie głębokie 4j . Nie jest w stanie eksplorować danych w wielu relacjach, ale istnieje osobne oprogramowanie do konwersji zbioru połączonych tabel bazy danych w pojedynczą tabelę, która jest odpowiednia do przetwarzania za pomocą Weka. Kolejnym ważnym obszarem, którego obecnie nie obejmują algorytmy zawarte w rozkładzie Weka, jest modelowanie sekwencji.
Pakiety rozszerzeń
W wersji 3.7.2 dodano menedżera pakietów, aby umożliwić łatwiejszą instalację pakietów rozszerzeń. Niektóre funkcje, które były zawarte w Weka przed tą wersją, zostały od tego czasu przeniesione do takich pakietów rozszerzeń, ale ta zmiana ułatwia również innym dodawanie rozszerzeń do Weka i utrzymanie oprogramowania, ponieważ ta modułowa architektura umożliwia niezależne aktualizacje rdzeń Weka i poszczególne rozszerzenia.
Historia
- W 1993 roku Uniwersytet Waikato w Nowej Zelandii rozpoczął prace nad oryginalną wersją Weka, która stała się mieszanką Tcl/Tk, C i makefile.
- W 1997 roku podjęto decyzję o przebudowie Weki od podstaw w Javie, łącznie z implementacją algorytmów modelujących.
- W 2005 roku Weka otrzymała nagrodę SIGKDD Data Mining and Knowledge Discovery Service Award.
- W 2006 roku Pentaho Corporation nabyła wyłączną licencję na używanie Weka do wywiadu gospodarczego . Stanowi element eksploracji danych i analizy predykcyjnej pakietu Business Intelligence Pentaho. Od tego czasu Pentaho zostało przejęte przez Hitachi Vantara, a Weka stanowi teraz podstawę komponentu open source PMI (Plugin for Machine Intelligence).
Powiązane narzędzia
- Auto-WEKA to zautomatyzowany system uczenia maszynowego dla Weka.
- Environment for DeveLoping KDD-Applications Supported by Index-Structures ( ELKI ) to projekt podobny do Weki z naciskiem na analizę skupień , czyli metody nienadzorowane.
- H2O.ai to platforma do nauki danych i uczenia maszynowego typu open source
- KNIME to oprogramowanie do uczenia maszynowego i eksploracji danych zaimplementowane w Javie .
- Massive Online Analysis (MOA) to projekt typu open source do eksploracji strumieni danych na dużą skalę, również opracowany na Uniwersytecie Waikato w Nowej Zelandii .
- Neural Designer to oprogramowanie do eksploracji danych oparte na technikach głębokiego uczenia napisane w C++ .
- Orange to podobny projekt typu open source do eksploracji danych, uczenia maszynowego i wizualizacji oparty na scikit-learn .
- RapidMiner to komercyjna platforma uczenia maszynowego zaimplementowana w Javie , która integruje Weka.
- scikit-learn to popularna biblioteka uczenia maszynowego w Pythonie.
Zobacz też
Linki zewnętrzne
- Oficjalna strona internetowa Uniwersytetu Waikato w Nowej Zelandii