Weka (uczenie maszynowe)

Weka
Deweloperzy Uniwersytet Waikato
Wersja stabilna
3.8.6 (stabilna) / 28 stycznia 2022 r .; 13 miesięcy temu ( 2022-01-28 )
Wersja podglądu
3.9.6 / 28 stycznia 2022 r . ; 13 miesięcy temu ( 2022-01-28 )
Magazyn
Napisane w Jawa
System operacyjny Windows , macOS , Linux
Platforma IA-32 , x86-64 , ARM_architektura ; Java SE
Typ Nauczanie maszynowe
Licencja Powszechna Licencja Publiczna GNU
Strona internetowa www .cs .waikato .ac .nz /~ml /weka

Waikato Environment for Knowledge Analysis ( Weka ), opracowane na Uniwersytecie Waikato w Nowej Zelandii , jest wolnym oprogramowaniem na licencji GNU General Public License oraz oprogramowaniem towarzyszącym książce „Data Mining: Practical Machine Learning Tools and Techniques”.

Opis

Weka zawiera zbiór narzędzi wizualizacyjnych i algorytmów do analizy danych i modelowania predykcyjnego , wraz z graficznymi interfejsami użytkownika ułatwiającymi dostęp do tych funkcji. Oryginalna wersja Weka inna niż Java była interfejsem Tcl / Tk do algorytmów modelowania (głównie innych firm) zaimplementowanych w innych językach programowania, a także narzędziami do wstępnego przetwarzania danych w C i plikiem makefile oparty na systemie do przeprowadzania eksperymentów uczenia maszynowego. Ta oryginalna wersja została zaprojektowana przede wszystkim jako narzędzie do analizy danych z domen rolniczych, ale nowsza wersja w pełni oparta na Javie (Weka 3), której rozwój rozpoczęto w 1997 r., jest obecnie używana w wielu różnych obszarach zastosowań, w szczególności w edukacji celów i badań. Zalety Weki to:

  • Bezpłatna dostępność w ramach Powszechnej Licencji Publicznej GNU .
  • Przenośność, ponieważ jest w pełni zaimplementowana w języku programowania Java , dzięki czemu działa na prawie każdej nowoczesnej platformie komputerowej.
  • Obszerny zbiór technik wstępnego przetwarzania i modelowania danych.
  • Łatwość obsługi dzięki graficznym interfejsom użytkownika.

Weka obsługuje kilka standardowych zadań eksploracji danych , w szczególności wstępne przetwarzanie danych, grupowanie , klasyfikację , regresję , wizualizację i wybór funkcji . Oczekuje się, że dane wejściowe do Weka będą sformatowane zgodnie z Attribute-Relational File Format i nazwą pliku z rozszerzeniem .arff. Wszystkie techniki Weka opierają się na założeniu, że dane są dostępne jako jeden płaski plik lub relacja, gdzie każdy punkt danych jest opisany przez ustaloną liczbę atrybutów (zwykle atrybuty liczbowe lub nominalne, ale obsługiwane są również inne typy atrybutów) . Weka zapewnia dostęp do baz danych SQL za pomocą Java Database Connectivity i może przetwarzać wynik zwrócony przez zapytanie do bazy danych. Weka zapewnia dostęp do głębokiego uczenia się Uczenie głębokie 4j . Nie jest w stanie eksplorować danych w wielu relacjach, ale istnieje osobne oprogramowanie do konwersji zbioru połączonych tabel bazy danych w pojedynczą tabelę, która jest odpowiednia do przetwarzania za pomocą Weka. Kolejnym ważnym obszarem, którego obecnie nie obejmują algorytmy zawarte w rozkładzie Weka, jest modelowanie sekwencji.

Pakiety rozszerzeń

W wersji 3.7.2 dodano menedżera pakietów, aby umożliwić łatwiejszą instalację pakietów rozszerzeń. Niektóre funkcje, które były zawarte w Weka przed tą wersją, zostały od tego czasu przeniesione do takich pakietów rozszerzeń, ale ta zmiana ułatwia również innym dodawanie rozszerzeń do Weka i utrzymanie oprogramowania, ponieważ ta modułowa architektura umożliwia niezależne aktualizacje rdzeń Weka i poszczególne rozszerzenia.

Historia

  • W 1993 roku Uniwersytet Waikato w Nowej Zelandii rozpoczął prace nad oryginalną wersją Weka, która stała się mieszanką Tcl/Tk, C i makefile.
  • W 1997 roku podjęto decyzję o przebudowie Weki od podstaw w Javie, łącznie z implementacją algorytmów modelujących.
  • W 2005 roku Weka otrzymała nagrodę SIGKDD Data Mining and Knowledge Discovery Service Award.
  • W 2006 roku Pentaho Corporation nabyła wyłączną licencję na używanie Weka do wywiadu gospodarczego . Stanowi element eksploracji danych i analizy predykcyjnej pakietu Business Intelligence Pentaho. Od tego czasu Pentaho zostało przejęte przez Hitachi Vantara, a Weka stanowi teraz podstawę komponentu open source PMI (Plugin for Machine Intelligence).

Powiązane narzędzia

Zobacz też

Linki zewnętrzne