Częste wykrywanie wzorców
Częste wykrywanie wzorców (lub wykrywanie FP , eksploracja FP lub eksploracja zestawu częstych elementów ) jest częścią odkrywania wiedzy w bazach danych , masowej analizie online i eksploracji danych ; opisuje zadanie znalezienia najczęstszych i odpowiednich wzorców w dużych zbiorach danych. Koncepcja ta została po raz pierwszy wprowadzona do baz danych transakcji wyszukiwania. Częste wzorce są definiowane jako podzbiory (zestawy elementów, podsekwencje lub podstruktury), które pojawiają się w zbiorze danych z częstotliwością nie mniejszą niż próg określony przez użytkownika lub określony automatycznie.
Techniki
Techniki wydobywania FP obejmują:
- analiza koszyka rynkowego
- marketing krzyżowy
- projekt katalogu
- grupowanie
- Klasyfikacja
- systemy rekomendacji
W przeważającej części wykrywanie FP można przeprowadzić za pomocą uczenia się reguł asocjacyjnych z określonymi algorytmami Eclat , FP-growth i algorytmem Apriori .
Inne strategie obejmują:
i odpowiednie specyficzne techniki.
Implementacje istnieją dla różnych systemów lub modułów uczenia maszynowego, takich jak MLlib dla Apache Spark .