SpamBayes

SpamBayes
Oryginalni autorzy Tima Petersa
Pierwsze wydanie wrzesień 2002 r
Wersja stabilna
1.0.4 / marzec 2005
Wersja podglądu
1.1a6 / 6 grudnia 2008 ( 06.12.2008 )
Napisane w Pyton
Platforma Międzyplatformowe
Dostępne w Tylko angielski
Typ Filtrowanie poczty
Licencja PSFL
Strona internetowa spambayes.sourceforge.net

SpamBayes to Bayesowski filtr spamu napisany w Pythonie , który wykorzystuje techniki określone przez Paula Grahama w jego eseju „Plan na spam”. Został on później ulepszony między innymi przez Gary'ego Robinsona i Tima Petersa .

Najbardziej zauważalną różnicą między konwencjonalnym filtrem Bayesa a filtrem używanym przez SpamBayes jest to, że istnieją trzy klasyfikacje zamiast dwóch: spam, niespam (zwany ham w SpamBayes) i niepewny. Użytkownik szkoli wiadomość jako ham lub spam; podczas filtrowania wiadomości filtry spamu generują jeden wynik dla ham, a drugi dla spamu.

Jeśli wynik spamu jest wysoki, a wynik Hama niski, wiadomość zostanie sklasyfikowana jako spam. Jeśli wynik spamu jest niski, a wynik hamowania wysoki, wiadomość zostanie sklasyfikowana jako ham. Jeśli oba wyniki są wysokie lub oba niskie, wiadomość zostanie sklasyfikowana jako niepewna.

Takie podejście prowadzi do niewielkiej liczby wyników fałszywie dodatnich i fałszywie ujemnych , ale może powodować szereg wątpliwości, które wymagają decyzji człowieka.

Filtrowanie sieci

Trochę pracy poświęcono zastosowaniu SpamBayes do filtrowania treści internetowych za pośrednictwem serwera proxy .

Linki zewnętrzne