SpamBayes

SpamBayes
Oryginalni autorzy	Tima Petersa
Pierwsze wydanie	wrzesień 2002 r
Wersja stabilna	1.0.4 / marzec 2005
Wersja podglądu	1.1a6 / 6 grudnia 2008
Napisane w	Pyton
Platforma	Międzyplatformowe
Dostępne w	Tylko angielski
Typ	Filtrowanie poczty
Licencja	PSFL
Strona internetowa	spambayes.sourceforge.net

SpamBayes to Bayesowski filtr spamu napisany w Pythonie , który wykorzystuje techniki określone przez Paula Grahama w jego eseju „Plan na spam”. Został on później ulepszony między innymi przez Gary'ego Robinsona i Tima Petersa .

Najbardziej zauważalną różnicą między konwencjonalnym filtrem Bayesa a filtrem używanym przez SpamBayes jest to, że istnieją trzy klasyfikacje zamiast dwóch: spam, niespam (zwany ham w SpamBayes) i niepewny. Użytkownik szkoli wiadomość jako ham lub spam; podczas filtrowania wiadomości filtry spamu generują jeden wynik dla ham, a drugi dla spamu.

Jeśli wynik spamu jest wysoki, a wynik Hama niski, wiadomość zostanie sklasyfikowana jako spam. Jeśli wynik spamu jest niski, a wynik hamowania wysoki, wiadomość zostanie sklasyfikowana jako ham. Jeśli oba wyniki są wysokie lub oba niskie, wiadomość zostanie sklasyfikowana jako niepewna.

Takie podejście prowadzi do niewielkiej liczby wyników fałszywie dodatnich i fałszywie ujemnych , ale może powodować szereg wątpliwości, które wymagają decyzji człowieka.

Filtrowanie sieci

Trochę pracy poświęcono zastosowaniu SpamBayes do filtrowania treści internetowych za pośrednictwem serwera proxy .

Linki zewnętrzne