SpamBayes
Oryginalni autorzy | Tima Petersa |
---|---|
Pierwsze wydanie | wrzesień 2002 r |
Wersja stabilna | 1.0.4 / marzec 2005 |
Wersja podglądu | 1.1a6 / 6 grudnia 2008
|
Napisane w | Pyton |
Platforma | Międzyplatformowe |
Dostępne w | Tylko angielski |
Typ | Filtrowanie poczty |
Licencja | PSFL |
Strona internetowa | spambayes.sourceforge.net |
SpamBayes to Bayesowski filtr spamu napisany w Pythonie , który wykorzystuje techniki określone przez Paula Grahama w jego eseju „Plan na spam”. Został on później ulepszony między innymi przez Gary'ego Robinsona i Tima Petersa .
Najbardziej zauważalną różnicą między konwencjonalnym filtrem Bayesa a filtrem używanym przez SpamBayes jest to, że istnieją trzy klasyfikacje zamiast dwóch: spam, niespam (zwany ham w SpamBayes) i niepewny. Użytkownik szkoli wiadomość jako ham lub spam; podczas filtrowania wiadomości filtry spamu generują jeden wynik dla ham, a drugi dla spamu.
Jeśli wynik spamu jest wysoki, a wynik Hama niski, wiadomość zostanie sklasyfikowana jako spam. Jeśli wynik spamu jest niski, a wynik hamowania wysoki, wiadomość zostanie sklasyfikowana jako ham. Jeśli oba wyniki są wysokie lub oba niskie, wiadomość zostanie sklasyfikowana jako niepewna.
Takie podejście prowadzi do niewielkiej liczby wyników fałszywie dodatnich i fałszywie ujemnych , ale może powodować szereg wątpliwości, które wymagają decyzji człowieka.
Filtrowanie sieci
Trochę pracy poświęcono zastosowaniu SpamBayes do filtrowania treści internetowych za pośrednictwem serwera proxy .
Linki zewnętrzne
- Oficjalna strona internetowa
- Oryginalny pomysł Paula Grahama
- Esej omawiający ulepszenia oryginalnego pomysłu Grahama
- Wyjaśnienie, jak działa SpamBayes
- Referat na temat SpamBayes na konferencję na temat poczty elektronicznej i ochrony przed spamem
- Wygrywanie wojny ze spamem: Porównanie Bayesowskich filtrów antyspamowych