martedì 18 marzo 2008

La pagella di Bogofilter

Per controllare lo stato di apprendimento del filtro bayesiano di Bogofilter potete lanciare questo comando da terminale:
bogoutil -H ~/.bogofilter/wordlist.db


Avrete un output simile a questo:

Histogram
score count pct histogram
0.00 87856 95.82 ################################################
0.05 11 0.01 #
0.10 22 0.02 #
0.15 29 0.03 #
0.20 30 0.03 #
0.25 27 0.03 #
0.30 26 0.03 #
0.35 51 0.06 #

0.40 56 0.06 #
0.45 43 0.05 #
0.50 51 0.06 #
0.55 46 0.05 #
0.60 45 0.05 #
0.65 60 0.07 #
0.70 94 0.10 #
0.75 93 0.10 #
0.80 126 0.14 #
0.85 159 0.17 #
0.90 277 0.30 #
0.95 2586 2.82 ##

tot 91688
hapaxes: ham 44440 (48.47%), spam 1679 ( 1.83%)
pure: ham 87847 (95.81%), spam 2002 ( 2.18%)
Di solito i migliori risultati si hanno quando i grafici delle line 0.00 e 0.95 sono simili.

1 commento:

Monitor de LCD ha detto...

Hello. This post is likeable, and your blog is very interesting, congratulations :-). I will add in my blogroll =). If possible gives a last there on my blog, it is about the Monitor de LCD, I hope you enjoy. The address is http://monitor-de-lcd.blogspot.com. A hug.