2007-12-26

spamフィルタを変えてみた

wanderlustに移行して少したったけど、やっぱりspamassassinのspam判定の遅さには耐えられない。ということで、spamassassinを捨ててbogofilterに乗り換えてみた。幸い、MacPortsにはbogofilterのパッケージがあるので苦労せずにインストールまではできた。

で、困ったのはbogofilterの学習時にkakasiとnkfを使うべきかどうかということ。ググってみたら、使う人と使わない人が半々くらい。むぅぅぅ。wlのコードを読んでみると、kakasiとnkfはbogofilterを起動しているときに使っていないぽい。というわけで、kakasiとnkfは使わずに学習させてみた。学習はこんな感じ。


spamメールの学習(spamメールを保存しているディレクトリで)
for i in *; do
bogofilter -s $i
done



non-spamメールの学習(どこか適当なディレクトリ)
for i in *; do
bogofilter -n $i
done


bogofilterに-vオプションを付けると処理中のメッセージを出力するけど、今回はなし。

一応、spamとhamの学習後に試験してみたけど、ちゃんと判別している。

wanderlustでbogofilterを使うためにはspamassassinで使っていた設定をコメントアウトして、以下の設定を付け加えればいい。


(setq elmo-spam-scheme 'bogofilter)
(setq wl-spam-auto-check-folder-regexp-list '("\\+inbox")
(setq elmo-spam-bogofilter-debug 't)


elmo-spam-bogofilter-debugをnon-nilにしているのは、しばらくデバッグメッセージで様子を見たいから。本格的に使うときは当然、nilにする。

年末年始休暇明けのメールチェックでどれだけ早く処理できるかちょっと楽しみ。

2007-12-14

記憶にないけど、ある

久しぶりにMacPortsのメンテナンスで、必要なパッケージをアップグレードしようとしたら、gtk2のアップグレードでこけた。ていうか、gtk2の依存関係に新しくgtk-docが追加されて、このgtk-docのconfigureスクリプトが走っている箇所でエラーを吐いているみたい。以下がエラー内容の抜粋。


checking for xsltproc... /opt/local/bin/xsltproc
checking for XML catalog (/opt/local/etc/xml/catalog)... found
checking for xmlcatalog... /opt/local/bin/xmlcatalog
checking for DocBook XML DTD V4.1.2 in XML catalog... found
checking for DocBook XSL Stylesheets in XML catalog... not found
configure: error: could not find DocBook XSL Stylesheets in XML catalog


どうやら、docbook-xslで提供しているカタログファイルを見つけられていないみたい。docbook-xslはいろんなパッケージの依存関係に入っているので確実にインストールしているはず。だけど、/opt/local/etc/xml/catalogにdocbook-xslのカタログファイルが記述されていないみたい。しかたないので、以下のようにdocbook-xslのカタログファイルの記述を追加した。


--- catalog.back.20071214 2007-10-25 19:04:11.000000000 +0900
+++ catalog 2007-12-14 20:34:35.000000000 +0900
@@ -10,4 +10,5 @@
<nextCatalog catalog="/opt/local/share/xml/docbook/4.3/catalog.xml" />
<nextCatalog catalog="/opt/local/share/xml/docbook/4.4/catalog.xml" />
<nextCatalog catalog="/opt/local/share/xml/docbook/4.5/catalog.xml" />
+<nextCatalog catalog="/opt/local/share/xsl/docbook-xsl/catalog.xml" />
</catalog>

ここまでだったら、docbook-xslのパッケージが腐ってるんじゃねーのという話なんだけど、実は心当たりがあったりする。少し前にアップデートの時にdocbook関係でハマったので、片っ端からxmlcatmgrでremoveした記憶がある。試しにコマンドのヒストリーファイルを検索したら、2007年10月25日 19時04分11秒に該当箇所を消しちゃっている。

ということで、きちんと調べてからファイルの操作をしないと痛いメにあうという話でした。