yusuk****@cheru*****
yusuk****@cheru*****
2004年 7月 4日 (日) 01:18:18 JST
田畑です。 anthy-5500をリリースしました。 http://prdownloads.sourceforge.jp/anthy/10139/anthy-5500.tar.gz anthy-5100と目立った違いはありません。 (1)rubyanthyをテスト用のディレクトリに同梱して、 splitterの性能を部分的に測定できるようにしたこと。 (2)それによって、統語解析もどきが性能に貢献せず、むしろ 性能が悪化していることが判明したので無効化したこと。 (src-splitter/syntactic.cを見てください。今後の作業を このフェーズの悪影響を修正する方向で行うのか、もしくは別の 機構を導入して行うのかは未定です。) (3)内部文字コードUTF-8にしてコンパイルしてもそれなりに動くように なった。 (4)微妙な修正、付属語グラフの追加を行った。 (4)が一番効いていると思いますが、mlや2chの指摘、提案の一部は反映 できてませんので、今からのリリースで作業していきたいと思います。 (2)のチェックは $ cd anthy/test $ sh test.sh -compile $ sh test.sh で実行できて、最後に 93tests, 75hits, 18 misses 80% のように結果が表示されます。このテスト機構の質と機能を 充実させていくのも今後の課題です。 -- CHAOS AND CHANCE! Yusuke TABATA (yusuk****@cheru*****)