yusuk****@cheru*****
yusuk****@cheru*****
2003年 7月 15日 (火) 00:42:43 JST
田畑です。 昨日anthy-4313をリリースしました。 変更の一点目は 「1234567」のような文字列から「1,234,567」のような コンマ区切りの文字列が候補として出てくるようにしたこと。 漢数字を16桁まで生成できるようにして 「千二百三十四兆五千六百七十八億九千十二万三千四百五十六」のような 候補が出せるようになったことです。 もう一点は文節の「接頭辞+自立語+接尾辞+付属語」という要素 (struct word_list , src-splitter/word_list.c)を配列に 入れるようにした点で、これによって接尾辞が二つあるような複雑な 構造の文節を処理しやすくなると思っています。 今後数週間は、辞書フォーマットの標準化プロジェクト ( http://ukai.org/wiliki/wiliki.cgi?%bc%ad%bd%f1%b6%a6%c4%cc%b2%bd&l=jp ) というものを各方面の関係者と始めたので、この関係の調査や作文をすることと、 だいぶ以前に依頼された某誌の原稿を書くのに時間をかけるつもりです。 変換エンジンの開発は減速すると思いますが、どちらも今後の開発にとって 重要なのでしっかりとやっていこうと思います。 -- CHAOS AND CHANCE! Yusuke TABATA (yusuk****@cheru*****)