Hideyuki SHIRAI ( 白井秀行 )
shira****@meado*****
2010年 6月 8日 (火) 21:52:36 JST
こんにちは、白井です。 まずは報告です。ひとつイレギュラーな処理をしないといけないところ を見つけました。 "愛知県","豊橋市","岩田町居村、北郷中" は、下記のように "岩田町居村", "岩田町北郷中" としないとだめな模 様です。 4400032 #CNS 愛知県豊橋市岩田町居村 4400032 #CNS 愛知県豊橋市岩田町北郷中 調べたところ、 4400032 "岩田町居村" "北郷中" 4400041 "岩田町宮下" "道合" 4400833 "飯村町西山" "高山" (全部 愛知県豊橋市!!)が該当しました。う〜〜ん、どんどんコード が汚くなっていく。。。 あとは、徒然に。 From: Jun Oizumi <vagus****@gmail*****> さん曰く Subject: [Anthy-dev 3761] Re: 郵便番号のデータ Message-ID: <AANLkTinCdzwP8eqCWaWM_XXCiTcAYBo7T_x7azL****@mail*****> Date: Tue, 8 Jun 2010 00:53:32 +0900 > [大口事業所個別番号データの説明] > http://www.post.japanpost.jp/zipcode/dl/jigyosyo/readme.html >> 3. JISの第1・第2水準以外の漢字については類字または仮名を使用しています。 > > と書いてあるので、本来は郵便事業会社に「ウソつき!!」って言うべきなんでしょうが、 > そもそも需要があるのか疑問だったので、私は「面倒だし、なくていいだろう」と (^^; ま、こっちは後回しかな。まずは、ken_all.csv ですね。 > 「make skk; make anthy; make canna」みたいにできるような感じで。 > そうすれば、anthy でファイル形式を変えた場合でも、「古いのは "make anthy-old"、新形式の > は "make anthy"」みたいな感じに Makefile を書き換えるだけで、一つのソースパッケージで > 対応できるんじゃないかなぁ、と。 ;; せっかくやるならそこまで狙いましょうよ :-) > 残念ながら、elisp で書かれてるようなので、私には読めませんが。 > > # 尤も、SKK-JISYO.zipcode のタイムスタンプが 2010/1/23 で、 > # 元データのファイル名が "ken_all.csv" と小文字になってるところをみると、 > # 最近はメンテされてない? ken_all.lzh を unix 上で lha コマンドで展開すると ken_all.csv に なるようです。Windows 的なアーカイバで展開すると KEN_ALL.CSV で すが、なんでかわからないです。ちなみに、elisp は大抵の人よりは読 めると思っているので読んでみましたが、ぼくと似たようなことをやっ ている模様です。ただし、ぼくのはスパゲティコード化しているので、 まだ人には見せられません ^^; もうしばらくお待ちを。 > # ただ、SKK のにもちょっと問題があって、「新宿エルタワー(1階)」みたいな場合に、 > # "(" ")" を取って単純にビル名とくっつけているので、「東池袋サンシャイン60(1階)」 > # が「東池袋サンシャイン601階」となってしまってるのが、ちょっと頂けない。 > # これがあるために、私は "(" ")" を残すようにしたので。 ぼくも サンシャイン601階 ってやっていました ^^;;; 多謝です。 個人的は『サンシャイン60 1階』ってスペースを入れるのが良いと思う のですが、zipcode.t だと全角スペースじゃないと NG なのがちょっと なぁ。この時だけ () を残すかな。 一行一エントリかセパレータを変えてスペースも一つの候補内で使える ようにした方がよいかもしれません。 -- 白井秀行 (mailto:shira****@meado*****) P.S. > さすがというか何と言うか、SKK が凄いです。 > "()" 内もできるだけ展開して、京都の通り名の対応までしてます。 > 私からすると、「そこまでやるか」という感じです。 ちなみにぼくのも京都はそこまでやっています(自慢)