[Anthy-dev 3763] Re: 郵便番号のデータ

Back to archive index

Hideyuki SHIRAI ( 白井秀行 ) shira****@meado*****
2010年 6月 8日 (火) 21:52:36 JST


こんにちは、白井です。

まずは報告です。ひとつイレギュラーな処理をしないといけないところ
を見つけました。

"愛知県","豊橋市","岩田町居村、北郷中"

は、下記のように "岩田町居村", "岩田町北郷中" としないとだめな模
様です。

4400032 #CNS 愛知県豊橋市岩田町居村
4400032 #CNS 愛知県豊橋市岩田町北郷中

調べたところ、

4400032 "岩田町居村" "北郷中"
4400041 "岩田町宮下" "道合"
4400833 "飯村町西山" "高山"

(全部 愛知県豊橋市!!)が該当しました。う〜〜ん、どんどんコード
が汚くなっていく。。。


あとは、徒然に。

From: Jun Oizumi <vagus****@gmail*****> さん曰く
Subject: [Anthy-dev 3761] Re: 郵便番号のデータ
Message-ID: <AANLkTinCdzwP8eqCWaWM_XXCiTcAYBo7T_x7azL****@mail*****>
Date: Tue, 8 Jun 2010 00:53:32 +0900

> [大口事業所個別番号データの説明]
> http://www.post.japanpost.jp/zipcode/dl/jigyosyo/readme.html
>> 3. JISの第1・第2水準以外の漢字については類字または仮名を使用しています。
> 
> と書いてあるので、本来は郵便事業会社に「ウソつき!!」って言うべきなんでしょうが、
> そもそも需要があるのか疑問だったので、私は「面倒だし、なくていいだろう」と (^^;

ま、こっちは後回しかな。まずは、ken_all.csv ですね。

> 「make skk; make anthy; make canna」みたいにできるような感じで。
> そうすれば、anthy でファイル形式を変えた場合でも、「古いのは "make anthy-old"、新形式の
> は "make anthy"」みたいな感じに Makefile を書き換えるだけで、一つのソースパッケージで
> 対応できるんじゃないかなぁ、と。

;; せっかくやるならそこまで狙いましょうよ :-)

> 残念ながら、elisp で書かれてるようなので、私には読めませんが。
> 
> # 尤も、SKK-JISYO.zipcode のタイムスタンプが 2010/1/23 で、
> # 元データのファイル名が "ken_all.csv" と小文字になってるところをみると、
> # 最近はメンテされてない?

ken_all.lzh を unix 上で lha コマンドで展開すると ken_all.csv に
なるようです。Windows 的なアーカイバで展開すると KEN_ALL.CSV で
すが、なんでかわからないです。ちなみに、elisp は大抵の人よりは読
めると思っているので読んでみましたが、ぼくと似たようなことをやっ
ている模様です。ただし、ぼくのはスパゲティコード化しているので、
まだ人には見せられません ^^; もうしばらくお待ちを。

> # ただ、SKK のにもちょっと問題があって、「新宿エルタワー(1階)」みたいな場合に、
> # "(" ")" を取って単純にビル名とくっつけているので、「東池袋サンシャイン60(1階)」
> # が「東池袋サンシャイン601階」となってしまってるのが、ちょっと頂けない。
> # これがあるために、私は "(" ")" を残すようにしたので。

ぼくも サンシャイン601階 ってやっていました ^^;;; 多謝です。

個人的は『サンシャイン60 1階』ってスペースを入れるのが良いと思う
のですが、zipcode.t だと全角スペースじゃないと NG なのがちょっと
なぁ。この時だけ () を残すかな。

一行一エントリかセパレータを変えてスペースも一つの候補内で使える
ようにした方がよいかもしれません。

-- 
白井秀行 (mailto:shira****@meado*****)

P.S.

> さすがというか何と言うか、SKK が凄いです。
> "()" 内もできるだけ展開して、京都の通り名の対応までしてます。
> 私からすると、「そこまでやるか」という感じです。

ちなみにぼくのも京都はそこまでやっています(自慢)




Anthy-dev メーリングリストの案内
Back to archive index