郵便番号データは自分で加工しない
結論を先に。
- 細かい要件がない場合,zipcloud さんの提供している加工済データを使う (日本郵便さんの提供している原本ではなく)
- ライセンスが不明だけど Web API の利用規約とかみると商用利用等も OK と思われる
- わりきって Web API を使う (よそにまかせる) というのも手かも
- いろいろあるし。前述の zipcloud さん自身も検索 API を提供している。
以下各論。
- いわゆる ken_all.csv を (必要フィールドだけ) そのままデータベースにつっこむなんてのは (わかってやってる場合はともかく) やってはいけない
- 複数行に分割されているレコードがあるため,マージする必要がある
- 明文化されていない仕様などがありマージやクリーニングを自力でおこなうのは大変 (バッドノウハウのかたまり)
- さまざまなバッドノウハウを適用済の「きれいなデータ*1」を zipcloud さんが提供している
- しかも Web API やメールによる更新通知サービスも提供なさっている
- ただし,「郵便番号から住所を検索するサービスにまともなものがない - ぐるぐる~」の要望に完全に沿ったデータというわけではない
- 地番や丁目を括弧内で「〜」等表記してある場合などはその部分を削除してある
- 同一郵便番号で複数の町域名が対応する場合,複数レコードに分解してある (郵便番号ユニークではない)
- 事業所の個別郵便番号*2についてはマージされていない
- 仕様があわない場合は自力でがんばる必要がある
- 地名→郵便番号変換したいときとか,GIS 情報をからめたいときとかも
- 自力でがんばるとき参考になるサイト
- ろっきーさんの関連記事 (郵便番号検索 – my-hobby カテゴリ)
- あと再掲だけど 郵便番号から住所を検索するサービスにまともなものがない - ぐるぐる~