住所文字列の分解

大量の住所データを扱う必要があり、どのようにすればよいかを調べてみた。

入力された住所の分解について

mecabという日本語の形態素解析器を使う方法
http://d.hatena.ne.jp/pcmaster/20100211/p2
正規表現でがんばってみる
http://www.rottel.net/kuwa/83562

日本の住所について
xx丁目 ぐらいまで入っているものがあればよいのだが、フリーなも
のはどうしても見つからない。
郵便番号のデータでよければ下記にある。
http://www.post.japanpost.jp/zipcode/download.html

ちなみに、駅のデータは下記のようなものがある。
日本全国の駅データが網羅されており、乗り入れている路線などもすべて分かる。
http://www.ekidata.jp/index.html

タイトルとURLをコピーしました