To standardize Japanese addresses by separating them into sets of prefecture, city, town, and additional details
Project description
This is to standardize Japanese addresses by separating them into sets of prefecture, city, town, and additional details, based on Geolonia's TypeScript library (https://github.com/geolonia/normalize-japanese-addresses). It is currently still in the early stage and does not behave exactly the same as Geolonia's original library (fails in 7.1% of tests).
Geolonia様のオープンソースの住所正規化ライブラリ( https://github.com/geolonia/normalize-japanese-addresses )をPythonに移植したものです。 現在まだ試作段階であり、Geolonia様のもとのライブラリと完全に同じ動作にはなっていません(テストのうち7.1%で失敗)。
インストール方法
- Windows環境の場合は、インストールの前に環境変数を設定してください
set PYTHONUTF8=1
pip install --upgrade normalize_japanese_address
使い方
from normalize_japanese_address.normalize import normalize
result = normalize('大阪府堺市北区新金岡町4丁1−8')
print(result)
とすると、resultに
{'pref': '大阪府', 'city': '堺市北区', 'town': '新金岡町四丁', 'address': '1-8', 'level': 3}
を返します。levelは、住所文字列のどこまでを判別できたかを以下の数値で示しています。
0
- 都道府県も判別できなかった。1
- 都道府県まで判別できた。2
- 市区町村まで判別できた。3
- 町丁目まで判別できた。
ライブラリの名称
- normalize-japanese-addressesではなく、normalize_japanese_address という名称になっています。ハイフンがアンダーバーになっているほか、addressが単数になっているのに深い意味はありません。
メンテナンス
- https://github.com/geolonia/japanese-addresses/tree/develop/api が更新された場合、それに対応している japanese_address/api 以下を新しいものに差し替えれることで更新できます。
ライセンス、利用規約
- 本プログラムは、下記のプログラムをもとに開発されています。住所データのライセンスは CC BY 4.0、それ以外はMITとされており、本プログラムもそれに従います。
https://github.com/geolonia/normalize-japanese-addresses https://github.com/geolonia/japanese-addresses
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for normalize_japanese_address-0.0.12.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | 4759832341713dc6e04af6ffdb428bccbf26e00bf03a15db6e41d0be8373af9e |
|
MD5 | 770eab138c1a4c8a537597bb874f569a |
|
BLAKE2b-256 | 30edd0fb97f71d2a429848a1086f0db87fc771c21d9972a0de4f7ed28d64ece8 |
Hashes for normalize_japanese_address-0.0.12-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | f38dfeba021fe2545157ea840ddee74ba5f3d22aa85f5cf3abc3ca81578a4b0d |
|
MD5 | ee2f55f005aa084aebbd469ca2c99c56 |
|
BLAKE2b-256 | 39e437a3a99e27dcba5387dfbfbc314ce038023e5fe2d90c6bdbb1d5c9d2f08d |