GIS package for Apache Spark
Project description
SparkPlus
Spark+는 H3, 위/경도 좌표 등의 공간 정보를 국내 주소체계(신주소/구주소)와 함께 처리할 수 있도록 지원하는 Package입니다.
Setup
- Spark+는 PyPI에 배포되어 있으며, 다음 커맨드로 설치할 수 있습니다.
$ pip install sparkplus
- 설치 후에 import하여 사용할 수 있습니다.
from sparkplus.core import CoordDataFrame, RoadnameDataFrame, NumAddrDataFrame
Class
CoordDataFrame
위치 좌표를 포함하는 데이터프레임을 주소체계 데이터베이스와 연동하여 pnu코드, h3, 우편번호, 법정동코드, 도로명주소(시도/시군구/읍면동/법정리/도로명/지하여부/건물 본번/건물 부번), 도로명주소(전체), 지번주소(시도/시군구/읍면동/법정리/지번 본번/지번 분번) 등의 컬럼을 추가합니다.
coord_df = CoordDataFrame(source_df, geo_df, table_df, x_colname, y_colname)
위도 | 경도 | PNU | manage_number | roadname_code | zipcode | sido | sigungu | eupmyeondong | bupjungli | roadname | is_basement | building_primary_number | building_secondary_number | jibun_primary_number | jibun_secondary_number | bupjungdong_code |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
35.86341579 | 128.6024286 | 2711010600101990000 | 27110106001000300... | 271103007017 | 41940 | 대구광역시 | 중구 | 삼덕동2가 | 공평로 | 0 | 46 | 0 | 3 | 4 | 2711010600 | |
35.86516734 | 128.6105401 | 2711010700103790000 | 27110107001003100... | 271104223055 | 41945 | 대구광역시 | 중구 | 삼덕동3가 | 달구벌대로443길 | 0 | 62 | 16 | 31 | 2 | 2711010700 | |
35.86927185 | 128.5937782 | 2711011700101200003 | 27110115001008500... | 271102007001 | 41909 | 대구광역시 | 중구 | 남일동 | 중앙대로 | 1 | 424 | 0 | 143 | 1 | 2711011700 |
RoadnameDataFrame
비정형 도로명주소를 포함하는 데이터프레임을 주소체계 데이터베이스와 연동하여 분석 및 시각화할 수 있는 형태로 전처리한 시도, 시군구, 읍면동, 도로명, 건물 본번, 법정동코드 등의 컬럼을 추가합니다.
roadname_df = RoadnameDataFrame(source_df)
target | sido | sigungu | roadname | building_primary_number | bupjungdong_code |
---|---|---|---|---|---|
경기도 안산시 단원구 해봉로 137 | 경기도 | 안산시 단원구 | 해봉로 | 137 | 4128112400 |
경기도 수원시 장안구 경수대로 1079 | 경기도 | 수원시 장안구 | 경수대로 | 1079 | 4128111800 |
경기도 안산시 상록구 양달말길 93-7 | 경기도 | 안산시 상록구 | 양달말길 | 93 | 4128101100 |
LICENSE
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distributions
No source distribution files available for this release.See tutorial on generating distribution archives.
Built Distribution
sparkplus-1.3.0-py3-none-any.whl
(35.8 kB
view details)
File details
Details for the file sparkplus-1.3.0-py3-none-any.whl
.
File metadata
- Download URL: sparkplus-1.3.0-py3-none-any.whl
- Upload date:
- Size: 35.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.5.0 importlib_metadata/4.8.1 pkginfo/1.7.1 requests/2.26.0 requests-toolbelt/0.9.1 tqdm/4.62.3 CPython/3.9.6
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | cd01477d5ae512146fb586068c04d07cd9c42b16b3f9c01c6e1b15361586e721 |
|
MD5 | 0ec45a2c83b4f90d67720a6a4c31c9c4 |
|
BLAKE2b-256 | d4d1abcd0738c7e00ece7568feeabd96a861a9f746c3cda589f00bab8a879af2 |