Skip to main content

This library is designed to correct dates in building permit records

Project description

vos-mjjo
PyPI version

vos-mjjo is a Python port of Vos-Mjjo v0.0.16


Notable Changes

Update 0.0.9 - 2023.05

  • Add GitHub Action workflow
  • Add decision tree model to creating date_dictionary
  • Update the date_dictionary
  • Refactoring Cordate class
    • Apply naming Convention for Built-in Functions
    • Apply static type hints
    • Add module tests

Update 0.0.10 - 2023.05

  • Refactoring Cordate class
    • Add metadata-providing method
    • Add methods (look_up_one_clean, look_up_array_clean)
    • Enhance method descriptions
    • Add error handling based on method input conditions
    • Add module tests

Update 0.0.11 - 2023.05

  • Issue Update
    • By applying the zfill(8) method, the strftime method will generate a date string with 8 characters, ensuring that leading zeros are included for years below 1000

Update 0.0.12 - 2023.08

  • Version Update
    • Update the date dictionary to reflect the time reference of 2023.08

Update 0.0.13 - 2023.08

  • Built Bjd class
    • Built metadata with essential functionality
    • Developed internal functions within the class
    • Created file data for Convaddr internal functions
  • Built Convaddr class
    • Built metadata with essential functionality
    • Developed internal functions within the class
    • Add module tests

Install

pip install vos-mjjo

Usage

import mjjo

mjjo.__version__()

Output:

0.0.13

cordate.get_correct_array

from mjjo import cordate

test_date = "9990101"
# cordate.get_correct_one(date : str) -> list
cordate.get_correct_array(test_date)
# 입력된 문자열을 이용해 날짜 생성 규칙에 따라 현재 날짜까지 생성 가능한 모든 날짜를 리스트로 생성함
# 날짜 생성 규칙이란 연,월,일의 범위를 이용하는것으로 연도는 올해연도까지, 월은 1부터 12월까지, 일은 월별로 지정된 일까지
# 일반적으로 연도는 4자리, 월, 일은 2자리로 표기하지만 자리수 범위는 각 [0:4],[0:2],[0:2] 차지할 수 있음

Output:

["19990101"]
from mjjo import cordate

test_date_1 = "99990101"
cordate.get_correct_array(test_date_1)

test_date_2 = "9990101"
cordate.get_correct_array(test_date_2)

test_date_3 = "990101"
cordate.get_correct_array(test_date_3)

test_date_4 = "199901"
cordate.get_correct_array(test_date_4)

test_date_5 = "019991"
cordate.get_correct_array(test_date_5)

test_date_6 = "19991"
cordate.get_correct_array(test_date_6)

test_date_7 = "1999"
cordate.get_correct_array(test_date_7)

test_date_8 = "9901"
cordate.get_correct_array(test_date_8)

Output:

[]
["19990101"]
["19900101", "19901001", "19990101"]
["01990901", "19990101"]
["01990901", "19990101"]
["01990901", "19990101"]
["01990109", "00190909", "01990901", "19990101"]
["19900101", "00090901", "19990101"]

cordate.get_correct_one

from mjjo import cordate

test_date = "9990101"
# cordate.get_correct_one(date : str) -> str
cordate.get_correct_one(test_date)
# 입력된 문자열을 이용해 날짜 생성 규칙에 따라 현재 날짜까지 생성 가능한 모든 날짜 리스트중 가장 최신날짜를 출력
# 날짜 생성 규칙이란 연,월,일의 범위를 이용하는것으로 연도는 올해연도까지, 월은 1부터 12월까지, 일은 월별로 지정된 일까지
# 일반적으로 연도는 4자리, 월, 일은 2자리로 표기하지만 자리수 범위는 각 [0:4],[0:2],[0:2] 차지할 수 있음

Output:

"19990101"
from mjjo import cordate

test_date_1 = "99990101"
cordate.get_correct_array(test_date_1)

test_date_2 = "9990101"
cordate.get_correct_array(test_date_2)

test_date_3 = "990101"
cordate.get_correct_array(test_date_3)

test_date_4 = "199901"
cordate.get_correct_array(test_date_4)

test_date_5 = "019991"
cordate.get_correct_array(test_date_5)

test_date_6 = "19991"
cordate.get_correct_array(test_date_6)

test_date_7 = "1999"
cordate.get_correct_array(test_date_7)

test_date_8 = "9901"
cordate.get_correct_array(test_date_8)

Output:

None
"19990101"
"19990101"
"19990101"
"19990101"
"19990101"
"19990101"
"19990101"

cordate.look_up_array

from mjjo import cordate

CD = cordate.CorDate()
# CorDate 클래스 부여
CD.load_date_dictionary()
# 라이브러리 배포 폴더에 있는 date_dictionary.txt 로드
# CD.look_up_array(date : str) -> list
test_date = "99990101"
suggestions = CD.look_up_array(test_date)
# 연월일 문자열에 Symspellpy로 max_distance=2로 날짜 리스트 출력
for sugg in suggestions:
  print(sugg)
  # or print(sugg.term, sugg.distance, sugg.count)

Output:

# term, distance, count
19990101, 1, 158
19790101, 2, 2358
19690101, 2, 1243
19490101, 2, 1131
19590101, 2, 1106
19991101, 2, 1050
19920101, 2, 989
19990701, 2, 976
19990401, 2, 964
19990901, 2, 916
19990601, 2, 893
19991001, 2, 865
19930101, 2, 857
19900101, 2, 849
19910101, 2, 844
19950101, 2, 792
19890101, 2, 730
19940101, 2, 713
...

cordate.look_up_one

from mjjo import cordate

CD = cordate.CorDate()
# CorDate 클래스 부여
CD.load_date_dictionary()
# 라이브러리 배포 폴더에 있는 date_dictionary.txt 로드
# CD.look_up_one(date : str) -> str
test_date = "99990101"
suggestion = CD.look_up_one(test_date)
# 연월일 문자열에 Symspellpy로 max_distance=2로 날짜 리스트 중 가장 거리, 빈도 가까운 값 출력
print(suggestion)

Output:

# term, distance, count
19990101, 1, 158

convaddr.correct_simple_spacing

from mjjo import convaddr

CA = convaddr.ConvAddr()
# ConvAddr 클래스 부여
test_addr = "서울시 강남구  삼성동 1"
result = CA.correct_simple_spacing(addr=test_addr)
# 문자열(한글 주소) 2개 이상의 연속된 공백을 단일 공백으로 변환하여 반환
print(result)

Output:

서울시 강남구 삼성동 1

convaddr.correct_smallest_bjd_spacing

from mjjo import convaddr

CA = convaddr.ConvAddr()
# ConvAddr 클래스 부여
test_addr = "서울시 강남구 삼성동1"
result = CA.correct_smallest_bjd_spacing(addr=test_addr)
# 문자열(한글 주소) 최소 단위 법정동명("가", "동", "로", "리")과 번지 사이의 빈공백이 있을경우 공백으로 변환하여 반환
print(result)

Output:

서울시 강남구 삼성동 1

convaddr.correct_changed_bjd

from mjjo import convaddr

CA = convaddr.ConvAddr()
# ConvAddr 클래스 부여
test_addr = "강원도 춘천시 서면 현암리 1-1"
result = CA.correct_changed_bjd(addr=test_addr, is_log=False)
# 문자열(한글 주소) 변경전 법정동명이 존재하면 변경후 법정동명으로 변환하여 반환
# is_log: bool = True
# is_log == True 일 경우, 변경전 법정동명과 변경후 법정동명을 출력
print(result)

Output:

강원특별자치도 춘천시 서면 현암리 1-1

convaddr.test_correct_bjd

from mjjo import convaddr

CA = convaddr.ConvAddr()
# ConvAddr 클래스 부여
test_addr = "서울시 강남구 삼성동 1"
result = CA.test_correct_bjd(addr=test_addr, is_log=False)
# 문자열(한글 주소) correct_simple_spacing, correct_smallest_bjd_spacing, correct_changed_bjd 순차적으로 실행하여 변환값 반환
# is_log: bool = True
# is_log == True 일 경우, 변경전 법정동명과 변경후 법정동명을 출력
print(result)

Output:

서울시 강남구 삼성동 1
from mjjo import convaddr

CA = convaddr.ConvAddr()

test_addr = "강원도 춘천시 서면 현암리"
result = CA.test_correct_bjd(addr=test_addr, is_log=False)
print(result)

test_addr = "강원도 춘천시 서면 현암리 1-1"
result = CA.test_correct_bjd(addr=test_addr, is_log=False)
print(result)

test_addr = "강원도 춘천시 서면 현암리1-1"
result = CA.test_correct_bjd(addr=test_addr, is_log=False)
print(result)

test_addr = "강원도   춘천시 서면 현암리 1-1",
result = CA.test_correct_bjd(addr=test_addr, is_log=False)
print(result)

Output:

강원특별자치도 춘천시 서면 현암리
강원특별자치도 춘천시 서면 현암리 1-1
강원특별자치도 춘천시 서면 현암리 1-1
강원특별자치도 춘천시 서면 현암리 1-1

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

vos_mjjo-0.0.16.tar.gz (26.3 kB view details)

Uploaded Source

Built Distribution

vos_mjjo-0.0.16-py3-none-any.whl (27.1 kB view details)

Uploaded Python 3

File details

Details for the file vos_mjjo-0.0.16.tar.gz.

File metadata

  • Download URL: vos_mjjo-0.0.16.tar.gz
  • Upload date:
  • Size: 26.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.9.17

File hashes

Hashes for vos_mjjo-0.0.16.tar.gz
Algorithm Hash digest
SHA256 7c284c1565e8a0550c8f708e4c87122a82784d42c71aa99b9bbaf20dde92e684
MD5 47dd674894ed67dbdcfc97f53009919b
BLAKE2b-256 ffffa2976c23fcd6fd95d22003f2c6be041b05c6bc7fdaff605ac446ffa5a004

See more details on using hashes here.

File details

Details for the file vos_mjjo-0.0.16-py3-none-any.whl.

File metadata

  • Download URL: vos_mjjo-0.0.16-py3-none-any.whl
  • Upload date:
  • Size: 27.1 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.9.17

File hashes

Hashes for vos_mjjo-0.0.16-py3-none-any.whl
Algorithm Hash digest
SHA256 16ce3c0db5a2706bc5a181a682f7a594993f177f7800096922a7f00b25816e1a
MD5 8324c3846ac3084376d7a6cc76c0625b
BLAKE2b-256 1bf42bc76d40b9ac2835dce67b7d4097a9ad5738e79e81eac4f7874cf698c3aa

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page