다양한 편의성 함수 모음 패키지
Project description
Install
pip install utilskit
개요
이 패키지는 다양한 전처리 작업을 효율적으로 처리할 수 있도록 설계된 커스텀 유틸리티 모음입니다. 데이터 정제, 결측치 처리, 반복 패턴 탐지, 시계열 정렬 및 그룹화 이미지 생성 편의성 등 데이터 분석 전반에 걸친 반복 작업들을 간결하게 수행할 수 있도록 돕습니다. 분석가와 엔지니어 모두를 위한 실용적인 도구로, 빠르고 안정적인 데이터 분석 파이프라인 구축에 기여할 수 있습니다.
Features
- classificationutils
| 함수명 | 목적 |
|---|---|
| confucsion_matrix | confusion matrix 생성 |
- dataframeutils
| 함수명 | 목적 |
|---|---|
| read_df | 데이터 불러오기 |
| utc2kor | 시간대 변경 |
| adnormal2nan | 이상치 --> 결측치 |
| time_filling | 시간 확장 |
| isdfvalid | dataframe 유효성 검증 |
| fill_repeat_nan | 반복성 결측치 보정 |
| pin2nan | 핀포인트 결측치 보정 |
- dbutils
| 함수명 | 목적 |
|---|---|
| query2db | Query 를 DB에 커밋 |
| df2db | dataframe을 DB 에 삽입 |
- plotutils
| 함수명 | 목적 |
|---|---|
| draw_plot | 이미지 생성 |
| draw_subplot | 서브 플롯 형태의 이미지 생성 |
- repeatutils
| 함수명 | 목적 |
|---|---|
| get_section | 반복 구간 산출 |
| section_union | 구간과 구간과의 겹침 연산 |
- timeutils
| 함수명 | 목적 |
|---|---|
| get_now | 사용자 지정 방식의 현재 시간 추출 |
| time_measure | 정수 --> 시, 분, 초 변환 |
| get_date_list | 입력한 기준값을 통해 전체 날짜 리스트 생성 |
- utils
| 함수명 | 목적 |
|---|---|
| envs_setting | 각종 랜덤 시드 설정 |
| get_error_info | 에러 발생시의 메시지 객체화 |
Version
2025-11-24 ver 0.2.18
에러수정
- repeatutils 의 section_union 함수에서 mode 에 -, +, & 외의 값 입력시 에러 도출하는 유효성 검증 부분 추가
최적화
- README, docs 구조 변경
0.2.18.1
- README 의 하이퍼링크를 github 절대경로로 변경
0.2.18.2
- README 의 하이퍼링크를 github 절대경로로 변경(경로 수정)
0.2.17
- logutils 기능 완전 삭제 > logie 패키지로 분리
0.2.16
- repeatutils 의 section_union 에서 mode 를 & 으로 하고 sub 또는 main section 이 빈 리스트인 경우 빈리스트 [] 를 리턴 하도록 수정
0.2.16.1
- 조건문에서 & 앞에 띄어쓰기가 하나 포함되어있어 정상적 연산이 되지 않는 부분 수정
0.2.15
- repeatutils 의 section_union 에서 결과가 빈값일때 에러가 나는 현상 수정
0.2.14
- repeatutils 의 min_key 를 설정했을 때 min_equal=False 로 두는 경우 정상적인 구간 탐색을 못하는 현상 수정
0.2.13
- repeatutils 에 section_union 함수 추가
0.2.13.1
- rpu.get_section 을 써서 에러가 난 부분 수정
0.2.12
- dataframeutils 의 fill_repeat_nan 함수가 NaN 이 딱 하나만 있는 경우 보정하지 못하는 현상 수정
0.2.11
- dataframeutils 의 fill_repeat_nan 함수가 3 이하 반복되는 NaN 이 아닌 3 이상 반복되는 NaN 구간에 대해 보정하는 현상 수정
0.2.10
- repeatutils 에서 between 이 정상작동하지 않는 현상 수정
0.2.10.1
- 버전 업로드 에러 수정
0.2.10.2
- 함수 내부 print 제거
0.2.9
- repeatuils 에서 정수형 list 를 넣었을때 float 으로 변경되도록 수정
0.2.8
- dbutils 에서 db 의 컬럼명을 리스트로 추출하는 get_db_name 함수 추가
0.2.8.1
- all 에 get_db_name 추가해서 사용가능하도록 설정
0.2.7
- repeatutils 에서 정수형 list 를 넣었을때 key 를 통한 구간 파악이 되지 않는 현상 수정
0.2.6
- dataframeutils 의 fill_repeat_nan 의 에러 수정
0.2.5
- xlsx 읽는 패키지 install 추가
0.2.4
- repeatutils 의 에러 제거
0.2.3
- dbutils 에 대한 업데이트 진행
0.2.2
- build 방식 변경
0.2.1
- repeatutila 에 get_section 함수 추가
0.2.0
- 정식 최초 배포버전
- 각 함수의 사용성 강화 및 비활성 함수 지정
0.1.2
- repeatutils 의 get_repeat_section 에서 하나의 값이 여러 구간에서 반복될때 마지막 구간만 나오는 부분 수정
- repeatutils 의 get_repeat_section 및 get_stan_repeat_section 에서 추출되는 구간의 마지막 값이 +1 이 되는 부분 수정
0.1.1
- repeatutils.py 추가
- utils.py 에서 repeat 관련 함수 제거
2026-01-28 Version 1.0.0
tag: @Major-Release Summary: baseline link / git + hash 기반 검증 구조 최초 적용 Detail: Modified: .gitignore
Modified: README.md
Deleted: git_test.py
Modified: pyproject.toml
Modified: scripts/upload.py
Modified: utilskit/hashutils/hashutils.py
- 해시 함수 전부 모음
- 함수
reset_values삭제 - 함수
combined2hash에서 파일 이름이 manifest.json 인 경우의 논리 제거
Modified: utilskit/utils/utils.py
- 기존의 사용성 없는 정크 함수 전부 삭제
- 함수
SmartOutput추가 get_error_info함수에 openai API 기반 AI에러 분석 기능 추가get_error_info함수에서 AI 에러 분석 기능 사용시 openai install 여부 확인- 신규 함수
path_change를 추가
Modified: utilskit/versionutils/versionutils.py
version_up함수 추가- git status 정보를 추출하는
get_git_status함수 추가 - 함수
git_addcommit추가
New: .cruft.json
New: scripts/versioning.py
- 버전업을 통해 pyproject.toml 의 버전 값을 바꾸는 기능 추가
- git 을 통해 변경이력을 확인 (status) 하고 해시검증을 통한 대상선정, 버전업, git add&commit 까지 진행하는 기능
2026-01-28 Version 1.0.1
tag: @Patch Summary: commit 안되는 현상 수정 Detail: Modified: scripts/versioning.py
2026-01-28 Version 1.0.2
tag: @Patch Summary: 검증 무한 루프 수정 Detail: Modified: .gitignore
Modified: README.md
Modified: pyproject.toml
Modified: scripts/versioning.py
- pyproject.toml 에 한해서는 version 이라는 라인은 해시 계산에서 제거
- 원본대체, git add commit 순서를 변경
Modified: utilskit/hashutils/hashutils.py
- 키워드기반으로 특정 라인을 해시 계산에서 제외하는 ignore_words 인자 추가
2026-01-28 Version 1.0.3
tag: @Patch
Summary: README.md 수정
Detail:
Modified: README.md
2026-01-29 Version 1.0.4
Tag: @Patch
Summary: install 시의 option 설정
Detail:
Modified: pyproject.toml
Modified: requirements.txt
New: scripts/sync_dependencies.py
New: scripts/sync_dependencies.sh
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file utilskit-1.0.4.tar.gz.
File metadata
- Download URL: utilskit-1.0.4.tar.gz
- Upload date:
- Size: 36.0 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.14
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
1f1526785135c0d566259ab5618858f50e2907a11f6c3d809e8b977af5f0dfc2
|
|
| MD5 |
b74cdb01105ad9eff2e501ea3b1046aa
|
|
| BLAKE2b-256 |
37c1c208cec593a7550315792fad545040f35450e7466affe2b17342caef22b3
|
File details
Details for the file utilskit-1.0.4-py3-none-any.whl.
File metadata
- Download URL: utilskit-1.0.4-py3-none-any.whl
- Upload date:
- Size: 37.5 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.14
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
9bddb42c4d618a463d4bcffff464132a279880a396acee44adaa648c5ea4e833
|
|
| MD5 |
df096e9241d97e24c2482ed2101182b8
|
|
| BLAKE2b-256 |
dcd9989c5d118773a2297e76a8153da89a8c062cd80d967f51177a9191d19d65
|