Skip to main content

Python HWP 파일 파서 및 텍스트 추출 라이브러리

Project description

helper_hwp

Python으로 작성된 HWP (한글 문서) 파일 파서 및 텍스트 추출 라이브러리입니다.

특징

  • HWP 5.x 포맷 지원 (CFB 기반)
  • 텍스트 추출 및 마크다운 변환
  • 표, 페이지 단위 파싱 지원
  • 단위 변환 유틸리티 제공 (HWPUNIT ↔ cm/inch/px)

설치

pip install helper-hwp

또는 소스에서 설치:

git clone https://github.com/c0z0c-helper/helper_hwp.git
cd helper_hwp
pip install -e .

빠른 시작

텍스트 추출

from helper_hwp import hwp_to_txt

# HWP 파일에서 텍스트 추출
text = hwp_to_txt('example.hwp')
print(text)

마크다운 변환

from helper_hwp import hwp_to_markdown

# HWP 파일을 마크다운으로 변환
markdown = hwp_to_markdown('example.hwp')
print(markdown)

문서 객체 사용

from helper_hwp import open_hwp

# HWP 문서 열기
doc = open_hwp('example.hwp')

# 테그 단위 순회
for paragraph in doc.iter_tags():
    print(paragraph.text)

Examples

다음 예제를 참고하세요:

또는 소스 배포판(sdist)을 다운로드하여 확인:

pip download --no-deps helper-hwp
tar -xzf helper_hwp-*.tar.gz

문서

요구사항

  • Python 3.8 이상
  • olefile >= 0.46
  • pycryptodome >= 3.15.0

라이센스

이 프로젝트는 Apache License 2.0 라이센스 하에 배포됩니다.

누구나 자유롭게 사용하고 수정할 수 있으며, 사용 시 출처를 표기해 주세요.

출처: https://github.com/c0z0c-helper/helper_hwp

자세한 내용은 LICENSE 파일을 참조하세요.

기여

프로젝트에 대한 기여를 환영합니다! 기여 방법은 개발자 문서를 참조하세요.

변경 이력

변경 이력은 CHANGELOG.md를 참조하세요.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

helper_hwp-0.5.5.tar.gz (48.5 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

helper_hwp-0.5.5-py3-none-any.whl (40.5 kB view details)

Uploaded Python 3

File details

Details for the file helper_hwp-0.5.5.tar.gz.

File metadata

  • Download URL: helper_hwp-0.5.5.tar.gz
  • Upload date:
  • Size: 48.5 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.11.14

File hashes

Hashes for helper_hwp-0.5.5.tar.gz
Algorithm Hash digest
SHA256 a62fcd5fd0289475cfc647ded8391ab8e182556aa40183d4777a50c27c42d527
MD5 b36447e220a28577fc4f8804b9c3c202
BLAKE2b-256 3f0dd8b4fa437e1946d1dbe9055b54b12bac1b73abfc8cd6b2c83cb4925a517b

See more details on using hashes here.

File details

Details for the file helper_hwp-0.5.5-py3-none-any.whl.

File metadata

  • Download URL: helper_hwp-0.5.5-py3-none-any.whl
  • Upload date:
  • Size: 40.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.11.14

File hashes

Hashes for helper_hwp-0.5.5-py3-none-any.whl
Algorithm Hash digest
SHA256 0f78045066094b52b9fc913559a8ce6c18e10177435f836250eeb108ec62bfdd
MD5 8f2639dcea863c52f9f1c9dc47d237e7
BLAKE2b-256 0d712681ebc21e7f3395e1541c3174d24eeeec453a8ed5e6e6167335a787d519

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page