Skip to main content

Document processing tool - converts HWP (and more) to Markdown

Project description

docpler

HWP(한글 워드프로세서) 등 문서 파일을 Markdown으로 변환하는 Python 패키지. Rust 코어 기반으로 빠르고 정확한 파싱을 제공합니다.

지원 포맷

포맷 읽기 출력
HWP 5.0 Markdown

설치

pip install docpler

사용법

기본 사용

from docpler.hwp import convert

markdown = convert("document.hwp")
print(markdown)

markitdown 플러그인

from markitdown import MarkItDown

md = MarkItDown(enable_plugins=True)
result = md.convert("document.hwp")
print(result.text_content)

라이선스

이 프로젝트는 MIT 라이선스로 제공되며, 현재 버전의 사용에 별도의 제약은 없습니다.

  • Python 래퍼 코드: 오픈소스 (MIT)
  • Rust 코어 엔진: 컴파일된 바이너리로 배포되며, 소스 코드는 비공개입니다.

HWP 포맷 관련 고지

본 제품은 한글과컴퓨터의 한글 문서 파일(.hwp) 공개 문서를 참고하여 개발하였습니다.

HWP 파일 포맷 공개 문서의 저작권은 (주)한글과컴퓨터에 있으며, 공개 문서의 전문은 한글과컴퓨터 공식 페이지에서 확인할 수 있습니다.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

docpler-0.1.3-cp312-cp312-macosx_11_0_arm64.whl (226.0 kB view details)

Uploaded CPython 3.12macOS 11.0+ ARM64

File details

Details for the file docpler-0.1.3-cp312-cp312-macosx_11_0_arm64.whl.

File metadata

File hashes

Hashes for docpler-0.1.3-cp312-cp312-macosx_11_0_arm64.whl
Algorithm Hash digest
SHA256 95ea81f839e8cbf39605759adb2b3000be8f0841bb1feeb89410ed5d370fada8
MD5 4af48058300f6da644cd1dc03f260b26
BLAKE2b-256 e240fd617070cb40323fb94468fb3d86d70704c50f426eefccd74ff05093f414

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page