Document processing tool - converts HWP (and more) to Markdown
Project description
docpler
HWP(한글 워드프로세서) 등 문서 파일을 Markdown으로 변환하는 Python 패키지. Rust 코어 기반으로 빠르고 정확한 파싱을 제공합니다.
지원 포맷
| 포맷 | 읽기 | 출력 |
|---|---|---|
| HWP 5.0 | ✅ | Markdown |
설치
pip install docpler
사용법
기본 사용
from docpler.hwp import convert
markdown = convert("document.hwp")
print(markdown)
markitdown 플러그인
from markitdown import MarkItDown
md = MarkItDown()
result = md.convert("document.hwp")
print(result.text_content)
라이선스
이 프로젝트는 MIT 라이선스로 제공되며, 현재 버전의 사용에 별도의 제약은 없습니다.
- Python 래퍼 코드: 오픈소스 (MIT)
- Rust 코어 엔진: 컴파일된 바이너리로 배포되며, 소스 코드는 비공개입니다.
HWP 포맷 관련 고지
본 제품은 한글과컴퓨터의 한글 문서 파일(.hwp) 공개 문서를 참고하여 개발하였습니다.
HWP 파일 포맷 공개 문서의 저작권은 (주)한글과컴퓨터에 있으며, 공개 문서의 전문은 한글과컴퓨터 공식 페이지에서 확인할 수 있습니다.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distributions
No source distribution files available for this release.See tutorial on generating distribution archives.
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file docpler-0.1.2-cp312-cp312-macosx_11_0_arm64.whl.
File metadata
- Download URL: docpler-0.1.2-cp312-cp312-macosx_11_0_arm64.whl
- Upload date:
- Size: 226.0 kB
- Tags: CPython 3.12, macOS 11.0+ ARM64
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
012080872e45c137f955547344c3c90b754132d152bd11cde2308f79133fb030
|
|
| MD5 |
4151bbffb6c26f79af7bc68973bf1e87
|
|
| BLAKE2b-256 |
ea24f3649ae5e363a59c43abaadbdf8e54b4373056e5b33012e0e75bd7b6fd86
|