Skip to main content

soiz is awesome 🤘

Project description

Thư Viện Xử Lý File Python

Thư viện Python hỗ trợ xử lý và chuyển đổi file với nhiều tính năng.

Cấu Trúc Thư Mục

├── modules/
│   ├── __init__.py
│   ├── convert.py      - Chuyển đổi định dạng file
│   ├── file.py         - Xử lý file cơ bản
│   ├── image.py        - Xử lý hình ảnh
│   ├── llm.py          - Tích hợp mô hình ngôn ngữ
│   ├── ocr.py          - Nhận dạng ký tự quang học
│   └── pdf.py          - Xử lý file PDF
├── autoentry.py        - Dự án trích xuất dữ liệu
├── tests/              - Thư mục chứa các file test
├── poetry.lock         - File khóa phiên bản package
├── pyproject.toml      - Cấu hình project
└── README.md           - Tài liệu hướng dẫn

Mô Tả Các Module

convert.py

Module hỗ trợ chuyển đổi qua lại giữa các định dạng file khác nhau.

  • Chuyển đổi hình ảnh sang PDF
  • Chuyển đổi giữa các định dạng hình ảnh
  • Kiểm tra tính tương thích của các định dạng

file.py

Module xử lý các thao tác cơ bản với file.

  • Đọc và ghi file
  • Quản lý thông tin file
  • Các thao tác với hệ thống file

image.py

Module chuyên về xử lý hình ảnh.

  • Chỉnh sửa kích thước ảnh
  • Tối ưu hóa hình ảnh
  • Xử lý metadata của ảnh
  • Các thao tác cơ bản với hình ảnh

llm.py

Module tích hợp mô hình ngôn ngữ.

  • Xử lý văn bản
  • Phân tích ngôn ngữ
  • Chuyển đổi văn bản

ocr.py

Module nhận dạng ký tự từ hình ảnh.

  • Trích xuất text từ ảnh
  • Quét và xử lý văn bản
  • Hỗ trợ nhiều ngôn ngữ

pdf.py

Module làm việc với file PDF.

  • Tạo và chỉnh sửa PDF
  • Ghép và tách file PDF
  • Trích xuất text từ PDF
  • Quản lý thông tin PDF

autoentry.py

Dự án trích xuất dữ liệu.

Thêm thư viện

poetry add <package-name>

Build file

poetry build

Cài Đặt

Dự án sử dụng Poetry để quản lý package. Để cài đặt:

poetry install

Thay đổi phiên bản cũ

poetry update torch torchvision torchaudio

Yêu Cầu Hệ Thống

  • Python 3.10 trở lên
  • Poetry
  • Các thư viện phụ thuộc được liệt kê trong pyproject.toml

Phát Triển

  1. Clone repository về máy
  2. Cài đặt Poetry
  3. Chạy poetry install để cài đặt dependencies
  4. Chạy poetry shell để kích hoạt môi trường ảo

Kiểm Thử

poetry run pytest

Bảo Mật

  • Kiểm tra đầu vào cho mọi thao tác file
  • Xử lý file an toàn
  • Không thực thi mã không đáng tin cậy
  • Xử lý đường dẫn file an toàn

Giấy Phép

Dự án được phân phối dưới Giấy phép MIT.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

soiz-0.1.7.tar.gz (13.6 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

soiz-0.1.7-py3-none-any.whl (15.3 kB view details)

Uploaded Python 3

File details

Details for the file soiz-0.1.7.tar.gz.

File metadata

  • Download URL: soiz-0.1.7.tar.gz
  • Upload date:
  • Size: 13.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.10.11 Windows/10

File hashes

Hashes for soiz-0.1.7.tar.gz
Algorithm Hash digest
SHA256 dcd7bbe5f2f941e952dfe50710df74114a66e7529e17917114f94bba4b9f0f6d
MD5 a0585efc92d82dfa39d804687723d228
BLAKE2b-256 2adb1b4c937f58ffa262ff6f70499674140d7b6f6963c06944bebee3e386c97c

See more details on using hashes here.

File details

Details for the file soiz-0.1.7-py3-none-any.whl.

File metadata

  • Download URL: soiz-0.1.7-py3-none-any.whl
  • Upload date:
  • Size: 15.3 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.10.11 Windows/10

File hashes

Hashes for soiz-0.1.7-py3-none-any.whl
Algorithm Hash digest
SHA256 aa27e57283dd090faba326a6347e1d7e9a42bf1f1bfc481d9b89b426521ffa74
MD5 8c235fcdb50f90bd544ad80f5bc893b1
BLAKE2b-256 a137fa4a4a529604db2ab7f2f7b9e5d108792e4e686a7edb37b12bd90fae9bd0

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page