Skip to main content

soiz is awesome 🤘

Project description

Thư Viện Xử Lý File Python

Thư viện Python hỗ trợ xử lý và chuyển đổi file với nhiều tính năng.

Cấu Trúc Thư Mục

├── modules/
│   ├── __init__.py
│   ├── convert.py      - Chuyển đổi định dạng file
│   ├── file.py         - Xử lý file cơ bản
│   ├── image.py        - Xử lý hình ảnh
│   ├── llm.py          - Tích hợp mô hình ngôn ngữ
│   ├── ocr.py          - Nhận dạng ký tự quang học
│   └── pdf.py          - Xử lý file PDF
├── autoentry.py        - Dự án trích xuất dữ liệu
├── tests/              - Thư mục chứa các file test
├── poetry.lock         - File khóa phiên bản package
├── pyproject.toml      - Cấu hình project
└── README.md           - Tài liệu hướng dẫn

Mô Tả Các Module

convert.py

Module hỗ trợ chuyển đổi qua lại giữa các định dạng file khác nhau.

  • Chuyển đổi hình ảnh sang PDF
  • Chuyển đổi giữa các định dạng hình ảnh
  • Kiểm tra tính tương thích của các định dạng

file.py

Module xử lý các thao tác cơ bản với file.

  • Đọc và ghi file
  • Quản lý thông tin file
  • Các thao tác với hệ thống file

image.py

Module chuyên về xử lý hình ảnh.

  • Chỉnh sửa kích thước ảnh
  • Tối ưu hóa hình ảnh
  • Xử lý metadata của ảnh
  • Các thao tác cơ bản với hình ảnh

llm.py

Module tích hợp mô hình ngôn ngữ.

  • Xử lý văn bản
  • Phân tích ngôn ngữ
  • Chuyển đổi văn bản

ocr.py

Module nhận dạng ký tự từ hình ảnh.

  • Trích xuất text từ ảnh
  • Quét và xử lý văn bản
  • Hỗ trợ nhiều ngôn ngữ

pdf.py

Module làm việc với file PDF.

  • Tạo và chỉnh sửa PDF
  • Ghép và tách file PDF
  • Trích xuất text từ PDF
  • Quản lý thông tin PDF

autoentry.py

Dự án trích xuất dữ liệu.

Thêm thư viện

poetry add <package-name>

Build file

poetry build

Cài Đặt

Dự án sử dụng Poetry để quản lý package. Để cài đặt:

poetry install

Thay đổi phiên bản cũ

poetry update torch torchvision torchaudio

Yêu Cầu Hệ Thống

  • Python 3.10 trở lên
  • Poetry
  • Các thư viện phụ thuộc được liệt kê trong pyproject.toml

Phát Triển

  1. Clone repository về máy
  2. Cài đặt Poetry
  3. Chạy poetry install để cài đặt dependencies
  4. Chạy poetry shell để kích hoạt môi trường ảo

Kiểm Thử

poetry run pytest

Bảo Mật

  • Kiểm tra đầu vào cho mọi thao tác file
  • Xử lý file an toàn
  • Không thực thi mã không đáng tin cậy
  • Xử lý đường dẫn file an toàn

Giấy Phép

Dự án được phân phối dưới Giấy phép MIT.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

soiz-0.1.6.tar.gz (13.6 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

soiz-0.1.6-py3-none-any.whl (15.3 kB view details)

Uploaded Python 3

File details

Details for the file soiz-0.1.6.tar.gz.

File metadata

  • Download URL: soiz-0.1.6.tar.gz
  • Upload date:
  • Size: 13.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.10.11 Windows/10

File hashes

Hashes for soiz-0.1.6.tar.gz
Algorithm Hash digest
SHA256 ad4d33644bbaa6bfb4c3d11b23db3b6409d812414fa1473bc78f30d83f88e918
MD5 14a279ffe124783b2c64f38e6e1c0070
BLAKE2b-256 7204efce9b76c5f37ec4ff6f79161130ea2c47b9109f9ad20b7b4e5da6b5b1dd

See more details on using hashes here.

File details

Details for the file soiz-0.1.6-py3-none-any.whl.

File metadata

  • Download URL: soiz-0.1.6-py3-none-any.whl
  • Upload date:
  • Size: 15.3 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.10.11 Windows/10

File hashes

Hashes for soiz-0.1.6-py3-none-any.whl
Algorithm Hash digest
SHA256 eb4484fea8ad1708ac89c17a88c1142d29c6b87ddadda8f7ff6a99641af04e83
MD5 9a73abaf1c5069587765c4758b61068b
BLAKE2b-256 c6c33ba2212c6e130ba25ff5c41260c5eb658d893fbc7d482ab5f633922a33ce

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page