Skip to main content

soiz is awesome 🤘

Project description

Thư Viện Xử Lý File Python

Thư viện Python hỗ trợ xử lý và chuyển đổi file với nhiều tính năng.

Cấu Trúc Thư Mục

├── modules/
│   ├── __init__.py
│   ├── convert.py      - Chuyển đổi định dạng file
│   ├── file.py         - Xử lý file cơ bản
│   ├── image.py        - Xử lý hình ảnh
│   ├── llm.py          - Tích hợp mô hình ngôn ngữ
│   ├── ocr.py          - Nhận dạng ký tự quang học
│   └── pdf.py          - Xử lý file PDF
├── autoentry.py        - Dự án trích xuất dữ liệu
├── tests/              - Thư mục chứa các file test
├── poetry.lock         - File khóa phiên bản package
├── pyproject.toml      - Cấu hình project
└── README.md           - Tài liệu hướng dẫn

Mô Tả Các Module

convert.py

Module hỗ trợ chuyển đổi qua lại giữa các định dạng file khác nhau.

  • Chuyển đổi hình ảnh sang PDF
  • Chuyển đổi giữa các định dạng hình ảnh
  • Kiểm tra tính tương thích của các định dạng

file.py

Module xử lý các thao tác cơ bản với file.

  • Đọc và ghi file
  • Quản lý thông tin file
  • Các thao tác với hệ thống file

image.py

Module chuyên về xử lý hình ảnh.

  • Chỉnh sửa kích thước ảnh
  • Tối ưu hóa hình ảnh
  • Xử lý metadata của ảnh
  • Các thao tác cơ bản với hình ảnh

llm.py

Module tích hợp mô hình ngôn ngữ.

  • Xử lý văn bản
  • Phân tích ngôn ngữ
  • Chuyển đổi văn bản

ocr.py

Module nhận dạng ký tự từ hình ảnh.

  • Trích xuất text từ ảnh
  • Quét và xử lý văn bản
  • Hỗ trợ nhiều ngôn ngữ

pdf.py

Module làm việc với file PDF.

  • Tạo và chỉnh sửa PDF
  • Ghép và tách file PDF
  • Trích xuất text từ PDF
  • Quản lý thông tin PDF

autoentry.py

Dự án trích xuất dữ liệu.

Thêm thư viện

poetry add <package-name>

Build file

poetry build

Cài Đặt

Dự án sử dụng Poetry để quản lý package. Để cài đặt:

poetry install

Thay đổi phiên bản cũ

poetry update torch torchvision torchaudio

Yêu Cầu Hệ Thống

  • Python 3.10 trở lên
  • Poetry
  • Các thư viện phụ thuộc được liệt kê trong pyproject.toml

Phát Triển

  1. Clone repository về máy
  2. Cài đặt Poetry
  3. Chạy poetry install để cài đặt dependencies
  4. Chạy poetry shell để kích hoạt môi trường ảo

Kiểm Thử

poetry run pytest

Bảo Mật

  • Kiểm tra đầu vào cho mọi thao tác file
  • Xử lý file an toàn
  • Không thực thi mã không đáng tin cậy
  • Xử lý đường dẫn file an toàn

Giấy Phép

Dự án được phân phối dưới Giấy phép MIT.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

soiz-0.1.8.tar.gz (1.3 MB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

soiz-0.1.8-py3-none-any.whl (1.5 MB view details)

Uploaded Python 3

File details

Details for the file soiz-0.1.8.tar.gz.

File metadata

  • Download URL: soiz-0.1.8.tar.gz
  • Upload date:
  • Size: 1.3 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.10.11 Windows/10

File hashes

Hashes for soiz-0.1.8.tar.gz
Algorithm Hash digest
SHA256 c5bdae81f2f5d65eb3bf5630383fe5b0d4d7e653105f9dc6ffdeb366f9ba389e
MD5 bb10ebb5bdd661dd00d5182a109656af
BLAKE2b-256 922165a6065c13dc595ea6730a32aed854068de8c91b20531e5d76e296447f51

See more details on using hashes here.

File details

Details for the file soiz-0.1.8-py3-none-any.whl.

File metadata

  • Download URL: soiz-0.1.8-py3-none-any.whl
  • Upload date:
  • Size: 1.5 MB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.10.11 Windows/10

File hashes

Hashes for soiz-0.1.8-py3-none-any.whl
Algorithm Hash digest
SHA256 e14ca354082aafec74109e9b90baabdc76369110f4770f93a94094ede96d4294
MD5 0f10cf6b7fb1bb34d854ddfb6bc4422c
BLAKE2b-256 20321b414ad8f33bc265ce3c2cc8fd752b3b5915ba2006f0ea9eda3f7df2ecd8

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page