Skip to main content

soiz is awesome 🤘

Project description

Thư Viện Xử Lý File Python

Thư viện Python hỗ trợ xử lý và chuyển đổi file với nhiều tính năng.

Cấu Trúc Thư Mục

├── modules/
│   ├── __init__.py
│   ├── convert.py      - Chuyển đổi định dạng file
│   ├── file.py         - Xử lý file cơ bản
│   ├── image.py        - Xử lý hình ảnh
│   ├── llm.py          - Tích hợp mô hình ngôn ngữ
│   ├── ocr.py          - Nhận dạng ký tự quang học
│   └── pdf.py          - Xử lý file PDF
├── autoentry.py        - Dự án trích xuất dữ liệu
├── tests/              - Thư mục chứa các file test
├── poetry.lock         - File khóa phiên bản package
├── pyproject.toml      - Cấu hình project
└── README.md           - Tài liệu hướng dẫn

Mô Tả Các Module

convert.py

Module hỗ trợ chuyển đổi qua lại giữa các định dạng file khác nhau.

  • Chuyển đổi hình ảnh sang PDF
  • Chuyển đổi giữa các định dạng hình ảnh
  • Kiểm tra tính tương thích của các định dạng

file.py

Module xử lý các thao tác cơ bản với file.

  • Đọc và ghi file
  • Quản lý thông tin file
  • Các thao tác với hệ thống file

image.py

Module chuyên về xử lý hình ảnh.

  • Chỉnh sửa kích thước ảnh
  • Tối ưu hóa hình ảnh
  • Xử lý metadata của ảnh
  • Các thao tác cơ bản với hình ảnh

llm.py

Module tích hợp mô hình ngôn ngữ.

  • Xử lý văn bản
  • Phân tích ngôn ngữ
  • Chuyển đổi văn bản

ocr.py

Module nhận dạng ký tự từ hình ảnh.

  • Trích xuất text từ ảnh
  • Quét và xử lý văn bản
  • Hỗ trợ nhiều ngôn ngữ

pdf.py

Module làm việc với file PDF.

  • Tạo và chỉnh sửa PDF
  • Ghép và tách file PDF
  • Trích xuất text từ PDF
  • Quản lý thông tin PDF

autoentry.py

Dự án trích xuất dữ liệu.

Thêm thư viện

poetry add <package-name>

Build file

poetry build

Cài Đặt

Dự án sử dụng Poetry để quản lý package. Để cài đặt:

poetry install

Thay đổi phiên bản cũ

poetry update torch torchvision torchaudio

Yêu Cầu Hệ Thống

  • Python 3.10 trở lên
  • Poetry
  • Các thư viện phụ thuộc được liệt kê trong pyproject.toml

Phát Triển

  1. Clone repository về máy
  2. Cài đặt Poetry
  3. Chạy poetry install để cài đặt dependencies
  4. Chạy poetry shell để kích hoạt môi trường ảo

Kiểm Thử

poetry run pytest

Bảo Mật

  • Kiểm tra đầu vào cho mọi thao tác file
  • Xử lý file an toàn
  • Không thực thi mã không đáng tin cậy
  • Xử lý đường dẫn file an toàn

Giấy Phép

Dự án được phân phối dưới Giấy phép MIT.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

soiz-0.1.5.tar.gz (15.2 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

soiz-0.1.5-py3-none-any.whl (16.5 kB view details)

Uploaded Python 3

File details

Details for the file soiz-0.1.5.tar.gz.

File metadata

  • Download URL: soiz-0.1.5.tar.gz
  • Upload date:
  • Size: 15.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.10.11 Windows/10

File hashes

Hashes for soiz-0.1.5.tar.gz
Algorithm Hash digest
SHA256 9105a0b88ecffad5d010434179c0b0c8148c14391b6e2bc85177f5dbd48cefa1
MD5 f0e6f907d71eee8119d9c7d085cc97e8
BLAKE2b-256 8224c52ad0123f2be7e1e652ab636a9427a82fd4aa3a72dbaa47a0dee2891d54

See more details on using hashes here.

File details

Details for the file soiz-0.1.5-py3-none-any.whl.

File metadata

  • Download URL: soiz-0.1.5-py3-none-any.whl
  • Upload date:
  • Size: 16.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.10.11 Windows/10

File hashes

Hashes for soiz-0.1.5-py3-none-any.whl
Algorithm Hash digest
SHA256 7f497ce10d7ca72673b05d2d88275fb49706aa46c8804349f36175a247180b2e
MD5 79be5706b2f7458e6f159885ce4045ad
BLAKE2b-256 2bed21e5f3a1d39dd2490edc67d2bcc7d357efa5cd6a12153db0314d5c95a906

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page