Công cụ tải web novel từ Valvrare Team (Asynchronous & Optimized)
Project description
Valvrare Team Web Novel Scraper
Mô tả dự án
Valvrare Team Web Novel Scraper là một công cụ dòng lệnh (CLI) mạnh mẽ, được tối ưu hóa để tải web novel từ Valvrare Team. Công cụ hỗ trợ xuất bản ra nhiều định dạng như EPUB, PDF, HTML, Markdown, và TXT với hiệu suất cao nhờ kiến trúc bất đồng bộ (Asynchronous).
Tính năng nổi bật
- Hiệu suất vượt trội: Tải nội dung chương và hình ảnh minh họa song song (Bulk Download), giảm 80% thời gian chờ so với các bản cũ.
- Giao diện hiện đại: Tích hợp
Richmang lại giao diện bảng biểu đẹp mắt và thanh tiến trình (progress bars) trực quan. - Tìm kiếm thông minh: Tìm kiếm truyện trực tiếp với gợi ý thời gian thực (Live Search) và tự động xử lý slug chính xác.
- Làm sạch dữ liệu tự động: Tự động loại bỏ các hậu tố trạng thái (
+Đang tiến hành,+Hoàn thành...) và chuẩn hóa tên tệp/thư mục. - Vượt rào cản nâng cao: Hỗ trợ lấy session thủ công (Dynamic Session Capture) để vượt qua Cloudflare hoặc truy cập nội dung yêu cầu đăng nhập.
- Metadata chuyên sâu: Tự động nhúng thể loại, tác giả, mô tả và ảnh bìa vào file EPUB để quản lý dễ dàng trên Calibre.
- Logging chuyên nghiệp: Hệ thống log có cấu trúc với
Loguru, hỗ trợ chế độ--verboseđể debug chi tiết.
Cài đặt
Cách đơn giản nhất là cài đặt trực tiếp từ PyPI:
pip install vvr-scraper
Sau khi cài đặt, bạn cần cài đặt trình duyệt cho Playwright:
playwright install chromium-headless-shell
Yêu cầu: Python 3.8 trở lên.
Cách sử dụng
Sau khi cài đặt qua pip, bạn có thể sử dụng lệnh vvrt từ bất kỳ đâu:
1. Chế độ tương tác (Khuyên dùng)
Chỉ cần gõ lệnh và làm theo hướng dẫn trên màn hình:
vvrt
2. Chế độ dòng lệnh (CLI)
Dành cho người dùng nâng cao hoặc viết script tự động:
# Ví dụ: Tải truyện với định dạng EPUB, gộp tất cả chương, dùng 10 luồng tải
vvrt "ten-truyen-slug" -f EPUB -g tatca -t 10 --khong-minh-hoa
Các tham số chính:
-f, --format: Định dạng đầu ra (PDF, EPUB, HTML, MD, TXT).-g, --gop: Cách gộp file (rieng,volume,tatca).-t, --tasks: Số lượng tác vụ song song (mặc định là 5).--login: Mở trình duyệt để đăng nhập thủ công/vượt Cloudflare.--verbose: Hiển thị log chi tiết để theo dõi quá trình.
Xử lý Cloudflare và Đăng nhập
Dự án hỗ trợ chế độ Session Capture để vượt qua các biện pháp bảo vệ của website:
- Chạy lệnh với cờ
--login. - Một trình duyệt thực sẽ mở ra, bạn thực hiện đăng nhập hoặc giải Cloudflare.
- Khi thấy nội dung truyện đã hiện ra, quay lại terminal và nhấn Enter.
- Session sẽ được lưu vào
.vvr_session.jsonvà tự động sử dụng cho các lần sau.
Lưu ý
- Bản quyền: Hãy tôn trọng quyền tác giả và chỉ sử dụng nội dung tải về cho mục đích lưu trữ cá nhân.
- Lỗi tải: Các chương gặp lỗi sẽ được ghi nhận vào file
cac_chuong_da_bo_qua.txttrong thư mục truyện. - Font chữ: Font hỗ trợ tiếng Việt (DejaVuSans, NotoSerif) sẽ được tự động tải xuống nếu máy bạn chưa có khi xuất file PDF.
Giấy phép
Dự án được phát hành dưới Giấy phép MIT.
Liên hệ
- Email: notthanhtung@gmail.com
- Issue: Mở issue trên GitHub repository nếu bạn gặp lỗi hoặc có ý tưởng mới.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file vvr_scraper-1.1.2.tar.gz.
File metadata
- Download URL: vvr_scraper-1.1.2.tar.gz
- Upload date:
- Size: 28.3 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.13.12
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
39c29bd475d461e8bb3e37c9b680535687dbade7ffdc0eabb0ca620cba7dbb67
|
|
| MD5 |
169812f6a5014eccb084fb7d9df0e929
|
|
| BLAKE2b-256 |
f31807c68fdd7e7e2ae008375feb24f036c0c5b60663d1c63b1a97a5e931f9ce
|
File details
Details for the file vvr_scraper-1.1.2-py3-none-any.whl.
File metadata
- Download URL: vvr_scraper-1.1.2-py3-none-any.whl
- Upload date:
- Size: 24.3 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.13.12
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
394e2f02e2a1caa470613fe425411504a6e09707fba2675a3a549b4d9cd9ad34
|
|
| MD5 |
c4ac393094125fd35c7262a8f4cca514
|
|
| BLAKE2b-256 |
ba992386b3611ab5db9414b534e7bb9b356ddd616ee0f791b4df17a19813e909
|