Skip to main content

Công cụ tải truyện CỰC ĐỘC ĐÁO từ Valvrareteam.net

Project description

Valvrare Team Web Novel Scraper (VVR-Scraper)

Hệ thống tự động hóa khai thác và chuyển đổi nội dung từ Valvrare Team sang các định dạng đa phương tiện (Ebook, Audiobook, Cinematic Video).

🚀 Tính năng chính

  • Hybrid Scraping: Kết hợp HTTPX (Fast mode via SSR Proxy) và Playwright (Reliable mode) để vượt rào cản kỹ thuật và trích xuất nội dung chính xác.
  • Đa định dạng xuất bản:
    • Ebooks: EPUB (với cấu trúc Volume/Chapter), PDF, HTML, Markdown, TXT.
    • Audiobook: Chuyển đổi văn bản thành giọng nói (TTS) chất lượng cao sử dụng ElevenLabs.
    • Audio Drama (v2.5): Tự động phân tích kịch bản bằng OpenAI, gán giọng nhân vật, chèn nhạc nền (BGM) và hiệu ứng âm thanh (SFX) từ Freesound.
    • Cinematic Video (MP4): Kết xuất video với hiệu ứng chuyển cảnh, Ken Burns, VFX và đồng bộ phụ đề Karaoke chính xác từng mili giây.
  • Cinema Player: Trình phát web tích hợp cho phép trải nghiệm nội dung Cinematic ngay trên trình duyệt.
  • Personal OPDS Server: Cung cấp feed sách chuẩn OPDS 1.1 để kết nối trực tiếp với các ứng dụng đọc sách (Moon+ Reader, KyBook, v.v.).
  • Job Orchestrator: Hệ thống hàng đợi (Queue) và Task Runner mạnh mẽ, hỗ trợ tự động hóa việc theo dõi và tải chương mới.

🛠 Yêu cầu hệ thống

  • Python: 3.10+
  • Công cụ bổ trợ:
    • FFmpeg: Bắt buộc để xử lý âm thanh và kết xuất video.
    • Playwright: Cần thiết cho chế độ Reliable Scraping và Video Rendering.
  • API Keys:
    • OPENAI_API_KEY: Dùng cho AI Director (phân tích kịch bản và sinh ảnh).
    • ELEVENLABS_API_KEY: Dùng cho giọng đọc AI chất lượng cao.
    • FREESOUND_API_KEY: Dùng để tìm kiếm nhạc nền và hiệu ứng.

📦 Cài đặt

Cách đơn giản nhất là cài đặt trực tiếp từ PyPI:

# Sử dụng uv (Khuyến nghị)
uv pip install vvr-scraper

# Hoặc sử dụng pip truyền thống
pip install vvr-scraper

# Cài đặt Playwright browsers (Bắt buộc cho chế độ Reliable mode và Video Render)
playwright install chromium

Cài đặt từ mã nguồn (Dành cho nhà phát triển)

Nếu bạn muốn đóng góp hoặc sử dụng phiên bản mới nhất từ Git:

git clone https://github.com/your-repo/valvrareteam-net-crawler.git
cd valvrareteam-net-crawler
uv pip install -e .
playwright install chromium

⚙️ Cấu hình

Tạo file .env hoặc thiết lập biến môi trường:

# API Keys
OPENAI_API_KEY=your_openai_key
ELEVENLABS_API_KEY=your_elevenlabs_key
FREESOUND_CLIENT_ID=your_id
FREESOUND_CLIENT_SECRET=your_secret

# Tùy chọn (Optional)
VVR_SSR_URL=val-ssr-2kzit.ondigitalocean.app
VVR_OPDS_USER=admin
VVR_OPDS_PASS=password

📖 Hướng dẫn sử dụng

CLI (Command Line Interface)

Sử dụng lệnh vvrt để thực hiện các tác vụ:

# Lấy sơ đồ cây của một truyện
vvrt tree https://valvrareteam.net/truyen/ten-truyen

# Tải và xuất định dạng EPUB
vvrt ten-truyen-slug -f EPUB

# Tạo Audio Drama cho một chương
vvrt ten-truyen-slug -f AD-MP3

# Render video Cinematic
vvrt ten-truyen-slug -f MP4

Web UI & OPDS

Khởi chạy máy chủ web:

vvrt web --port 8000
  • Giao diện quản lý: http://localhost:8000
  • OPDS Feed: http://localhost:8000/opds/v1/root
  • Cinema Player: Truy cập qua API hoặc giao diện web.

Job Runner

Chạy các tác vụ hàng loạt qua manifest JSON:

vvrt run manifest.json

🏗 Kiến trúc dự án

  • vvr_scraper/scraper_core.py: Lõi xử lý trích xuất dữ liệu.
  • vvr_scraper/exporter.py: Chuyển đổi dữ liệu sang các định dạng đích.
  • vvr_scraper/audio_drama.py: Logic AI Director và quản lý âm thanh.
  • vvr_scraper/video_renderer.py: Kết xuất MP4 sử dụng Playwright và FFmpeg.
  • vvr_scraper/db.py: Quản lý SQLite với cơ chế an toàn async.
  • vvr_scraper/web.py: API Server (FastAPI) và OPDS.

🛡 Bảo mật và Quy định

Dự án này được tạo ra cho mục đích học tập và lưu trữ cá nhân. Vui lòng tôn trọng bản quyền của dịch giả và tác giả. Không sử dụng công cụ này để thực hiện các hành vi gây hại đến máy chủ của Valvrare Team.


© 2024 VVR-Scraper Team.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

vvr_scraper-1.10.0.tar.gz (140.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

vvr_scraper-1.10.0-py3-none-any.whl (103.7 kB view details)

Uploaded Python 3

File details

Details for the file vvr_scraper-1.10.0.tar.gz.

File metadata

  • Download URL: vvr_scraper-1.10.0.tar.gz
  • Upload date:
  • Size: 140.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.11.15

File hashes

Hashes for vvr_scraper-1.10.0.tar.gz
Algorithm Hash digest
SHA256 e6b16958f425d4620ada79fea217df05fe7aa122d1e03fbd8e6520f41b390bf1
MD5 779a75a75a073c5eb50af0449a0dc572
BLAKE2b-256 dc9900d50e4a94c85dcdac6e02d0b82bdaf4410635e8e51de306567a72bd6e9c

See more details on using hashes here.

File details

Details for the file vvr_scraper-1.10.0-py3-none-any.whl.

File metadata

  • Download URL: vvr_scraper-1.10.0-py3-none-any.whl
  • Upload date:
  • Size: 103.7 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.11.15

File hashes

Hashes for vvr_scraper-1.10.0-py3-none-any.whl
Algorithm Hash digest
SHA256 4b346285d7c7ec868d9e194e7f99b1c133f0c990757186606c7a04bc000645b5
MD5 6ddf731b5f09acffd35f9be2601b1be4
BLAKE2b-256 5972c6d39e5e6736588c12f9e7e581dc707770aa47abf8441cb3c7ff2f67b1fe

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page