Skip to main content

Công cụ tải truyện CỰC ĐỘC ĐÁO từ Valvrareteam.net

Project description

Valvrare Team Web Novel Scraper (VVR-Scraper)

Hệ thống tự động hóa khai thác và chuyển đổi nội dung từ Valvrare Team sang các định dạng đa phương tiện (Ebook, Audiobook, Cinematic Video).

🚀 Tính năng chính

  • Hybrid Scraping: Kết hợp HTTPX (Fast mode via SSR Proxy) và Playwright (Reliable mode) để vượt rào cản kỹ thuật và trích xuất nội dung chính xác.
  • Đa định dạng xuất bản:
    • Ebooks: EPUB (với cấu trúc Volume/Chapter), PDF, HTML, Markdown, TXT.
    • Audiobook: Chuyển đổi văn bản thành giọng nói (TTS) chất lượng cao sử dụng ElevenLabs.
    • Audio Drama (v2.5): Tự động phân tích kịch bản bằng OpenAI, gán giọng nhân vật, chèn nhạc nền (BGM) và hiệu ứng âm thanh (SFX) từ Freesound.
    • Cinematic Video (MP4): Kết xuất video với hiệu ứng chuyển cảnh, Ken Burns, VFX và đồng bộ phụ đề Karaoke chính xác từng mili giây.
  • Cinema Player: Trình phát web tích hợp cho phép trải nghiệm nội dung Cinematic ngay trên trình duyệt.
  • Personal OPDS Server: Cung cấp feed sách chuẩn OPDS 1.1 để kết nối trực tiếp với các ứng dụng đọc sách (Moon+ Reader, KyBook, v.v.).
  • Job Orchestrator: Hệ thống hàng đợi (Queue) và Task Runner mạnh mẽ, hỗ trợ tự động hóa việc theo dõi và tải chương mới.

🛠 Yêu cầu hệ thống

  • Python: 3.10+
  • Công cụ bổ trợ:
    • FFmpeg: Bắt buộc để xử lý âm thanh và kết xuất video.
    • Playwright: Cần thiết cho chế độ Reliable Scraping và Video Rendering.
  • API Keys:
    • OPENAI_API_KEY: Dùng cho AI Director (phân tích kịch bản và sinh ảnh).
    • ELEVENLABS_API_KEY: Dùng cho giọng đọc AI chất lượng cao.
    • FREESOUND_API_KEY: Dùng để tìm kiếm nhạc nền và hiệu ứng.

📦 Cài đặt

Cách đơn giản nhất là cài đặt trực tiếp từ PyPI:

# Sử dụng uv (Khuyến nghị)
uv pip install vvr-scraper

# Hoặc sử dụng pip truyền thống
pip install vvr-scraper

# Cài đặt Playwright browsers (Bắt buộc cho chế độ Reliable mode và Video Render)
playwright install chromium

Cài đặt từ mã nguồn (Dành cho nhà phát triển)

Nếu bạn muốn đóng góp hoặc sử dụng phiên bản mới nhất từ Git:

git clone https://github.com/your-repo/valvrareteam-net-crawler.git
cd valvrareteam-net-crawler
uv pip install -e .
playwright install chromium

⚙️ Cấu hình

Tạo file .env hoặc thiết lập biến môi trường:

# API Keys
OPENAI_API_KEY=your_openai_key
ELEVENLABS_API_KEY=your_elevenlabs_key
FREESOUND_CLIENT_ID=your_id
FREESOUND_CLIENT_SECRET=your_secret

# Tùy chọn (Optional)
VVR_SSR_URL=val-ssr-2kzit.ondigitalocean.app
VVR_OPDS_USER=admin
VVR_OPDS_PASS=password

📖 Hướng dẫn sử dụng

CLI (Command Line Interface)

Sử dụng lệnh vvrt để thực hiện các tác vụ:

# Lấy sơ đồ cây của một truyện
vvrt tree https://valvrareteam.net/truyen/ten-truyen

# Tải và xuất định dạng EPUB
vvrt crawl https://valvrareteam.net/truyen/ten-truyen -f EPUB

# Tạo Audio Drama cho một chương
vvrt crawl <url_chuong> -f AD-MP3

# Render video Cinematic
vvrt crawl <url_chuong> -f MP4

Web UI & OPDS

Khởi chạy máy chủ web:

vvrt serve --port 8000
  • Giao diện quản lý: http://localhost:8000
  • OPDS Feed: http://localhost:8000/opds/v1/root
  • Cinema Player: Truy cập qua API hoặc giao diện web.

Job Runner

Chạy các tác vụ hàng loạt qua manifest JSON:

vvrt run manifest.json

🏗 Kiến trúc dự án

  • vvr_scraper/scraper_core.py: Lõi xử lý trích xuất dữ liệu.
  • vvr_scraper/exporter.py: Chuyển đổi dữ liệu sang các định dạng đích.
  • vvr_scraper/audio_drama.py: Logic AI Director và quản lý âm thanh.
  • vvr_scraper/video_renderer.py: Kết xuất MP4 sử dụng Playwright và FFmpeg.
  • vvr_scraper/db.py: Quản lý SQLite với cơ chế an toàn async.
  • vvr_scraper/web.py: API Server (FastAPI) và OPDS.

🛡 Bảo mật và Quy định

Dự án này được tạo ra cho mục đích học tập và lưu trữ cá nhân. Vui lòng tôn trọng bản quyền của dịch giả và tác giả. Không sử dụng công cụ này để thực hiện các hành vi gây hại đến máy chủ của Valvrare Team.


© 2024 VVR-Scraper Team.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

vvr_scraper-1.9.0.tar.gz (134.1 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

vvr_scraper-1.9.0-py3-none-any.whl (101.5 kB view details)

Uploaded Python 3

File details

Details for the file vvr_scraper-1.9.0.tar.gz.

File metadata

  • Download URL: vvr_scraper-1.9.0.tar.gz
  • Upload date:
  • Size: 134.1 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.11.15

File hashes

Hashes for vvr_scraper-1.9.0.tar.gz
Algorithm Hash digest
SHA256 b3febce60e0a6a06e859c3278828320e39364bf60277f904b4fbec0d77802cf3
MD5 6affe2eae0d96d3cb8f3b50189b58497
BLAKE2b-256 98e9e3eac53e59d9c8c680bcc2a7450fc058812638d9b2d8f16983a190248992

See more details on using hashes here.

File details

Details for the file vvr_scraper-1.9.0-py3-none-any.whl.

File metadata

  • Download URL: vvr_scraper-1.9.0-py3-none-any.whl
  • Upload date:
  • Size: 101.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.11.15

File hashes

Hashes for vvr_scraper-1.9.0-py3-none-any.whl
Algorithm Hash digest
SHA256 eb40d436ca2e4337a5ef2babf5e8699742785d944e0757c8fa728fc09cb53ea4
MD5 1bbfa4060348db0f2aed51a1a4901515
BLAKE2b-256 8d714d75ee1f058843aca548dbc5123a883491c3efda5c52dd568b150cb3b53f

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page