Skip to main content

Python API For JMComic (禁漫天堂)

Project description

Python API For JMComic (禁漫天堂)

本项目封装了一套可用于爬取JM的Python API.

你可以通过简单的几行Python代码,实现下载JM上的本子到本地,并且是处理好的图片。

【指路】教程:使用GitHub Actions下载禁漫本子

【指路】教程:导出并下载你的禁漫收藏夹数据

友情提示:珍爱JM,为了减轻JM的服务器压力,请不要一次性爬取太多本子,西门🙏🙏🙏.

项目介绍

本项目的核心功能是下载本子,基于此,设计了一套方便使用、便于扩展,能满足一些特殊下载需求的框架。

目前核心功能实现较为稳定,项目也处于维护阶段。

除了下载功能以外,也实现了其他的一些禁漫接口,按需实现,具体如下。

已实现的禁漫API:

  • 登录
  • 搜本
  • 分类 (排行榜)
  • 本子章节详情
  • 图片下载解码
  • 收藏夹
  • 移动端接口加解密

安装教程

  • 通过pip官方源安装(推荐,并且更新也是这个命令)

    pip install jmcomic -i https://pypi.org/project -U
    
  • 通过源代码安装

    pip install git+https://github.com/hect0x7/JMComic-Crawler-Python
    

快速上手

1. 下载本子方法

只需要使用如下代码,就可以下载本子JM422866的所有章节的图片:

import jmcomic  # 导入此模块,需要先安装.
jmcomic.download_album('422866')  # 传入要下载的album的id,即可下载整个album到本地.

上面的 download_album方法还有一个参数option,可用于控制下载配置,配置包括禁漫域名、网络代理、图片格式转换、插件等等。

你可能需要这些配置项。推荐使用配置文件创建option,用option下载本子,见下章:

2. 使用option配置来下载本子

  1. 首先,创建一个配置文件,假设文件名为 option.yml

    该文件有特定的写法,你需要参考这个文档 → option配置

    下面做一个演示,假设你需要把下载的图片转为png格式,你应该把以下内容写进option.yml

download:
  image:
    suffix: .png # 该配置用于把下载的图片转为png格式
  1. 第二步,运行下面的python代码
import jmcomic

# 创建配置对象
option = jmcomic.create_option_by_file('你的配置文件路径,例如 D:/option.yml')
# 使用option对象来下载本子
jmcomic.download_album(422866, option)

进阶使用

文档网站:jmcomic.readthedocs.io

首先,就下载功能,jmcomic提供了很多配置项,大部分的下载需求你都可以通过上文介绍的配置文件来配置。

如果你不满足于下载,还有其他的使用需求,推荐你先看看以下文档:

项目特点

  • 绕过Cloudflare的反爬虫

  • 实现禁漫APP接口最新的加解密算法 (1.6.3)

  • 用法多样:

  • 支持网页端移动端两种客户端实现,可通过配置切换(移动端不限ip兼容性好,网页端限制ip地区但效率高

  • 支持自动重试和域名切换机制

  • 多线程下载(可细化到一图一线程,效率极高)

  • 可配置性强

    • 不配置也能使用,十分方便
    • 配置可以从配置文件生成,支持多种文件格式
    • 配置点有:请求域名 客户端实现 是否使用磁盘缓存 同时下载的章节/图片数量 图片格式转换 下载路径规则 请求元信息(headers,cookies,proxies)
  • 可扩展性强

    • 支持自定义本子/章节/图片下载前后的回调函数
    • 支持自定义类:Downloader(负责调度) Option(负责配置) Client(负责请求) 实体类
    • 支持自定义日志、异常监听器
    • 支持Plugin插件,可以方便地扩展功能,以及使用别人的插件,目前内置插件有
      • 登录插件
      • 硬件占用监控插件
      • 只下载新章插件
      • 压缩文件插件
      • 下载特定后缀图片插件
      • 发送QQ邮件插件
      • 日志主题过滤插件
      • 自动使用浏览器cookies插件
      • jpg图片合成为一个pdf插件
      • 导出收藏夹为csv文件插件

使用小说明

  • Python >= 3.7
  • 个人项目,文档和示例会有不及时之处,可以Issue提问

项目文件夹介绍

  • .github:GitHub Actions配置文件

  • assets:存放一些非代码的资源文件

    • docs:项目文档
    • option:存放配置文件
  • src:存放源代码

    • jmcomic:jmcomic模块
  • tests:测试目录,存放测试代码,使用unittest

  • usage:用法目录,存放示例/使用代码

感谢以下项目

图片分割算法代码+禁漫移动端API

Readme Card

Project details


Release history Release notifications | RSS feed

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

jmcomic-2.5.12.tar.gz (61.4 kB view details)

Uploaded Source

Built Distribution

jmcomic-2.5.12-py3-none-any.whl (65.2 kB view details)

Uploaded Python 3

File details

Details for the file jmcomic-2.5.12.tar.gz.

File metadata

  • Download URL: jmcomic-2.5.12.tar.gz
  • Upload date:
  • Size: 61.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.0.0 CPython/3.12.3

File hashes

Hashes for jmcomic-2.5.12.tar.gz
Algorithm Hash digest
SHA256 4869225fc6c47ea995e9c050789534df425cda610a60d62d5edc5988420fb662
MD5 1c79f3e4b48b28741b85c49e3125f954
BLAKE2b-256 b343c291369f974851711b430662d79cc0d3aa4276705de5c660abe0085433c7

See more details on using hashes here.

File details

Details for the file jmcomic-2.5.12-py3-none-any.whl.

File metadata

  • Download URL: jmcomic-2.5.12-py3-none-any.whl
  • Upload date:
  • Size: 65.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.0.0 CPython/3.12.3

File hashes

Hashes for jmcomic-2.5.12-py3-none-any.whl
Algorithm Hash digest
SHA256 32bdbe425da79555593fe337bf0133c93f978b90f91ef4e60623f4d794f9e491
MD5 2cf5d0e9e40f5ba44946652a6678a96b
BLAKE2b-256 f4539e53087ca02b1b34d3cec2f901a04b90e0541d9093eccbbac4cdb8da6408

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page