Skip to main content

Python API For JMComic (禁漫天堂)

Project description

Python API For JMComic (禁漫天堂)

本项目封装了一套可用于爬取JM的Python API.

你可以通过简单的几行Python代码,实现下载JM上的本子到本地,并且是处理好的图片。

【指路】教程:使用GitHub Actions下载禁漫本子

【指路】教程:导出并下载你的禁漫收藏夹数据

友情提示:珍爱JM,为了减轻JM的服务器压力,请不要一次性爬取太多本子,西门🙏🙏🙏.

项目介绍

本项目的核心功能是下载本子,基于此,设计了一套方便使用、便于扩展,能满足一些特殊下载需求的框架。

目前核心功能实现较为稳定,项目也处于维护阶段。

除了下载功能以外,也实现了其他的一些禁漫接口,按需实现,具体如下。

已实现的禁漫API:

  • 登录
  • 搜本
  • 分类 (排行榜)
  • 本子章节详情
  • 图片下载解码
  • 收藏夹
  • 移动端接口加解密

安装教程

  • 通过pip官方源安装(推荐,并且更新也是这个命令)

    pip install jmcomic -i https://pypi.org/project -U
    
  • 通过源代码安装

    pip install git+https://github.com/hect0x7/JMComic-Crawler-Python
    

快速上手

1. 下载本子方法

只需要使用如下代码,就可以下载本子JM422866的所有章节的图片:

import jmcomic  # 导入此模块,需要先安装.
jmcomic.download_album('422866')  # 传入要下载的album的id,即可下载整个album到本地.

上面的 download_album方法还有一个参数option,可用于控制下载配置,配置包括禁漫域名、网络代理、图片格式转换、插件等等。

你可能需要这些配置项。推荐使用配置文件创建option,用option下载本子,见下章:

2. 使用option配置来下载本子

  1. 首先,创建一个配置文件,假设文件名为 option.yml

    该文件有特定的写法,你需要参考这个文档 → option配置

    下面做一个演示,假设你需要把下载的图片转为png格式,你应该把以下内容写进option.yml

download:
  image:
    suffix: .png # 该配置用于把下载的图片转为png格式
  1. 第二步,运行下面的python代码
import jmcomic

# 创建配置对象
option = jmcomic.create_option_by_file('你的配置文件路径,例如 D:/option.yml')
# 使用option对象来下载本子
jmcomic.download_album(422866, option)

进阶使用

文档网站:jmcomic.readthedocs.io

首先,就下载功能,jmcomic提供了很多配置项,大部分的下载需求你都可以通过上文介绍的配置文件来配置。

如果你不满足于下载,还有其他的使用需求,推荐你先看看以下文档:

项目特点

  • 绕过Cloudflare的反爬虫

  • 实现禁漫APP接口最新的加解密算法 (1.6.3)

  • 用法多样:

  • 支持网页端移动端两种客户端实现,可通过配置切换(移动端不限ip兼容性好,网页端限制ip地区但效率高

  • 支持自动重试和域名切换机制

  • 多线程下载(可细化到一图一线程,效率极高)

  • 可配置性强

    • 不配置也能使用,十分方便
    • 配置可以从配置文件生成,支持多种文件格式
    • 配置点有:请求域名 客户端实现 是否使用磁盘缓存 同时下载的章节/图片数量 图片格式转换 下载路径规则 请求元信息(headers,cookies,proxies)
  • 可扩展性强

    • 支持自定义本子/章节/图片下载前后的回调函数
    • 支持自定义类:Downloader(负责调度) Option(负责配置) Client(负责请求) 实体类
    • 支持自定义日志、异常监听器
    • 支持Plugin插件,可以方便地扩展功能,以及使用别人的插件,目前内置插件有
      • 登录插件
      • 硬件占用监控插件
      • 只下载新章插件
      • 压缩文件插件
      • 下载特定后缀图片插件
      • 发送QQ邮件插件
      • 日志主题过滤插件
      • 自动使用浏览器cookies插件
      • jpg图片合成为一个pdf插件
      • 导出收藏夹为csv文件插件

使用小说明

  • Python >= 3.7
  • 个人项目,文档和示例会有不及时之处,可以Issue提问

项目文件夹介绍

  • .github:GitHub Actions配置文件

  • assets:存放一些非代码的资源文件

    • docs:项目文档
    • option:存放配置文件
  • src:存放源代码

    • jmcomic:jmcomic模块
  • tests:测试目录,存放测试代码,使用unittest

  • usage:用法目录,存放示例/使用代码

感谢以下项目

图片分割算法代码+禁漫移动端API

Readme Card

Project details


Release history Release notifications | RSS feed

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

jmcomic-2.5.14.tar.gz (62.0 kB view details)

Uploaded Source

Built Distribution

jmcomic-2.5.14-py3-none-any.whl (65.7 kB view details)

Uploaded Python 3

File details

Details for the file jmcomic-2.5.14.tar.gz.

File metadata

  • Download URL: jmcomic-2.5.14.tar.gz
  • Upload date:
  • Size: 62.0 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.0.0 CPython/3.12.4

File hashes

Hashes for jmcomic-2.5.14.tar.gz
Algorithm Hash digest
SHA256 051008bed0953e7dfc592b4454cbe2509b80d75658f6f5cdd54b5d7c8bf1d3cd
MD5 7bfc738fbd34c00b321c767834cf2194
BLAKE2b-256 e8f0647d36fb88f0cfc555d08356723a7e6f8fc06359cf5f0943f15ee5e53f41

See more details on using hashes here.

File details

Details for the file jmcomic-2.5.14-py3-none-any.whl.

File metadata

  • Download URL: jmcomic-2.5.14-py3-none-any.whl
  • Upload date:
  • Size: 65.7 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/5.0.0 CPython/3.12.4

File hashes

Hashes for jmcomic-2.5.14-py3-none-any.whl
Algorithm Hash digest
SHA256 fe9022b2bd850dee470ed1e81da90f6567b804ed75720704ddd32e2e2d9c2242
MD5 c8d815d507255512096263702d269c41
BLAKE2b-256 d1ec75c2d958852a355a59b9b06a201ae1081d10f7e086e78f694241eeaea7ba

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page