Skip to main content

A Django application for managing Scrapyd nodes, projects, spiders and jobs

Project description

DjangoScrapydManager

DjangoScrapydManager 是一个用于管理 Scrapyd 节点的 Django 应用,提供了对 Scrapyd 节点、项目、版本、爬虫和任务的完整管理功能。

功能特性

  • 节点管理:添加、编辑和删除 Scrapyd 节点,支持认证和 SSL
  • 项目管理:查看和管理 Scrapyd 上的项目
  • 版本管理:查看、部署和删除项目版本
  • 爬虫管理:查看爬虫信息,支持爬虫分组
  • 任务管理:启动、停止爬虫任务,查看任务状态和日志
  • 数据同步:自动同步 Scrapyd 节点上的项目、版本、爬虫和任务信息
  • 爬虫组管理:自定义爬虫组, 一次启动多个爬虫
  • 监控job:监控爬虫组状态, 自动重启爬虫

技术栈

  • Python 3.13+
  • Django 5.2.5+
  • Requests 2.32.4+

安装方法

INSTALLED_APPS = [
    "django_scrapyd_manager"
]

使用方法

1. 添加 Scrapyd 节点

首先需要添加一个 Scrapyd 节点,包括节点名称、IP 地址、端口等信息。如果 Scrapyd 服务需要认证,可以勾选 "需要认证" 并填写用户名和密码。

2. 同步项目信息

添加节点后,系统会自动同步该节点上的项目、版本和爬虫信息。

3. 管理爬虫任务

  • 启动爬虫:选择一个爬虫,点击 "启动" 按钮即可启动爬虫任务
  • 停止爬虫:可以停止单个任务或某个爬虫的所有任务
  • 创建爬虫组:可以将多个爬虫添加到一个组中,方便批量管理

4. 查看任务状态

系统会定期同步任务状态,您可以在任务列表中查看任务的运行状态、开始时间、结束时间等信息。

核心模型

Node

表示一个 Scrapyd 节点,包含节点名称、IP 地址、端口、认证信息等。

Project

表示 Scrapyd 上的一个项目,属于某个节点。

ProjectVersion

表示项目的一个版本,可以包含多个爬虫。

Spider

表示一个爬虫,属于某个项目版本。

SpiderGroup

表示一组爬虫,可以批量管理多个爬虫。

Job

表示一个爬虫任务,记录任务的状态、开始时间、结束时间等信息。

注意事项

  1. 请确保 Scrapyd 服务已经正确安装并运行
  2. 对于需要认证的 Scrapyd 服务,请正确配置认证信息
  3. 系统会定期同步数据,也可以手动触发同步
  4. 部署新版本时,需要提供正确的 egg 文件路径

下个版本规划

  • Guardian 信号机制

    • 在项目发布版本时发送 pre_publish / post_publish 信号
    • 在爬虫任务启动、结束时发送 pre_job_start / post_job_finish 信号
    • 方便外部系统监听并执行自定义逻辑(如通知、审计、自动化处理)
  • 任务指标展示

    • 在任务详情中展示类似 ScrapydWeb 的运行指标:
      • page_nums(已抓取页面数)
      • item_nums(已采集 item 数量)
    • 支持任务运行中实时刷新

贡献指南

欢迎提交 issue 和 pull request 来帮助改进这个项目。

许可证

MIT License

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

django_scrapyd_manager-0.2.2.tar.gz (27.2 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

django_scrapyd_manager-0.2.2-py3-none-any.whl (30.4 kB view details)

Uploaded Python 3

File details

Details for the file django_scrapyd_manager-0.2.2.tar.gz.

File metadata

File hashes

Hashes for django_scrapyd_manager-0.2.2.tar.gz
Algorithm Hash digest
SHA256 109f4808b43178832335c0637a94e3167e29a1fc086d6ef54303eb9eb4f26907
MD5 3c733a7b03a747870ae893feadf29449
BLAKE2b-256 70a30f26af68a03ef76cca3bbe33feb84394e62e1285fcfed0dee7032fd59c67

See more details on using hashes here.

File details

Details for the file django_scrapyd_manager-0.2.2-py3-none-any.whl.

File metadata

File hashes

Hashes for django_scrapyd_manager-0.2.2-py3-none-any.whl
Algorithm Hash digest
SHA256 94349dff6153e6df81cc1d468dc4537d9d8b325ae8fa4fc4ce1217dfe72459be
MD5 701b6e245ff2d049398e722f151d3de7
BLAKE2b-256 ed6c581911f5020e678c50fc7093f2da21699e50bd77383c8b859365a4dc6568

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page