quickly build your crawler
Project description
简介
Bricks
旨在将爬虫开发变得像搭建积木一样简单而有趣。这个框架的核心理念是提供一个直观、高效的方式来构建复杂的网络爬虫,同时保持代码的简洁和可维护性。无论您是刚入门的新手还是经验丰富的专家,Bricks
都能让您轻松地搭建起强大的爬虫,满足从简单数据抓取到复杂网络爬取的各种需求。
通过精心设计的接口和模块化的结构,Bricks
使得组合、扩展和维护爬虫变得前所未有的容易。您可以像搭积木一样,快速组合出适合您需求的爬虫结构,无需深入底层细节,同时也能享受到定制化和控制的乐趣。使用 Bricks
,您将体验到无与伦比的开发效率和灵活性,让爬虫开发不再是一件费时费力的任务。
特性
Bricks
拥有以下特性
- 基于事件触发拓展爬虫,在定义好自己爬虫主体逻辑的情况下,可以在不修改核心代码的情况下,在请求前后,存储前后等多个事件接口进行拓展,让爬虫流程更加清晰
- 多个爬虫基类,可以有纯代码是的
air
爬虫,还有流程化自定义的配置式form
爬虫,还有固定流程的配置式template
爬虫 - 丰富的解析器,包括
json
/xpath
/jsonpath
/regex
/json
/ 自定义,并且支持配置式书写解析规则 - 灵活可拓展的下载器,目前内置的下载器为
curl-cffi
,并且还有可选的requests
/requests-go
/pycurl
/Playwright
, 开发者可以根据规范自己定制下载器 - 灵活的调度器,调度器支持处理同步任务和异步任务,并且支持根据当前任务数量自动调节
Worker
数量 - 内置
Local
和Redis
两种任务队列,以便应用单机和分布式爬虫
安装
安装最新代码
pip install -U git+https://github.com/KKKKKKKEM/bricks.git
安装正式版
pip install -U bricks-py
使用文档
具体文档请查看 Bricks Docs
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
bricks-py-0.0.24.tar.gz
(128.1 kB
view details)
Built Distribution
bricks_py-0.0.24-py3-none-any.whl
(169.8 kB
view details)
File details
Details for the file bricks-py-0.0.24.tar.gz
.
File metadata
- Download URL: bricks-py-0.0.24.tar.gz
- Upload date:
- Size: 128.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.1 CPython/3.8.18
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 9de08895d167768a4aab49603c9ed7e5b1a1e42d6190955689c76c05c6f2488e |
|
MD5 | 9bb4359b12b4ffe646c7b4292105f313 |
|
BLAKE2b-256 | 1ffaf7a4e634ee7db282416465d71e2f50f30e9dabb027756b52418cb4ecd3f1 |
File details
Details for the file bricks_py-0.0.24-py3-none-any.whl
.
File metadata
- Download URL: bricks_py-0.0.24-py3-none-any.whl
- Upload date:
- Size: 169.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.1 CPython/3.8.18
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 93af92dbc66229a563775b04800fcc72f812fbc5e68142a79be474a579ed6ff8 |
|
MD5 | fb3d813f7cb5a1b9288ffb1651672fe6 |
|
BLAKE2b-256 | 31d75eb6a0d1ca372d907cfe1d1058202262e2f3fe524ba2415eca180786dcf7 |