Cloudflare Workers proxy IP pool client with stealth mode, anti-detection, async, HTTP/2, TLS fingerprint, browser, mirror and IP map

These details have not been verified by PyPI

Project links

Project description

CFspider

基于 Cloudflare Workers 的代理 IP 池，使用 Cloudflare 全球边缘节点 IP 作为代理出口。

代理方案对比

代理方案	价格	IP 质量	速度	稳定性	IP 数量	反爬能力
CFspider (Workers)	免费	企业级	极快	99.9%	300+ 节点	强
直接爬取 CF CDN IP	免费	无法使用	-	无法连接	理论很多	无
住宅代理 / 家庭代理	$5-15/GB	极高	中等	中等	百万+	极强
数据中心代理	$1-5/月	中等	快	高	有限	中等
免费公共代理	免费	极差	慢	<10%	数千	弱
VPN 服务	$3-12/月	中等	中等	高	数十服务器	中等
自建代理服务器	$5-50/月	取决于IP	快	高	1个	弱

各方案详解

直接爬取 Cloudflare CDN IP

Cloudflare CDN IP（如 172.64.x.x、104.21.x.x）是 Anycast IP
无法直接作为 HTTP/SOCKS5 代理使用
即使扫描出在线 IP，也无法建立代理连接
CDN IP 仅用于边缘加速，不提供代理服务

住宅代理 / 家庭代理

使用真实家庭网络 IP，反爬能力最强
价格昂贵，按流量计费（$5-15/GB）
部分服务存在合规风险
适合对匿名性要求极高的商业爬虫场景

数据中心代理

速度快、价格适中
IP 容易被识别为机房 IP
被大型网站封禁概率较高
适合目标网站防护较弱的场景

免费公共代理

完全免费但质量极差
可用率通常低于 10%
速度慢、不稳定
存在安全风险（可能被中间人攻击）

CFspider 优势

利用 Cloudflare Workers 的边缘计算能力
请求从 Cloudflare 300+ 全球节点发出
IP 是 Cloudflare 企业级 IP（与大量正常网站共用）
不易被封禁，且完全免费
Workers 免费版每日 100,000 请求

核心优势

企业级 IP 信誉

Cloudflare IP (AS13335) 被全球数百万网站使用，包括 Discord、Shopify、Medium 等知名服务。这些 IP 拥有极高的信誉度，不会像普通代理 IP 那样被轻易封禁。

零成本运营

Cloudflare Workers 免费版每日 100,000 请求，无需信用卡，无需付费。相比住宅代理每月数百美元的费用，这是真正的零成本方案。

全球边缘网络

请求自动路由到离目标网站最近的 Cloudflare 边缘节点。全球 100+ 个国家，300+ 个数据中心，确保最低延迟。

Serverless 无服务器

无需购买服务器、无需运维、无需担心扩容。Cloudflare 自动处理所有基础设施，冷启动时间接近零毫秒。

数据完全可控

代码部署在你自己的 Cloudflare 账户，请求日志、访问数据完全由你掌控。100% 的隐私和控制权。

企业级安全

所有请求自动享受 Cloudflare 的 DDoS 防护、WAF 防火墙、SSL/TLS 加密。

适用场景

场景	说明
数据采集 / 爬虫	采集公开数据时避免 IP 被封禁，适合新闻聚合、价格监控、市场调研
SEO 监控	从不同地理位置检查搜索引擎排名、网站可访问性
网站可用性测试	从全球各地测试网站的响应时间和可用性
API 聚合服务	调用多个第三方 API 时隐藏真实服务器 IP
内容验证	验证 CDN 缓存、检查不同地区的内容分发
学术研究	网络研究、互联网测量、安全研究等学术项目

技术架构

+------------------+      +----------------------+      +------------------+
|                  |      |   Cloudflare Edge    |      |                  |
|   Your Python    | ---> |   Workers (300+)     | ---> |   Target Website |
|   Application    |      |   Global Nodes       |      |                  |
|                  |      +----------------------+      +------------------+
+------------------+              |
        |                         v
        v                 +----------------------+
+------------------+      |  Cloudflare IP Pool  |
|   cfspider lib   |      |  172.64.x.x          |
|   requests-like  |      |  104.21.x.x          |
+------------------+      |  162.159.x.x  ...    |
                          +----------------------+

工作流程：

你的应用调用 cfspider.get(url, cf_proxies="workers.dev")
CFspider 发送请求到你的 Cloudflare Workers
Workers 从最近的边缘节点获取目标 URL
响应返回，目标网站看到的是 Cloudflare IP，而不是你的 IP

特性

使用 Cloudflare 全球 300+ 边缘节点 IP
与 requests 库语法一致，无学习成本
支持 GET、POST、PUT、DELETE 等所有 HTTP 方法
支持 Session 会话管理
返回 Cloudflare 节点信息（cf_colo、cf_ray）
支持浏览器模式，可渲染 JavaScript 动态页面、截图、自动化操作
支持多种代理方式：HTTP 代理、SOCKS5 代理、VLESS 链接（支持直接填写完整链接）
支持异步请求（基于 httpx），可使用 async/await 语法
支持 HTTP/2 协议，更快的连接复用和性能
支持流式响应，高效处理大文件下载
支持 TLS 指纹模拟（基于 curl_cffi），可模拟 Chrome/Safari/Firefox/Edge 浏览器指纹
支持 IP 地图可视化（基于 MapLibre GL），生成 HTML 地图文件，显示代理 IP 地理位置
支持网页镜像（基于 Playwright + BeautifulSoup），一键保存完整网页到本地，自动下载所有资源
支持隐身模式：自动添加完整浏览器请求头（Sec-Fetch-、Accept- 等 15+ 个头）
支持会话一致性（StealthSession）：保持 User-Agent 和 Cookie 一致，模拟真实用户
支持行为模拟：请求随机延迟、自动 Referer、多浏览器指纹轮换
完全免费，Workers 免费版每日 100,000 请求

测试结果

功能	状态	说明
HTTP GET 请求	OK	返回 Cloudflare IP
HTTP POST 请求	OK	发送数据成功
自定义 Headers	OK	Header 正确传递
Session 会话	OK	多次请求正常
Workers Debug	OK	返回 CF 机房信息
浏览器(HTTP代理)	OK	支持本地/远程代理
浏览器(VLESS)	OK	Cloudflare IP 出口
浏览器(无代理)	OK	本地 IP 出口
IP 地图可视化	OK	生成 HTML 地图文件
网页镜像	OK	保存完整网页到本地
隐身模式	OK	自动添加 15+ 个请求头
StealthSession	OK	会话一致性、自动 Referer
随机延迟	OK	请求间随机等待

部署 Workers

登录 Cloudflare Dashboard
进入 Workers & Pages
点击 Create application → Create Worker
将 workers.js 代码粘贴到编辑器中
点击 Deploy

部署完成后，你将获得一个 Workers 地址，如 https://xxx.username.workers.dev

如需自定义域名，可在 Worker → Settings → Triggers → Custom Domain 中添加。

安装

方式一：PyPI 安装（推荐）

pip install cfspider

注意：Python 3.11+ 在 Debian/Ubuntu 上可能提示 externally-managed-environment 错误，请使用以下任一方式解决：
# 方式 A：使用虚拟环境（推荐）
python3 -m venv venv
source venv/bin/activate
pip install cfspider

# 方式 B：使用 pipx
pipx install cfspider

# 方式 C：强制安装（不推荐）
pip install cfspider --break-system-packages

方式二：国内镜像源安装

如果 PyPI 访问较慢，可使用国内镜像：

# 清华源
pip install cfspider -i https://pypi.tuna.tsinghua.edu.cn/simple

# 阿里云源
pip install cfspider -i https://mirrors.aliyun.com/pypi/simple

# 中科大源
pip install cfspider -i https://pypi.mirrors.ustc.edu.cn/simple

方式三：从 GitHub 安装

pip install git+https://github.com/violettoolssite/CFspider.git

安装浏览器功能（可选）

如需使用浏览器模式，需要额外安装：

# 安装带浏览器支持的 cfspider
pip install cfspider[browser]

# 安装 Chromium 浏览器
cfspider install

快速开始

HTTP 代理请求

import cfspider

cf_proxies = "https://your-workers.dev"

response = cfspider.get("https://httpbin.org/ip", cf_proxies=cf_proxies)
print(response.text)
# {"origin": "2a06:98c0:3600::103, 172.71.24.151"}  # Cloudflare IP

浏览器模式

import cfspider

# 使用本地 HTTP 代理
browser = cfspider.Browser(cf_proxies="127.0.0.1:9674")
html = browser.html("https://httpbin.org/ip")
print(html)
browser.close()

# 使用 VLESS 链接（推荐，无需填写 UUID）
browser = cfspider.Browser(
    cf_proxies="vless://your-uuid@v2.example.com:443?path=/"
)
html = browser.html("https://httpbin.org/ip")
print(html)  # 返回 Cloudflare IP
browser.close()

# 使用 edgetunnel 域名 + UUID（旧方式）
browser = cfspider.Browser(
    cf_proxies="v2.example.com",
    vless_uuid="your-vless-uuid"
)
html = browser.html("https://httpbin.org/ip")
browser.close()

# 无代理模式
browser = cfspider.Browser()
html = browser.html("https://example.com")
browser.close()

API 参考

请求方法

CFspider 支持以下 HTTP 方法，语法与 requests 库一致：

import cfspider

cf_proxies = "https://your-workers.dev"

cfspider.get(url, cf_proxies=cf_proxies)
cfspider.post(url, cf_proxies=cf_proxies, json=data)
cfspider.put(url, cf_proxies=cf_proxies, data=data)
cfspider.delete(url, cf_proxies=cf_proxies)
cfspider.head(url, cf_proxies=cf_proxies)
cfspider.options(url, cf_proxies=cf_proxies)
cfspider.patch(url, cf_proxies=cf_proxies, json=data)

请求参数

参数	类型	说明
url	str	目标 URL
cf_proxies	str	Workers 地址（必填）
params	dict	URL 查询参数
data	dict/str	表单数据
json	dict	JSON 数据
headers	dict	请求头
cookies	dict	Cookies
timeout	int/float	超时时间（秒）

响应对象

属性	类型	说明
text	str	响应文本
content	bytes	响应字节
json()	dict	解析 JSON
status_code	int	HTTP 状态码
headers	dict	响应头
cf_colo	str	Cloudflare 节点代码（如 NRT）
cf_ray	str	Cloudflare Ray ID

使用示例

GET 请求

import cfspider

cf_proxies = "https://your-workers.dev"

response = cfspider.get(
    "https://httpbin.org/get",
    cf_proxies=cf_proxies,
    params={"key": "value"}
)

print(response.status_code)
print(response.json())

POST 请求

import cfspider

cf_proxies = "https://your-workers.dev"

response = cfspider.post(
    "https://httpbin.org/post",
    cf_proxies=cf_proxies,
    json={"name": "cfspider", "version": "1.0"}
)

print(response.json())

使用 Session

Session 可以复用 Workers 地址，无需每次请求都指定：

import cfspider

cf_proxies = "https://your-workers.dev"

session = cfspider.Session(cf_proxies=cf_proxies)

r1 = session.get("https://httpbin.org/ip")
r2 = session.post("https://httpbin.org/post", json={"test": 1})
r3 = session.get("https://example.com")

print(r1.text)
print(r2.json())

session.close()

获取 Cloudflare 节点信息

import cfspider

cf_proxies = "https://your-workers.dev"

response = cfspider.get("https://httpbin.org/ip", cf_proxies=cf_proxies)

print(f"出口 IP: {response.json()['origin']}")
print(f"节点代码: {response.cf_colo}")
print(f"Ray ID: {response.cf_ray}")

自定义请求头

import cfspider

cf_proxies = "https://your-workers.dev"

response = cfspider.get(
    "https://httpbin.org/headers",
    cf_proxies=cf_proxies,
    headers={
        "User-Agent": "MyApp/1.0",
        "Accept-Language": "zh-CN"
    }
)

print(response.json())

设置超时

import cfspider

cf_proxies = "https://your-workers.dev"

response = cfspider.get(
    "https://httpbin.org/delay/5",
    cf_proxies=cf_proxies,
    timeout=10
)

HTTP/2 支持

启用 HTTP/2 可以获得更好的性能（连接复用、头部压缩等）：

注意: http2 和 impersonate 参数使用不同后端（httpx vs curl_cffi），不能同时启用。

import cfspider

cf_proxies = "https://your-workers.dev"

# 同步请求启用 HTTP/2
response = cfspider.get(
    "https://httpbin.org/ip",
    cf_proxies=cf_proxies,
    http2=True
)

print(response.text)

异步 API（httpx）

CFspider 提供基于 httpx 的异步 API，支持 async/await 语法，适合高并发场景。

异步请求

import asyncio
import cfspider

async def main():
    cf_proxies = "https://your-workers.dev"
    
    # 异步 GET 请求
    response = await cfspider.aget("https://httpbin.org/ip", cf_proxies=cf_proxies)
    print(response.text)
    
    # 异步 POST 请求
    response = await cfspider.apost(
        "https://httpbin.org/post",
        cf_proxies=cf_proxies,
        json={"key": "value"}
    )
    print(response.json())

asyncio.run(main())

异步 Session

import asyncio
import cfspider

async def main():
    cf_proxies = "https://your-workers.dev"
    
    async with cfspider.AsyncSession(cf_proxies=cf_proxies) as session:
        # 复用连接，高效执行多个请求
        r1 = await session.get("https://httpbin.org/ip")
        r2 = await session.post("https://httpbin.org/post", json={"test": 1})
        r3 = await session.get("https://example.com")
        
        print(r1.text)
        print(r2.json())

asyncio.run(main())

流式响应（大文件下载）

import asyncio
import cfspider

async def download_large_file():
    cf_proxies = "https://your-workers.dev"
    
    async with cfspider.astream("GET", "https://example.com/large-file.zip", cf_proxies=cf_proxies) as response:
        with open("large-file.zip", "wb") as f:
            async for chunk in response.aiter_bytes(chunk_size=8192):
                f.write(chunk)

asyncio.run(download_large_file())

并发请求

import asyncio
import cfspider

async def fetch_url(url, cf_proxies):
    response = await cfspider.aget(url, cf_proxies=cf_proxies)
    return response.json()

async def main():
    cf_proxies = "https://your-workers.dev"
    
    urls = [
        "https://httpbin.org/ip",
        "https://httpbin.org/headers",
        "https://httpbin.org/user-agent"
    ]
    
    # 并发执行所有请求
    tasks = [fetch_url(url, cf_proxies) for url in urls]
    results = await asyncio.gather(*tasks)
    
    for result in results:
        print(result)

asyncio.run(main())

异步 API 参考

方法	说明
`cfspider.aget(url, **kwargs)`	异步 GET 请求
`cfspider.apost(url, **kwargs)`	异步 POST 请求
`cfspider.aput(url, **kwargs)`	异步 PUT 请求
`cfspider.adelete(url, **kwargs)`	异步 DELETE 请求
`cfspider.ahead(url, **kwargs)`	异步 HEAD 请求
`cfspider.aoptions(url, **kwargs)`	异步 OPTIONS 请求
`cfspider.apatch(url, **kwargs)`	异步 PATCH 请求
`cfspider.astream(method, url, **kwargs)`	流式请求（上下文管理器）
`cfspider.AsyncSession(**kwargs)`	异步会话（支持连接池）

隐身模式（反爬虫规避）

CFspider v1.7.0 新增隐身模式，解决反爬检测中最常见的三个问题：

请求头不完整：自动添加完整的浏览器请求头（15+ 个头）
会话不一致：StealthSession 保持 User-Agent、Cookie 一致
行为模式单一：支持随机延迟、自动 Referer、浏览器指纹轮换

基本用法（stealth=True）

import cfspider

# 启用隐身模式 - 自动添加完整浏览器请求头
response = cfspider.get(
    "https://example.com",
    stealth=True
)
print(response.text)

# 自动添加的请求头包括：
# - User-Agent (Chrome 131 完整指纹)
# - Accept, Accept-Language, Accept-Encoding
# - Sec-Fetch-Dest, Sec-Fetch-Mode, Sec-Fetch-Site, Sec-Fetch-User
# - Sec-CH-UA, Sec-CH-UA-Mobile, Sec-CH-UA-Platform
# - Upgrade-Insecure-Requests, Cache-Control, Connection, DNT

选择浏览器类型

import cfspider

# 使用 Firefox 请求头
response = cfspider.get(
    "https://example.com",
    stealth=True,
    stealth_browser='firefox'  # chrome, firefox, safari, edge, chrome_mobile
)

# 查看支持的浏览器
print(cfspider.STEALTH_BROWSERS)
# ['chrome', 'firefox', 'safari', 'edge', 'chrome_mobile']

随机延迟

import cfspider

# 每次请求前随机延迟 1-3 秒
response = cfspider.get(
    "https://example.com",
    stealth=True,
    delay=(1, 3)  # 最小 1 秒，最大 3 秒
)

StealthSession 会话一致性

import cfspider

# 隐身会话 - 保持 User-Agent、Cookie 一致
with cfspider.StealthSession(
    browser='chrome',      # 固定浏览器类型
    delay=(0.5, 2.0),      # 请求间随机延迟
    auto_referer=True      # 自动添加 Referer
) as session:
    # 第一次请求
    r1 = session.get("https://example.com/page1")
    
    # 第二次请求 - 自动带上 Cookie 和 Referer
    r2 = session.get("https://example.com/page2")
    
    # 查看会话状态
    print(f"请求次数: {session.request_count}")
    print(f"当前 Cookie: {session.get_cookies()}")

配合 Workers 代理使用

import cfspider

# 隐身模式 + Cloudflare IP 出口
response = cfspider.get(
    "https://httpbin.org/headers",
    cf_proxies="https://your-workers.dev",
    stealth=True
)
print(response.cf_colo)  # Cloudflare 节点代码

# 隐身会话 + Workers 代理
with cfspider.StealthSession(
    cf_proxies="https://your-workers.dev",
    browser='chrome'
) as session:
    r1 = session.get("https://example.com")
    r2 = session.get("https://example.com/api")

配合 TLS 指纹模拟

import cfspider

# 隐身模式 + TLS 指纹模拟（终极反爬方案）
response = cfspider.get(
    "https://example.com",
    stealth=True,
    impersonate='chrome131'  # 模拟 Chrome 131 的 TLS 指纹
)
# 同时具备：完整请求头 + 真实 TLS 指纹

手动获取请求头

import cfspider

# 获取指定浏览器的请求头模板
chrome_headers = cfspider.get_stealth_headers('chrome')
firefox_headers = cfspider.get_stealth_headers('firefox')

# 获取随机浏览器的请求头
random_headers = cfspider.get_random_browser_headers()

# 使用预定义的请求头常量
from cfspider import CHROME_HEADERS, FIREFOX_HEADERS, SAFARI_HEADERS

支持的浏览器请求头

浏览器	参数值	请求头数量	特点
Chrome 131	`chrome`	15	包含完整 Sec-CH-UA 客户端提示
Firefox 133	`firefox`	12	包含 Sec-GPC 隐私头
Safari 18	`safari`	5	简洁的 macOS Safari 指纹
Edge 131	`edge`	14	基于 Chromium 的 Edge
Chrome Mobile	`chrome_mobile`	10	Android Pixel 设备指纹

TLS 指纹模拟 (curl_cffi)

CFspider 集成了 curl_cffi，支持模拟各种浏览器的 TLS 指纹，有效绕过基于 JA3/JA4 指纹的反爬检测。

基本用法（直接在 get/post 中使用）

import cfspider

# 直接在 get() 中使用 impersonate 参数
response = cfspider.get(
    "https://example.com",
    impersonate="chrome131"
)
print(response.text)

# POST 请求也支持
response = cfspider.post(
    "https://api.example.com",
    impersonate="safari18_0",
    json={"key": "value"}
)

配合 Workers 代理使用

import cfspider

# TLS 指纹 + Cloudflare IP 出口
response = cfspider.get(
    "https://httpbin.org/ip",
    impersonate="chrome131",
    cf_proxies="https://your-workers.dev"
)
print(response.text)  # Cloudflare IP
print(response.cf_colo)  # 节点代码

TLS 指纹会话

import cfspider

# 创建 Chrome 131 指纹会话
with cfspider.ImpersonateSession(impersonate="chrome131") as session:
    r1 = session.get("https://example.com")
    r2 = session.post("https://api.example.com", json={"key": "value"})
    r3 = session.get("https://example.com/data")

支持的浏览器指纹

import cfspider

# 获取支持的浏览器列表
browsers = cfspider.get_supported_browsers()
print(browsers)

类型	版本
Chrome	chrome99, chrome100, chrome101, chrome104, chrome107, chrome110, chrome116, chrome119, chrome120, chrome123, chrome124, chrome131
Chrome Android	chrome99_android, chrome131_android
Safari	safari15_3, safari15_5, safari17_0, safari17_2_ios, safari18_0, safari18_0_ios
Firefox	firefox102, firefox109, firefox133
Edge	edge99, edge101

TLS 指纹 API 参考

方法	说明
`cfspider.impersonate_get(url, impersonate="chrome131", **kwargs)`	GET 请求
`cfspider.impersonate_post(url, impersonate="chrome131", **kwargs)`	POST 请求
`cfspider.impersonate_put(url, **kwargs)`	PUT 请求
`cfspider.impersonate_delete(url, **kwargs)`	DELETE 请求
`cfspider.impersonate_request(method, url, **kwargs)`	自定义方法请求
`cfspider.ImpersonateSession(impersonate="chrome131", **kwargs)`	指纹会话
`cfspider.get_supported_browsers()`	获取支持的浏览器列表

IP 地图可视化

CFspider 支持生成 IP 地理位置地图，可视化展示代理请求使用的 Cloudflare 节点分布。

基本用法

import cfspider

# 启用地图输出
response = cfspider.get(
    "https://httpbin.org/get",
    cf_proxies="https://your-workers.dev",
    map_output=True,                    # 启用地图输出
    map_file="my_proxy_map.html"        # 自定义文件名（可选）
)

# 请求完成后会自动生成 HTML 地图文件
# 在浏览器中打开 my_proxy_map.html 即可查看地图

多次请求收集

import cfspider

# 清空之前的记录
cfspider.clear_map_records()

# 发送多个请求
urls = [
    "https://httpbin.org/get",
    "https://api.ipify.org",
    "https://ifconfig.me/ip"
]

for url in urls:
    response = cfspider.get(
        url,
        cf_proxies="https://your-workers.dev",
        map_output=True,
        map_file="multi_request_map.html"
    )
    print(f"{url}: {response.cf_colo}")

# 获取收集器信息
collector = cfspider.get_map_collector()
print(f"总请求数: {len(collector.get_records())}")
print(f"使用的节点: {collector.get_unique_colos()}")

手动添加记录

import cfspider

# 手动添加 IP 记录
cfspider.add_ip_record(
    url="https://example.com",
    cf_colo="NRT",           # Cloudflare 节点代码
    status_code=200,
    response_time=50.0       # 毫秒
)

# 生成地图
cfspider.generate_map_html(
    output_file="custom_map.html",
    title="My Custom IP Map"
)

节点坐标数据

CFspider 内置了 39 个主要 Cloudflare 节点的坐标数据：

import cfspider

# 查看支持的节点
print(f"支持节点数: {len(cfspider.COLO_COORDINATES)}")

# 查看某个节点信息
nrt = cfspider.COLO_COORDINATES["NRT"]
print(f"东京: {nrt['city']}, {nrt['country']} ({nrt['lat']}, {nrt['lng']})")

IP 地图 API 参考

方法	说明
`cfspider.get(..., map_output=True)`	请求时启用地图输出
`cfspider.clear_map_records()`	清空地图记录
`cfspider.get_map_collector()`	获取 IP 收集器
`cfspider.add_ip_record(**kwargs)`	手动添加 IP 记录
`cfspider.generate_map_html(**kwargs)`	生成地图 HTML
`cfspider.COLO_COORDINATES`	节点坐标数据库

地图特性

生成的 HTML 地图包含：

Cyberpunk 风格：与 CFspider 整体风格一致
MapLibre GL：高性能 WebGL 地图渲染
交互式标记：点击标记查看详细信息
统计面板：显示请求总数、唯一节点数
节点列表：显示所有使用的 Cloudflare 节点代码
自动缩放：地图自动缩放到数据范围

网页镜像

CFspider 支持将网页完整镜像到本地，包括 HTML、CSS、JavaScript、图片、字体等所有资源，并自动重写链接，实现离线浏览。

基本用法

import cfspider

# 镜像网页到本地，自动打开浏览器预览
result = cfspider.mirror("https://httpbin.org", open_browser=True)

print(f"保存位置: {result.index_file}")
print(f"资源目录: {result.assets_dir}")
print(f"总文件数: {result.total_files}")
print(f"总大小: {result.total_size / 1024:.2f} KB")

指定保存目录

import cfspider

# 指定保存目录，不自动打开浏览器
result = cfspider.mirror(
    "https://example.com",
    save_dir="./my_mirror",
    open_browser=False
)

配合代理使用

import cfspider

# 使用 VLESS 代理镜像网页
result = cfspider.mirror(
    "https://httpbin.org",
    save_dir="./mirror_output",
    cf_proxies="vless://uuid@v2.example.com:443?path=/",
    open_browser=True
)

高级选项

import cfspider

result = cfspider.mirror(
    "https://example.com",
    save_dir="./output",
    open_browser=True,
    timeout=60,          # 请求超时时间（秒）
    max_workers=10       # 并发下载线程数
)

目录结构

镜像完成后的目录结构如下：

save_dir/
├── index.html              # 主页面（链接已重写为相对路径）
└── assets/
    ├── css/
    │   └── style.css
    ├── js/
    │   └── main.js
    ├── images/
    │   ├── logo.png
    │   └── banner.jpg
    ├── fonts/
    │   └── roboto.woff2
    └── other/
        └── favicon.ico

MirrorResult 对象

属性	类型	说明
index_file	str	主 HTML 文件路径
assets_dir	str	资源目录路径
total_files	int	下载的文件总数
total_size	int	总大小（字节）
failed_urls	list	下载失败的 URL 列表
success	bool	是否成功

镜像 API 参考

方法	说明
`cfspider.mirror(url, **kwargs)`	镜像网页到本地
`cfspider.MirrorResult`	镜像结果类
`cfspider.WebMirror(**kwargs)`	镜像器类

镜像功能特性

完整资源保存：自动下载 CSS、JS、图片、字体等所有资源
CSS 资源解析：自动解析 CSS 中的 url() 引用（背景图、字体等）
链接重写：将绝对 URL 自动转换为相对路径
并发下载：多线程并发下载资源，提高效率
代理支持：支持 VLESS、HTTP、SOCKS5 代理
浏览器渲染：使用 Playwright 渲染 JavaScript 动态页面
自动预览：下载完成后自动打开浏览器预览

浏览器模式

CFspider 支持浏览器模式，可以渲染 JavaScript 动态页面、截图、生成 PDF、自动化操作等。

安装

# 安装带浏览器支持的 cfspider
pip install cfspider[browser]

# 安装 Chromium 浏览器
cfspider install

代理类型支持

浏览器模式支持多种代理类型：

import cfspider

# 1. HTTP 代理（IP:PORT 格式）
browser = cfspider.Browser(cf_proxies="127.0.0.1:9674")

# 2. HTTP 代理（完整格式）
browser = cfspider.Browser(cf_proxies="http://127.0.0.1:9674")

# 3. SOCKS5 代理
browser = cfspider.Browser(cf_proxies="socks5://127.0.0.1:1080")

# 4. VLESS 链接（推荐，无需填写 UUID）
browser = cfspider.Browser(cf_proxies="vless://uuid@v2.example.com:443?path=/")

# 5. edgetunnel 域名 + UUID（旧方式）
browser = cfspider.Browser(
    cf_proxies="v2.example.com",
    vless_uuid="your-vless-uuid"
)

# 6. 无代理
browser = cfspider.Browser()

获取渲染后的 HTML

import cfspider

browser = cfspider.Browser(cf_proxies="127.0.0.1:9674")

# 获取 JavaScript 渲染后的完整 HTML
html = browser.html("https://example.com")
print(html)

browser.close()

页面截图

import cfspider

browser = cfspider.Browser()

# 截图并保存
browser.screenshot("https://example.com", "screenshot.png")

# 截取整个页面
browser.screenshot("https://example.com", "full.png", full_page=True)

browser.close()

生成 PDF

import cfspider

browser = cfspider.Browser()

# 生成 PDF（仅无头模式可用）
browser.pdf("https://example.com", "page.pdf")

browser.close()

自动化操作

import cfspider

browser = cfspider.Browser()

# 打开页面，返回 Playwright Page 对象
page = browser.get("https://example.com")

# 点击元素
page.click("button#submit")

# 填写表单
page.fill("input#username", "myname")
page.fill("input#password", "mypassword")

# 等待元素
page.wait_for_selector(".result")

# 获取文本
text = page.inner_text(".result")
print(text)

browser.close()

执行 JavaScript

import cfspider

browser = cfspider.Browser()

# 在页面中执行 JavaScript
result = browser.execute_script("https://example.com", "document.title")
print(result)  # Example Domain

browser.close()

使用 with 语句

import cfspider

with cfspider.Browser() as browser:
    html = browser.html("https://example.com")
    print(html)
# 自动关闭浏览器

非无头模式

import cfspider

# headless=False 可以看到浏览器窗口
browser = cfspider.Browser(headless=False)

page = browser.get("https://example.com")
# 可以看到浏览器操作

browser.close()

错误处理

import cfspider

cf_proxies = "https://your-workers.dev"

try:
    response = cfspider.get("https://httpbin.org/ip", cf_proxies=cf_proxies)
    response.raise_for_status()
    print(response.text)
except cfspider.CFSpiderError as e:
    print(f"请求失败: {e}")
except Exception as e:
    print(f"其他错误: {e}")

Workers API 接口

方法	接口	说明
GET	/api/fetch?url=...	代理请求目标 URL，返回原始内容
GET	/api/json?url=...	代理请求目标 URL，返回 JSON（含节点信息）
GET	/api/pool	获取当前节点的 IP 池状态信息
GET	/api/proxyip	获取当前使用的 Proxy IP 和节点代码
POST	/proxy?url=...&method=...	Python 客户端使用的代理接口
GET	/debug	调试接口，返回当前请求的详细信息

FAQ 常见问题

免费版有什么限制？

Workers 免费版每日 100,000 请求，单次 CPU 时间 10ms，足够大多数个人项目使用。付费版 $5/月起，无请求限制。

IP 会被封吗？

Cloudflare IP 被数百万网站使用，信誉极高。但如果对单一网站高频请求，仍可能触发反爬。建议控制请求频率，模拟正常用户行为。

支持 HTTPS 吗？

完全支持。Workers 自动提供 SSL/TLS 加密，所有请求都通过 HTTPS 传输，确保数据安全。

能用于商业项目吗？

可以。MIT 许可证允许商业使用。但建议阅读 Cloudflare Workers 服务条款，确保用途合规。

为什么不能直接用 CF CDN IP？

Cloudflare CDN IP (如 172.64.x.x) 是 Anycast IP，仅用于边缘加速，不提供 HTTP 代理服务。必须通过 Workers 才能实现代理功能。

浏览器模式如何获得 CF IP？

需要配合 edgetunnel 项目使用 VLESS 协议。edgetunnel 将流量通过 Cloudflare 网络转发，实现浏览器流量从 CF IP 出口。

注意事项

Workers 免费版限制：每日 100,000 请求，单次 CPU 时间 10ms
请求体大小限制：免费版 100MB，付费版无限制
超时限制：免费版 30 秒，付费版无限制
不支持 WebSocket、gRPC 等非 HTTP 协议
浏览器模式需要额外安装 playwright 和 Chromium
edgetunnel VLESS 代理需要单独部署 edgetunnel Workers

致谢

本项目的浏览器 VLESS 代理功能借鉴并使用了 edgetunnel 项目。

edgetunnel 是一个优秀的 Cloudflare Workers VLESS 代理实现，感谢 @cmliu 的开源贡献。

如需使用浏览器模式的 Cloudflare IP 出口功能，请先部署 edgetunnel Workers：

仓库地址：https://github.com/cmliu/edgetunnel

License

Apache License 2.0

链接

GitHub: https://github.com/violettoolssite/CFspider
PyPI: https://pypi.org/project/cfspider/
官网: https://spider.violetteam.cloud
edgetunnel: https://github.com/cmliu/edgetunnel

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

1.9.1

Mar 27, 2026

1.9.0

Jan 26, 2026

1.8.9

Jan 25, 2026

1.8.7

Jan 23, 2026

1.8.6

Jan 23, 2026

1.8.5

Jan 22, 2026

1.8.4

Jan 22, 2026

1.8.3

Jan 21, 2026

1.8.2 yanked

Jan 21, 2026

Reason this release was yanked:

bug

1.8.1 yanked

Jan 21, 2026

Reason this release was yanked:

有安全性bug

1.8.0

Jan 21, 2026

1.7.4

Jan 7, 2026

1.7.3

Jan 5, 2026

1.7.2

Jan 5, 2026

This version

1.7.1

Jan 5, 2026

1.7.0

Jan 4, 2026

1.6.2

Jan 4, 2026

1.6.1

Jan 4, 2026

1.6.0

Jan 4, 2026

1.5.1

Jan 4, 2026

1.5.0

Jan 4, 2026

1.4.1

Jan 3, 2026

1.4.0

Jan 3, 2026

1.3.0

Jan 3, 2026

1.2.2

Jan 3, 2026

1.2.1

Jan 3, 2026

1.2.0

Jan 3, 2026

1.1.0

Jan 3, 2026

1.0.2

Jan 2, 2026

1.0.1

Jan 2, 2026

1.0.0

Jan 2, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

cfspider-1.7.1.tar.gz (74.4 kB view details)

Uploaded Jan 5, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

cfspider-1.7.1-py3-none-any.whl (61.6 kB view details)

Uploaded Jan 5, 2026 Python 3

File details

Details for the file cfspider-1.7.1.tar.gz.

File metadata

Download URL: cfspider-1.7.1.tar.gz
Upload date: Jan 5, 2026
Size: 74.4 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.0

File hashes

Hashes for cfspider-1.7.1.tar.gz
Algorithm	Hash digest
SHA256	`46a200ee7c37e106df2f1fa63c23b8fd3343b41f8820d87d293b48f06525040e`
MD5	`f2bce5bd1abf701d098ac4f502d9541c`
BLAKE2b-256	`00a8c6f7a7b942980cd2bea1a33684d9d283a5e7d1e0ce0067f25e48a687774a`

See more details on using hashes here.

File details

Details for the file cfspider-1.7.1-py3-none-any.whl.

File metadata

Download URL: cfspider-1.7.1-py3-none-any.whl
Upload date: Jan 5, 2026
Size: 61.6 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.0

File hashes

Hashes for cfspider-1.7.1-py3-none-any.whl
Algorithm	Hash digest
SHA256	`20b56ef359f296630516131b96829e2a1af1d05c6dd2e75accb3772d5b8c77c1`
MD5	`4ebf283345427b87a9705ca24ba4e068`
BLAKE2b-256	`065e5576275ae4bd2c7857b05b0171fcb2db818d7b7c91be16d16242c95292d4`

See more details on using hashes here.

cfspider 1.7.1

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

CFspider

代理方案对比

各方案详解

核心优势

企业级 IP 信誉

零成本运营

全球边缘网络

Serverless 无服务器

数据完全可控

企业级安全

适用场景

技术架构

特性

测试结果

部署 Workers

安装

方式一：PyPI 安装（推荐）

方式二：国内镜像源安装

方式三：从 GitHub 安装

安装浏览器功能（可选）

快速开始

HTTP 代理请求

浏览器模式

API 参考

请求方法

请求参数

响应对象

使用示例

GET 请求

POST 请求

使用 Session

获取 Cloudflare 节点信息

自定义请求头

设置超时

HTTP/2 支持

异步 API（httpx）

异步请求

异步 Session

流式响应（大文件下载）

并发请求

异步 API 参考

隐身模式（反爬虫规避）

基本用法（stealth=True）

选择浏览器类型

随机延迟

StealthSession 会话一致性

配合 Workers 代理使用

配合 TLS 指纹模拟

手动获取请求头

支持的浏览器请求头

TLS 指纹模拟 (curl_cffi)

基本用法（直接在 get/post 中使用）

配合 Workers 代理使用

TLS 指纹会话

支持的浏览器指纹

TLS 指纹 API 参考

IP 地图可视化

基本用法

多次请求收集

手动添加记录

节点坐标数据

IP 地图 API 参考

地图特性

网页镜像

基本用法

指定保存目录

配合代理使用

高级选项

目录结构

MirrorResult 对象

镜像 API 参考