Python browser automation MCP framework for AI Agents

These details have not been verified by PyPI

Project links

Project description

RootBrowse

Python 浏览器自动化 MCP 框架，为 AI Agent 提供结构化的浏览器交互能力。基于 DrissionPage 构建。

核心特性

区域化拆分 — 将页面 DOM 按语义区块分组，解决复杂页面的信息过载问题
ref 精确引用 — 为每个可交互元素生成内部 ID (r1, r2, r3...)，避免文字匹配的不确定性
渐进式获取 — get_regions → get_region_summary → match_element → get_element，按需逐步深入
TabManager 状态自管理 — 内部维护标签页状态，不依赖 DrissionPage API 查询

安装

pip install rootbrowse

快速开始

from DrissionPage import ChromiumPage
from rootbrowse import Browser

# 创建浏览器实例
page = ChromiumPage()
browser = Browser(page)

# 打开网页
browser.get('https://example.com')

# 获取页面区块
regions = browser.view.get_regions()
print(regions)  # [Region(id='region_1', label='容器', root_xpath='...'), ...]

# 获取区块统计摘要
summary = browser.view.get_region_summary('region_1')
print(f"元素数量: {summary.count}")

# 按条件筛选元素
elements = browser.view.match_element(tag='a', text_contains='Python', limit=20)
print(elements)  # [ElementPreview(ref='r5', text='Python 入门', ...), ...]

# 获取完整元素信息
ele = browser.view.get_element('r5')
print(f"点击: {ele.text} -> {ele.attrs['href']}")

# 执行操作
result = browser.act.click('r5')
print(f"点击结果: {result.success}")

# 关闭浏览器
browser.close()

AI 工作流

用户指令
    ↓
get_regions()              → 查看页面有哪些区块
get_region_summary(id)     → 查看区块统计（标签分布、role 分布）
match_element(id, ...)     → 按条件筛选元素（摘要列表）
get_element(ref)          → 获取元素完整信息
ElementOperator 操作      → 点击、输入、悬停等

核心概念

ref（内部引用 ID）

HTML 元素大多数没有 id 属性。RootBrowse 为每个可交互元素生成 ref（r1, r2, r3...），作为内部引用。

# 原始 HTML: <a href="/python">Python 入门</a>
# 生成 ref 后
Element(ref="r1", tag="a", text="Python 入门", xpath="...", attrs={...})

AI 用 ref 操作元素，不依赖原始 HTML 的 id 或文字匹配。

区域化拆分

页面 DOM 有几千个节点，直接给 AI 无法处理。RootBrowse 按语义区块拆分：

页面 DOM
    ↓ 按语义区域分组（header, main, sidebar 等）
    ↓ 过滤噪音（script, style, meta）
    ↓ 统计每个区域的节点数
返回：Region 列表，AI 选择进入哪个区域

渐进式获取

get_regions()           → 看有哪些区块
get_region_summary()     → 看区块统计（tag 分布）
match_element()           → 按条件筛选元素（摘要）
get_element()             → 最后才看完整信息

每一步都返回精简数据，AI 按需逐步深入。

API 概览

Browse — 主入口

browser.get(url)                  # 打开 URL
browser.screenshot(path)          # 截图
browser.save_state(path)          # 保存会话状态
browser.load_state(path)          # 恢复会话状态
browser.close()                   # 关闭浏览器

TabManager — 标签页管理

browser.tabs.new_tab(url)         # 新建标签页
browser.tabs.close_tab(index)     # 关闭标签页
browser.tabs.switch_to_tab(index) # 切换标签页
browser.tabs.tabs_count()         # 获取标签页数量
browser.tabs.current_index()     # 获取当前索引

PageScanner — 页面扫描

browser.view.get_regions()                    # 获取区块列表
browser.view.get_region_summary(region_id)    # 获取区块统计
browser.view.match_element(**filters)         # 筛选元素
browser.view.get_element(ref)                # 获取完整元素
browser.view.find_element(by, value)         # 精确定位

ElementOperator — 元素操作

browser.act.click(ref)              # 点击
browser.act.input_by_ref(ref, text) # 输入
browser.act.hover(ref)             # 悬停
browser.act.double_click(ref)      # 双击
browser.act.right_click(ref)       # 右键
browser.act.submit(ref)            # 提交表单
browser.act.clear(ref)             # 清空输入框
browser.act.send_enter()            # 发送回车

数据类型

类型	说明
`Region`	页面语义区块 `{id, label, root_xpath}`
`Element`	可交互元素 `{ref, tag, role, text, xpath, attrs}`
`RegionSummary`	区域统计 `{count, tag_counts, role_counts, text_preview}`
`ElementPreview`	元素摘要 `{ref, text, attrs_preview}`
`OperationResult`	操作结果 `{success, error?, new_url?}`

异常

异常	说明
`BrowserError`	浏览器相关错误
`ElementNotFoundError`	元素未找到
`RegionNotFoundError`	区域未找到
`TabNotFoundError`	标签页未找到
`OperationError`	操作失败
`StateFileError`	状态文件错误
`PageLoadError`	页面加载失败

技术栈

底层引擎: DrissionPage — Python CDP 连接，无需驱动
MCP 框架: FastMCP（官方 Python MCP SDK）
Python 版本: >= 3.10

License

MIT

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.3.2

May 17, 2026

0.3.1

May 17, 2026

This version

0.3.0

May 17, 2026

0.2.1

May 16, 2026

0.2.0

May 16, 2026

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

rootbrowse-0.3.0.tar.gz (25.1 kB view details)

Uploaded May 17, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

rootbrowse-0.3.0-py3-none-any.whl (15.5 kB view details)

Uploaded May 17, 2026 Python 3

File details

Details for the file rootbrowse-0.3.0.tar.gz.

File metadata

Download URL: rootbrowse-0.3.0.tar.gz
Upload date: May 17, 2026
Size: 25.1 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.7

File hashes

Hashes for rootbrowse-0.3.0.tar.gz
Algorithm	Hash digest
SHA256	`c6d344744cbc7ecc6b6d6da9f4606d6d393e4449fd7162fa564005107c88ad29`
MD5	`9d6e3ff9ebebdabe513ca3bc58a9d9b7`
BLAKE2b-256	`ceb94b86f3a5785356f4ad196170878b9b227a78e5cc3ada0d1583780491484d`

See more details on using hashes here.

File details

Details for the file rootbrowse-0.3.0-py3-none-any.whl.

File metadata

Download URL: rootbrowse-0.3.0-py3-none-any.whl
Upload date: May 17, 2026
Size: 15.5 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.7

File hashes

Hashes for rootbrowse-0.3.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`8870bed35fc33c4e0e751c966c4d6c1d7dbfc9aae917cd02733bf109a3cf185e`
MD5	`d87fe30058f31524df68d3535609f316`
BLAKE2b-256	`8bc8606fd4912ea35e31455ea16d1f15e9df2610ce7d1b7fb1d02b2e9487af19`

See more details on using hashes here.

rootbrowse 0.3.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

RootBrowse

核心特性

安装

快速开始

AI 工作流

核心概念

ref（内部引用 ID）

区域化拆分

渐进式获取

API 概览

Browse — 主入口

TabManager — 标签页管理

PageScanner — 页面扫描

ElementOperator — 元素操作

数据类型

异常

技术栈

License

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes