PageEyes Agent 是一个轻量级 UI Agent,通过自然语言指令驱动,无需编写脚本既可实现Web、Android平台的UI自动化任务。
Project description
PageEyes Agent
PageEyes Agent 是基于 Pydantic AI 框架开发的一个轻量级 UI Agent, 其中元素信息感知能力依靠 OmniParserV2 模型,整个 Agent 的优势在于不依赖视觉语言大模型, 即使小参数的 LLM 也能胜任路径规划能力,同时支持多平台(Web、Android),目前主要包含以下功能:
- 完全由自然语言指令驱动,无需编写脚本,既可实现自动化测试,UI巡检等任务
- 跨平台、夸端支持,在 Python 环境中安装 page-eyes 库和配置 OmniParser 服务后即可开始 Web、Android 平台的自动化任务,未来还将继续支持iOS平台
- 支持多种大模型接入,包括DeepSeek、OpenAI、千问等,默认使用 DeepSeek V3 模型,后续会支持更多大模型接入
- 可通过自然语言进行断言,并生成详细的执行日志和报告,方便测试人员查看执行过程和结果
安装
pip install page-eyes
使用示例
import asyncio
from page_eyes.agent import WebAgent, MobileAgent
async def main():
# Web 端
ui_agent = await WebAgent.create(simulate_device='iPhone 15 Pro')
# 移动端
# ui_agent = await MobileAgent.create(serial='android-udid')
report = await ui_agent.run(
('1.打开 url "https://yobang.tencentmusic.com/chart/uni-chart/rankList/"\n'
'2.点击"查找icon"\n'
'3.在搜索输入框中输入"小美满"\n'
'4.点击"小美满> "\n'
'5.点击"日榜"'
))
if __name__ == "__main__":
asyncio.run(main())
更新日志
-
2025-09-03
- 支持等待、停留等自然语言操作
- 支持传递 OmniParser Key 鉴权
- 断言支持判断页面/屏幕中是否存在某个关键字
-
2025-08-01
- 精简了系统提示词,每次调用使用更少的token
- 优化报告的记录和生成逻辑,解决步骤偶然错乱的问题
- 优化工具的参数,实现最小化参数,减少token
- 优化了等待逻辑,实现更精准的等待,不需要统一等待1s
- 截图、解析改成异步,并发不阻塞
- 优化浏览器配置,支持使用持久化缓存,二次启动页面速度更快
-
2025-07-28
- 增加滚动和滑动操作
- 支持H5 swiper 组件滑动
-
2025-06-25
- 优化 LLM Graph 控制
- 更新配置模式
-
2025-06-09
- 支持 Web Agent 模式
- 增加执行报告和过程实时渲染
- 重构同步方法为异步
-
2025-06-04
- 支持移动端 Agent 模式
- 增加
clickinputopen_url工具 - 支持接入 OmniParser 进行元素解析
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
page_eyes-0.2.1.tar.gz
(236.9 kB
view details)
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
page_eyes-0.2.1-py3-none-any.whl
(182.5 kB
view details)
File details
Details for the file page_eyes-0.2.1.tar.gz.
File metadata
- Download URL: page_eyes-0.2.1.tar.gz
- Upload date:
- Size: 236.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.6.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
9bd8d79f4719d500e2b9b7d0c3d489ac833c66a7181c4f624244509c01e59516
|
|
| MD5 |
e9735d3bc803562f1bab3a768dc2246c
|
|
| BLAKE2b-256 |
10d98b3e3d7be047c8302b15c7510b1e5941cefdb810860985ed43e99323f0e9
|
File details
Details for the file page_eyes-0.2.1-py3-none-any.whl.
File metadata
- Download URL: page_eyes-0.2.1-py3-none-any.whl
- Upload date:
- Size: 182.5 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.6.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
1b88fa9b0d370128b23e655752d062652c084d9e858ff7ebc5a0d0be6417e622
|
|
| MD5 |
e5571fd39eccc76e983f7ff05ea90200
|
|
| BLAKE2b-256 |
20f6ff1bedc15f1fb2aababdc92e1af2bfa683d34758c2ef5f1b10864bb2c95c
|