PageEyes Agent 是一个轻量级 UI Agent,通过自然语言指令驱动,无需编写脚本既可实现Web、Android平台的UI自动化任务。
Project description
PageEyes Agent
Documentation: PageEyes Agent
PageEyes Agent 是基于 Pydantic AI 框架开发的一个轻量级 UI Agent, 其中元素信息感知能力依靠 OmniParserV2 模型,整个 Agent 的优势在于不依赖视觉语言大模型, 即使小参数的 LLM 也能胜任路径规划能力,同时支持多平台(Web、Android),目前主要包含以下功能:
- 完全由自然语言指令驱动,无需编写脚本,既可实现自动化测试,UI巡检等任务
- 跨平台、跨端支持,在 Python 环境中安装 page-eyes 库和配置 OmniParser 服务后即可开始 Web、Android 平台的自动化任务,未来还将继续支持iOS平台
- 支持多种大模型接入,包括DeepSeek、OpenAI、千问等,默认使用 DeepSeek V3 模型,后续会支持更多大模型接入
- 可通过自然语言进行断言,并生成详细的执行日志和报告,方便测试人员查看执行过程和结果
安装
pip install page-eyes
快速开始
配置环境变量
| 环境变量 | 默认值 | 说明 |
|---|---|---|
| AGENT_MODEL | openai:deepseek-v3 | 使用的AI模型,当前设置为deepseek-v3 |
| AGENT_DEBUG | False | 是否启用调试模式 |
| AGENT_HEADLESS | False | 是否使用无头模式 |
| AGENT_LOG_GRAPH_NODE | False | 是否记录图节点日志 |
| OPENAI_BASE_URL | https://api.deepseek.com/v1 | DeepSeek API的服务端点 |
| OPENAI_API_KEY | a22a37d7-xxx | 调用DeepSeek API所需的认证密钥 |
使用腾讯云COS服务(与MinIO二选一)
| 环境变量 | 默认值 | 说明 |
|---|---|---|
| COS_SECRET_ID | - | 腾讯云COS服务的Secret ID |
| COS_SECRET_KEY | - | 腾讯云COS服务的Secret Key |
| COS_ENDPOINT | - | 腾讯云COS服务的 endpoint |
| COS_BUCKET | - | 腾讯云COS服务的 bucket |
使用MinIO服务(与腾讯云COS二选一)
| 环境变量 | 默认值 | 说明 |
|---|---|---|
| MINIO_ENDPOINT | - | MinIO 端点 host:port |
| MINIO_ACCESS_KEY | - | 您在后台创建的 Access Key |
| MINIO_SECRET_KEY | - | 创建 Access Key 时会生成 SECRET_KEY |
| MINIO_BUCKET | - | 您在后台创建的 Bucket |
使用示例
import asyncio
from page_eyes.agent import WebAgent, MobileAgent
async def main():
# Web 端
ui_agent = await WebAgent.create(simulate_device='iPhone 15 Pro')
# 移动端
# ui_agent = await MobileAgent.create(serial='android-udid')
report = await ui_agent.run(
('1.打开 url "https://yobang.tencentmusic.com/chart/uni-chart/rankList/"\n'
'2.点击"查找icon"\n'
'3.在搜索输入框中输入"小美满"\n'
'4.点击"小美满> "\n'
'5.点击"日榜"'
))
if __name__ == "__main__":
asyncio.run(main())
如有需要,加入我们的交流群
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file page_eyes-0.2.7.tar.gz.
File metadata
- Download URL: page_eyes-0.2.7.tar.gz
- Upload date:
- Size: 243.5 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.6.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
c4870e1749c9aec7afb4e267a61c66fecb3f059eca8a224e4316adf29ac68342
|
|
| MD5 |
97c2bb5fbedafb012e38e0d2beed01c4
|
|
| BLAKE2b-256 |
f6021f3b6062a1a519140adf2e51d83c081339e2d8f9832c68d83b1ea0a0d5ca
|
File details
Details for the file page_eyes-0.2.7-py3-none-any.whl.
File metadata
- Download URL: page_eyes-0.2.7-py3-none-any.whl
- Upload date:
- Size: 183.0 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.6.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
1a04c75f79ef71a9e47c89311c9e8a865b0bafc19ba39ab91696b6a722d19a7d
|
|
| MD5 |
d84edb53c6fced9ccd0e8a2afd387c2e
|
|
| BLAKE2b-256 |
e26c359a79d1445cc6202ccf38393b8a515dce899f933706a29e2e99d3e3b3d4
|