A module that integrates selenium and requests session, encapsulates common page operations.

These details have not been verified by PyPI

Project links

Homepage

Project description

简洁！易用！方便！

简介

DrissionPage，即 driver 和 session 组合而成的 page。
是个基于 python 的 Web 自动化操作集成工具。
它实现了 selenium 和 requests 之间的无缝切换。
可以兼顾 selenium 的便利性和 requests 的高效率。
它集成了页面常用功能，两种模式系统一致的 API，使用便捷。
它用 POM 模式封装了页面元素常用的方法，适合自动化操作功能扩展。
更棒的是，它的使用方式非常简洁和人性化，代码量少，对新手友好。

示例地址： 使用DrissionPage的网页自动化及爬虫示例

交流QQ群： 897838127 联系邮箱： g1879@qq.com

背景

requests 爬虫面对要登录的网站时，要分析数据包、JS 源码，构造复杂的请求，往往还要应付验证码、JS 混淆、签名参数等反爬手段，门槛较高。若数据是由 JS 计算生成的，还须重现计算过程，体验不好，开发效率不高。
使用 selenium，可以很大程度上绕过这些坑，但 selenium 效率不高。因此，这个库将 selenium 和 requests 合而为一，不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率。
除了合并两者，本库还以网页为单位封装了常用功能，简化了 selenium 的操作和语句，在用于网页自动化操作时，减少考虑细节，专注功能实现，使用更方便。
一切从简，尽量提供简单直接的使用方法，对新手更友好。

特性和亮点

作者有多年自动化和爬虫经验，踩过无数坑，总结出的经验全写到这个库里了。内置了N多实用功能，对常用功能作了整合和优化。

特性

代码高度集成，以简洁的代码为第一追求。
页面对象可在 selenium 和 requests 模式间任意切换，保留登录状态。
极简单但强大的元素定位语法，支持链式操作，代码极其简洁。
两种模式提供一致的 API，使用体验一致。
人性化设计，集成众多实用功能，大大降低开发工作量。

亮点

每次运行程序可以反复使用已经打开的浏览器。如手动设置网页到某个状态，再用程序接管，或手动处理登录，再用程序爬内容。无须每次运行从头启动浏览器，超级方便。
使用 ini 文件保存常用配置，自动调用，也提供便捷的设置api，远离繁杂的配置项。
极致简明的定位语法，支持直接按文本定位元素，支持直接获取前后兄弟元素和父元素等。
强大的下载工具，操作浏览器时也能享受快捷可靠的下载功能。
下载工具支持多种方式处理文件名冲突、自动创建目标路径、断链重试等。
访问网址带自动重试功能，可设置间隔和超时时间。
访问网页能自动识别编码，无须手动设置。
链接参数默认自动生成 Host 和 Referer 属性。
可随时直接隐藏或显示浏览器进程窗口，非 headless 或最小化。
可自动下载合适版本的 chromedriver，免去麻烦的配置。
d 模式查找元素内置等待，可任意设置全局等待时间或单次查找等待时间。
点击元素集成 js 点击方式，一个参数即可切换点击方式。
点击支持失败重试，可用于保证点击成功、判读网页遮罩层是否消失等。
输入文本能自动判断是否成功并重试，避免某些情况下输入或清空失效的情况。
d 模式下支持全功能的 xpath，可直接获取元素的某个属性，selenium 原生无此功能。
支持直接获取 shadow-root，和普通元素一样操作其下的元素。
支持直接获取 after 和 before 伪元素的内容。
可以在元素下直接使用 > 以 css selector 方式获取当前元素直接子元素。原生不支持这种写法。
可简单地使用 lxml 来解析 d 模式的页面或元素，爬取复杂页面数据时速度大幅提高。
输出的数据均已转码及处理基本排版，减少重复劳动。
可方便地与 selenium 或 requests 原生代码对接，便于项目迁移。
使用 POM 模式封装，可直接用于测试，便于扩展。
还有很多这里不一一列举…………

简单演示

与 selenium 代码对比

以下代码实现一模一样的功能，对比两者的代码量：

用显性等待方式定位第一个文本包含 some text 的元素

# 使用 selenium：
element = WebDriverWait(driver).until(ec.presence_of_element_located((By.XPATH, '//*[contains(text(), "some text")]')))

# 使用 DrissionPage：
element = page('some text')

跳转到第一个标签页

# 使用 selenium：
driver.switch_to.window(driver.window_handles[0])

# 使用 DrissionPage：
page.to_tab(0)

按文本选择下拉列表

# 使用 selenium：
from selenium.webdriver.support.select import Select
select_element = Select(element)
select_element.select_by_visible_text('text')

# 使用 DrissionPage：
element.select('text')

拖拽一个元素

# 使用 selenium：
ActionChains(driver).drag_and_drop(ele1, ele2).perform()

# 使用 DrissionPage：
ele1.drag_to(ele2)

滚动窗口到底部（保持水平滚动条不变）

# 使用 selenium：
driver.execute_script("window.scrollTo(document.documentElement.scrollLeft, document.body.scrollHeight);")

# 使用 DrissionPage：
page.scroll_to('bottom')

设置 headless 模式

# 使用 selenium：
options = webdriver.ChromeOptions()
options.add_argument("--headless")

# 使用 DrissionPage：
set_headless()

获取伪元素内容

# 使用 selenium：
text = webdriver.execute_script('return window.getComputedStyle(arguments[0], "::after").getPropertyValue("content");', element)

# 使用 DrissionPage：
text = element.after

获取 shadow-root

# 使用 selenium：
shadow_element = webdriver.execute_script('return arguments[0].shadowRoot', element)

# 使用 DrissionPage：
shadow_element = element.sr

# 在 shadow_root 下可继续执行查找，获取普通元素
ele = shadow_element.ele('tag:div')

用 xpath 直接获取属性或文本节点（返回文本）

# 使用 selenium：
相当复杂

# 使用 DrissionPage：
class_name = element('xpath://div[@id="div_id"]/@class')
text = element('xpath://div[@id="div_id"]/text()[2]')

随时让浏览器窗口消失和显示

# selenium无此功能

# 使用 DrissionPage
page.hide_browser()  # 让浏览器窗口消失
page.show_browser()  # 重新显示浏览器窗口

注：本功能只支持 Windows，且须设置了 debugger_address 参数时才能生效

与 requests 代码对比

以下代码实现一模一样的功能，对比两者的代码量：

获取元素内容

url = 'https://baike.baidu.com/item/python'

# 使用 requests：
from lxml import etree
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36'}
response = requests.get(url, headers = headers)
html = etree.HTML(response.text)
element = html.xpath('//h1')[0]
title = element.text

# 使用 DrissionPage：
page = MixPage('s')
page.get(url)
title = page('tag:h1').text

Tips: DrissionPage 自带默认 headers

下载文件

url = 'https://www.baidu.com/img/flexible/logo/pc/result.png'
save_path = r'C:\download'

# 使用 requests：
r = requests.get(url)
with open(f'{save_path}\\img.png', 'wb') as fd:
   for chunk in r.iter_content():
       fd.write(chunk)

# 使用 DrissionPage：
page.download(url, save_path, 'img')  # 支持重命名，处理文件名冲突，自动创建目标文件夹

模式切换

用 selenium 登录网站，然后切换到 requests 读取网页。两者会共享登录信息。

page = MixPage()  # 创建页面对象，默认 driver 模式
page.get('https://gitee.com/profile')  # 访问个人中心页面（未登录，重定向到登录页面）

page.ele('@id:user_login').input('your_user_name')  # 使用 selenium 输入账号密码登录
page.ele('@id:user_password').input('your_password\n')
sleep(1)

page.change_mode()  # 切换到 session 模式
print('登录后title：', page.title, '\n')  # 登录后 session 模式的输出

输出：

登录后title： 个人资料 - 码云 Gitee.com

获取并显示元素属性

# 接上段代码
foot = page.ele('@id:footer-left')  # 用 id 查找元素
first_col = foot.ele('css:>div')  # 使用 css selector 在元素的下级中查找元素（第一个）
lnk = first_col.ele('text:命令学')  # 使用文本内容查找元素
text = lnk.text  # 获取元素文本
href = lnk.attr('href')  # 获取元素属性值

print(text, href, '\n')

# 简洁模式串联查找
text = page('@id:footer-left')('css:>div')('text:命令学').text
print(text)

输出：

Git 命令学习 https://oschina.gitee.io/learn-git-branching/

Git 命令学习

使用方法

请在 Wiki中查看：点击跳转到wiki

版本历史

请在 Wiki中查看：点击查看版本历史

APIs

请在 Wiki中查看：点击查看APIs

Project details

These details have not been verified by PyPI

Project links

Homepage

Release history Release notifications | RSS feed

4.1.0.12

Nov 13, 2024

4.1.0.11

Nov 8, 2024

4.1.0.9

Oct 17, 2024

4.1.0.8

Oct 14, 2024

4.1.0.7

Oct 7, 2024

4.1.0.6

Sep 28, 2024

4.1.0.5

Sep 23, 2024

4.1.0.4

Sep 20, 2024

4.1.0.3

Sep 20, 2024

4.1.0.2

Sep 19, 2024

4.1.0.1

Sep 18, 2024

4.1.0.0

Sep 17, 2024

4.1.0.0b24 pre-release

Sep 12, 2024

4.1.0.0b23 pre-release

Sep 6, 2024

4.1.0.0b22 pre-release

Sep 6, 2024

4.1.0.0b21 pre-release

Aug 30, 2024

4.1.0.0b20 pre-release

Aug 16, 2024

4.1.0.0b19 pre-release

Jul 31, 2024

4.1.0.0b15 pre-release

Jul 29, 2024

4.1.0.0b14 pre-release

Jul 26, 2024

4.1.0.0b13 pre-release

Jul 26, 2024

4.1.0.0b12 pre-release

Jul 24, 2024

4.1.0.0b11 pre-release

Jul 24, 2024

4.1.0.0b10 pre-release

Jul 19, 2024

4.1.0.0b9 pre-release

Jul 17, 2024

4.1.0.0b8 pre-release

Jul 16, 2024

4.1.0.0b7 pre-release

Jul 15, 2024

4.1.0.0b6 pre-release

Jul 13, 2024

4.1.0.0b5 pre-release

Jul 13, 2024

4.1.0.0b4 pre-release

Jul 10, 2024

4.1.0.0b3 pre-release

Jul 9, 2024

4.1.0.0b2 pre-release

Jul 9, 2024

4.1.0.0b1 pre-release

Jul 4, 2024

4.0.5.6

Jul 2, 2024

4.0.5.5

Jun 28, 2024

4.0.5.4

Jun 28, 2024

4.0.5.3

Jun 25, 2024

4.0.5.2

Jun 24, 2024

4.0.5.1

Jun 24, 2024

4.0.5.0

Jun 23, 2024

4.0.4.25

Jun 17, 2024

4.0.4.24

Jun 5, 2024

4.0.4.23

May 14, 2024

4.0.4.22

May 4, 2024

4.0.4.21

Mar 31, 2024

4.0.4.20

Mar 31, 2024

4.0.4.19

Mar 31, 2024

4.0.4.18

Mar 30, 2024

4.0.4.17

Mar 26, 2024

4.0.4.16

Mar 23, 2024

4.0.4.14

Mar 21, 2024

4.0.4.13

Mar 16, 2024

4.0.4.12

Mar 14, 2024

4.0.4.11

Mar 13, 2024

4.0.4.10

Mar 13, 2024

4.0.4.9

Mar 10, 2024

4.0.4.8

Mar 3, 2024

4.0.4.7

Mar 2, 2024

4.0.4.6

Feb 28, 2024

4.0.4.5

Feb 5, 2024

4.0.4.4

Jan 31, 2024

4.0.4.3

Jan 29, 2024

4.0.4

Jan 27, 2024

4.0.3.4

Jan 20, 2024

4.0.3.3

Jan 19, 2024

4.0.3.2

Jan 18, 2024

4.0.3.1

Jan 18, 2024

4.0.3

Jan 18, 2024

4.0.2

Jan 16, 2024

4.0.0b38 pre-release

Jan 12, 2024

4.0.0b36 pre-release

Jan 8, 2024

4.0.0b29 pre-release

Dec 25, 2023

4.0.0b26 pre-release

Dec 21, 2023

4.0.0b24 pre-release

Dec 19, 2023

4.0.0b22 pre-release

Dec 15, 2023

4.0.0b20 pre-release

Dec 11, 2023

4.0.0b19 pre-release

Dec 10, 2023

4.0.0b17 pre-release

Dec 3, 2023

4.0.0b16 pre-release

Dec 3, 2023

4.0.0b15 pre-release

Dec 1, 2023

4.0.0b14 pre-release

Nov 27, 2023

4.0.0b13 pre-release

Nov 26, 2023

4.0.0b11 pre-release

Nov 21, 2023

4.0.0b10 pre-release

Nov 21, 2023

4.0.0b8 pre-release

Nov 17, 2023

4.0.0b7 pre-release

Nov 13, 2023

4.0.0b6 pre-release

Nov 11, 2023

4.0.0b5 pre-release

Oct 31, 2023

4.0.0b4 pre-release

Oct 31, 2023

4.0.0b2 pre-release

Oct 30, 2023

4.0.0b0 pre-release

Oct 28, 2023

3.2.35

Nov 30, 2023

3.2.34

Oct 23, 2023

3.2.33

Sep 22, 2023

3.2.32

Sep 11, 2023

3.2.31

Aug 9, 2023

3.2.30

May 12, 2023

3.2.29

May 12, 2023

3.2.28

May 5, 2023

3.2.27

May 1, 2023

3.2.26

Apr 7, 2023

3.2.25

Apr 6, 2023

3.2.24

Apr 3, 2023

3.2.22

Mar 30, 2023

3.2.21

Mar 30, 2023

3.2.20

Mar 29, 2023

3.2.19

Mar 14, 2023

3.2.16

Mar 11, 2023

3.2.15

Mar 10, 2023

3.2.14

Mar 9, 2023

3.2.13

Mar 8, 2023

3.2.12

Mar 6, 2023

3.2.11

Mar 4, 2023

3.2.10

Mar 4, 2023

3.2.9

Mar 3, 2023

3.2.8

Mar 3, 2023

3.2.7

Mar 2, 2023

3.2.5

Feb 27, 2023

3.2.4

Feb 26, 2023

3.2.3

Feb 24, 2023

3.2.2

Feb 23, 2023

3.2.1

Feb 23, 2023

3.2.0

Feb 22, 2023

3.1.6

Feb 16, 2023

3.1.5

Feb 15, 2023

3.1.4

Feb 7, 2023

3.1.3

Feb 2, 2023

3.1.2

Feb 2, 2023

3.1.1

Jan 28, 2023

3.1.0

Jan 27, 2023

3.0.34

Jan 12, 2023

3.0.33

Jan 11, 2023

3.0.32

Jan 10, 2023

3.0.31

Jan 7, 2023

3.0.30

Jan 5, 2023

3.0.29

Jan 5, 2023

3.0.28

Jan 4, 2023

3.0.27

Jan 2, 2023

3.0.26

Dec 28, 2022

3.0.25

Dec 28, 2022

3.0.24

Dec 28, 2022

3.0.23

Dec 27, 2022

3.0.22

Dec 14, 2022

3.0.21

Dec 13, 2022

3.0.20

Dec 6, 2022

3.0.19

Nov 28, 2022

3.0.18

Nov 28, 2022

3.0.17

Nov 28, 2022

3.0.16

Nov 28, 2022

3.0.15

Nov 27, 2022

3.0.14

Nov 27, 2022

3.0.13

Nov 25, 2022

3.0.12

Nov 25, 2022

3.0.11

Nov 24, 2022

3.0.10

Nov 24, 2022

3.0.9

Nov 23, 2022

3.0.8

Nov 22, 2022

3.0.7

Nov 22, 2022

3.0.6

Nov 21, 2022

3.0.5

Nov 20, 2022

3.0.4

Nov 20, 2022

3.0.3

Nov 20, 2022

3.0.2

Nov 19, 2022

2.7.3

Sep 8, 2022

2.7.2

Jun 30, 2022

2.7.1

Jun 24, 2022

2.7.0

May 28, 2022

2.6.3

May 20, 2022

2.6.2

May 17, 2022

2.6.1

May 17, 2022

2.6.0

May 16, 2022

2.5.9

Apr 17, 2022

2.5.8

Apr 15, 2022

2.5.7

Mar 20, 2022

2.5.6

Mar 16, 2022

2.5.5

Mar 2, 2022

2.5.4

Feb 25, 2022

2.5.3

Feb 19, 2022

2.5.2

Feb 18, 2022

2.5.1

Feb 12, 2022

2.5.0

Jan 29, 2022

2.4.3

Jan 28, 2022

2.4.2

Jan 21, 2022

2.4.1

Jan 19, 2022

2.4.0

Jan 17, 2022

2.3.3

Jan 14, 2022

2.3.1

Jan 13, 2022

2.3.0

Jan 12, 2022

2.2.1

Dec 30, 2021

2.2.0

Dec 29, 2021

2.1.1

Dec 11, 2021

2.1.0

Dec 11, 2021

2.0.3

Dec 4, 2021

This version

2.0.2

Dec 3, 2021

2.0.1

Dec 3, 2021

2.0.0

Dec 2, 2021

1.11.8

Nov 27, 2021

1.11.7

Nov 10, 2021

1.11.6

Nov 2, 2021

1.11.5

Oct 29, 2021

1.11.4

Oct 26, 2021

1.11.3

Sep 23, 2021

1.11.2

Sep 23, 2021

1.11.1

Sep 23, 2021

1.11.0

Aug 30, 2021

1.11.0.beta pre-release

Aug 13, 2021

1.10.2

Jun 10, 2021

1.10.1

Apr 15, 2021

1.10.0

Apr 14, 2021

1.9.3

Feb 25, 2021

1.9.2

Feb 22, 2021

1.9.1

Feb 10, 2021

1.9.0

Feb 7, 2021

1.8.1

Jan 28, 2021

1.8.0

Jan 14, 2021

1.7.12

Dec 29, 2020

1.7.11

Dec 29, 2020

1.7.10

Dec 28, 2020

1.7.9

Dec 28, 2020

1.7.8

Dec 27, 2020

1.7.7

Dec 24, 2020

1.7.6

Dec 24, 2020

1.7.5

Dec 11, 2020

1.7.4

Dec 9, 2020

1.7.3

Dec 8, 2020

1.7.2

Dec 8, 2020

1.7.1

Dec 8, 2020

1.7.0

Dec 4, 2020

1.6.1

Nov 23, 2020

1.6.0

Nov 23, 2020

1.5.4

Nov 18, 2020

1.5.3

Nov 18, 2020

1.5.2

Nov 16, 2020

1.5.1

Nov 15, 2020

1.5.0

Nov 13, 2020

1.4.0

Nov 3, 2020

1.3.0

Oct 29, 2020

1.2.1

Sep 28, 2020

1.2.0

Sep 7, 2020

1.1.4

Aug 19, 2020

1.1.3

Aug 18, 2020

1.1.2

Aug 14, 2020

1.1.1

Aug 13, 2020

1.1.0

Aug 12, 2020

1.0.9

Aug 10, 2020

1.0.7

Aug 7, 2020

1.0.6

Aug 6, 2020

1.0.5

Aug 5, 2020

1.0.4

Aug 3, 2020

1.0.3

Aug 2, 2020

1.0.2

Jul 31, 2020

1.0.1

Jul 27, 2020

1.0.0

Jul 27, 2020

0.15.0

Jul 3, 2020

0.14.1

Jun 19, 2020

0.14.0

Jun 18, 2020

0.13.4

Jun 13, 2020

0.13.3

Jun 10, 2020

0.13.2

Jun 10, 2020

0.13.1

Jun 9, 2020

0.13.0

Jun 8, 2020

0.12.0

Jun 6, 2020

0.11.0

Jun 5, 2020

0.10.2

Jun 3, 2020

0.10.1

Jun 1, 2020

0.10.0

May 31, 2020

0.9.4

May 28, 2020

0.9.3

May 28, 2020

0.9.2

May 28, 2020

0.9.1

May 27, 2020

0.9.0

May 26, 2020

0.9.0.beta pre-release

May 26, 2020

0.8.4

May 22, 2020

0.8.3

May 22, 2020

0.8.2

May 22, 2020

0.8.1

May 21, 2020

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

DrissionPage-2.0.2.tar.gz (51.2 kB view details)

Uploaded Dec 3, 2021 Source

Built Distribution

DrissionPage-2.0.2-py3-none-any.whl (59.8 kB view details)

Uploaded Dec 3, 2021 Python 3

File details

Details for the file DrissionPage-2.0.2.tar.gz.

File metadata

Download URL: DrissionPage-2.0.2.tar.gz
Upload date: Dec 3, 2021
Size: 51.2 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/3.6.0 importlib_metadata/4.8.2 pkginfo/1.8.1 requests/2.26.0 requests-toolbelt/0.9.1 tqdm/4.62.3 CPython/3.8.10

File hashes

Hashes for DrissionPage-2.0.2.tar.gz
Algorithm	Hash digest
SHA256	`6f67370a96766fd8f93fc82b1e95e00161a5b4922ad967b8ede6ddeb254b27d2`
MD5	`137c59c4d0ce445dcddcb2393910b06b`
BLAKE2b-256	`0fdb188d21b09d0f34c251fcf907db57eb5462bd70bbae9af632c8d99a1ad9aa`

See more details on using hashes here.

File details

Details for the file DrissionPage-2.0.2-py3-none-any.whl.

File metadata

Download URL: DrissionPage-2.0.2-py3-none-any.whl
Upload date: Dec 3, 2021
Size: 59.8 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/3.6.0 importlib_metadata/4.8.2 pkginfo/1.8.1 requests/2.26.0 requests-toolbelt/0.9.1 tqdm/4.62.3 CPython/3.8.10

File hashes

Hashes for DrissionPage-2.0.2-py3-none-any.whl
Algorithm	Hash digest
SHA256	`4eddc800b5a208276097a721c34ea871b809f08fd496720420de61735bdcd53f`
MD5	`c523a54a270328b38f8ed26cd5bdf5f7`
BLAKE2b-256	`eed4a8b8de0a67d745c960065772a68f5b9303f6e393573739aa6dd8e9e370d0`

See more details on using hashes here.

DrissionPage 2.0.2

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

简洁！易用！方便！

简介

背景

特性和亮点

特性

亮点

简单演示

使用方法

版本历史

APIs

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

DrissionPage 2.0.2

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

简洁！易用 ！方便！

简介

背景

特性和亮点

特性

亮点

简单演示

使用方法

版本历史

APIs

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

简洁！易用！方便！