A module that integrates selenium and requests session, encapsulates common page operations.

These details have not been verified by PyPI

Project links

Homepage

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Project description

✨️ 概述

DrissionPage 是一个基于 python 的网页自动化工具。

它既能控制浏览器，也能收发数据包，甚至能把两者合而为一，

可兼顾浏览器自动化的便利性和 requests 的高效率。

它功能强大，内置无数人性化设计和便捷功能。

它的语法简洁而优雅，代码量少，对新手友好。

支持系统：Windows、Linux、Mac

python 版本：3.6 及以上

支持浏览器：Chromium 内核浏览器（如 Chrome 和 Edge）

项目地址：gitee | github

交流QQ群： 897838127

联系邮箱： g1879@qq.com

📖 使用文档： 点击查看

📕 背景

用 requests 做数据采集面对要登录的网站时，要分析数据包、JS 源码，构造复杂的请求，往往还要应付验证码、JS 混淆、签名参数等反爬手段，门槛较高。若数据是由 JS 计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。

因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率。
除了合并两者，本库还以网页为单位封装了常用功能，提供非常简便的操作和语句，在用于网页自动化操作时，减少考虑细节，专注功能实现，使用更方便。一切从简，尽量提供简单直接的使用方法，使代码更优雅。

以前的版本是对 selenium 进行重新封装实现的。从 3.0 开始，作者另起炉灶，对底层进行了重新开发，摆脱对 selenium 的依赖，增强了功能，提升了运行效率。

💡 理念

简洁！易用！方便！

☀️ 特性和亮点

作者经过长期实践，踩过无数坑，总结出的经验全写到这个库里了。

🎇 强大的自研内核

本库采用全自研的内核，内置了 N 多实用功能，对常用功能作了整合和优化，对比 selenium，有以下优点：

无 webdriver 特征，不会被网站识别
无需为不同版本的浏览器下载不同的驱动
运行速度更快
可以跨 iframe 查找元素，无需切入切出
把 iframe 看作普通元素，获取后可直接在其中查找元素，逻辑更清晰
可以同时操作浏览器中的多个标签页，即使标签页为非激活状态，无需切换
可以直接读取浏览器缓存来保存图片，无需用 GUI 点击另存
可以对整个网页截图，包括视口外的部分（90以上版本浏览器支持）

🎇 亮点功能

除了以上优点，本库还内置了无数人性化设计。

极简的语法规则。集成大量常用功能，代码更优雅
定位元素更加容易，功能更强大稳定
无处不在的等待和自动重试功能。使不稳定的网络变得易于控制，程序更稳定，编写更省心
提供强大的下载工具。操作浏览器时也能享受快捷可靠的下载功能
允许反复使用已经打开的浏览器。无须每次运行从头启动浏览器，调试超方便
使用 ini 文件保存常用配置，自动调用，提供便捷的设置，远离繁杂的配置项
内置 lxml 作为解析引擎，解析速度成几个数量级提升
使用 POM 模式封装，可直接用于测试，便于扩展
高度集成的便利功能，从每个细节中体现
还有很多细节，这里不一一列举，欢迎实际使用中体验：）

🌟 简单演示

⭐ 与 selenium 代码对比

以下代码实现一模一样的功能，对比两者的代码量：

🔸 用显性等待方式定位第一个文本包含some text的元素

# 使用 selenium：
element = WebDriverWait(driver).until(ec.presence_of_element_located((By.XPATH, '//*[contains(text(), "some text")]')))

# 使用 DrissionPage：
element = page('some text')

🔸 跳转到第一个标签页

# 使用 selenium：
driver.switch_to.window(driver.window_handles[0])

# 使用 DrissionPage：
page.to_tab(page.tabs[0])

🔸 按文本选择下拉列表

# 使用 selenium：
from selenium.webdriver.support.select import Select

select_element = Select(element)
select_element.select_by_visible_text('text')

# 使用 DrissionPage：
element.select('text')

🔸 拖拽一个元素

# 使用 selenium：
ActionChains(driver).drag_and_drop(ele1, ele2).perform()

# 使用 DrissionPage：
ele1.drag_to(ele2)

🔸 滚动窗口到底部（保持水平滚动条不变）

# 使用 selenium：
driver.execute_script("window.scrollTo(document.documentElement.scrollLeft, document.body.scrollHeight);")

# 使用 DrissionPage：
page.scroll.to_bottom()

🔸 获取伪元素内容

# 使用 selenium：
text = webdriver.execute_script('return window.getComputedStyle(arguments[0], "::after").getPropertyValue("content");',
                                element)

# 使用 DrissionPage：
text = element.pseudo_after

🔸 shadow-root 操作

# 使用 selenium：
shadow_element = webdriver.execute_script('return arguments[0].shadowRoot', element)

# 使用 DrissionPage：
shadow_element = element.sr

# 在 shadow_root 下可继续执行查找，获取普通元素
ele = shadow_element.ele('tag:div')
ele.click()

🔸 随时让浏览器窗口消失和显示（Windows系统）

# selenium 无此功能

# 使用 DrissionPage
page.hide_browser()  # 让浏览器窗口消失
page.show_browser()  # 重新显示浏览器窗口

⭐ 与 requests 代码对比

以下代码实现一模一样的功能，对比两者的代码量：

🔸 获取元素内容

url = 'https://baike.baidu.com/item/python'

# 使用 requests：
from lxml import etree

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36'}
response = requests.get(url, headers=headers)
html = etree.HTML(response.text)
element = html.xpath('//h1')[0]
title = element.text

# 使用 DrissionPage：
page = WebPage('s')
page.get(url)
title = page('tag:h1').text

Tips: DrissionPage 自带默认headers

🔸 下载文件

url = 'https://www.baidu.com/img/flexible/logo/pc/result.png'
save_path = r'C:\download'

# 使用 requests：
r = requests.get(url)
with open(f'{save_path}\\img.png', 'wb') as fd:
   for chunk in r.iter_content():
       fd.write(chunk)

# 使用 DrissionPage：
page.download(url, save_path, 'img')  # 支持重命名，处理文件名冲突，自动创建目标文件夹

⭐ 模式切换

用浏览器登录网站，然后切换到 requests 读取网页。两者会共享登录信息。

page = WebPage()  # 创建页面对象，默认 driver 模式
page.get('https://gitee.com/profile')  # 访问个人中心页面（未登录，重定向到登录页面）

page.ele('@id:user_login').input('your_user_name')  # 使用 selenium 输入账号密码登录
page.ele('@id:user_password').input('your_password\n')
sleep(1)

page.change_mode()  # 切换到 session 模式
print('登录后title：', page.title, '\n')  # 登录后 session 模式的输出

输出：

登录后title： 个人资料 - 码云 Gitee.com

获取并显示元素属性

# 接上段代码
foot = page.ele('@id:footer-left')  # 用 id 查找元素
first_col = foot.ele('css:>div')  # 使用 css selector 在元素的下级中查找元素（第一个）
lnk = first_col.ele('text:命令学')  # 使用文本内容查找元素
text = lnk.text  # 获取元素文本
href = lnk.attr('href')  # 获取元素属性值

print(text, href, '\n')

# 简洁模式串联查找
text = page('@id:footer-left')('css:>div')('text:命令学').text
print(text)

输出：

Git 命令学习 https://oschina.gitee.io/learn-git-branching/

Git 命令学习

🛠 使用方法

点击跳转到使用文档

🔖 版本历史

点击查看版本历史

🖐🏻 免责声明

请勿将 DrissionPage 应用到任何可能会违反法律规定和道德约束的工作中,请友善使用 DrissionPage，遵守蜘蛛协议，不要将 DrissionPage 用于任何非法用途。如您选择使用 DrissionPage 即代表您遵守此协议，作者不承担任何由于您违反此协议带来任何的法律风险和损失，一切后果由您承担。

☕ 请我喝咖啡

如果本项目对您有所帮助，不妨请作者我喝杯咖啡：）

Project details

These details have not been verified by PyPI

Project links

Homepage

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Release history Release notifications | RSS feed

4.0.4.23

May 14, 2024

4.0.4.22

May 4, 2024

4.0.4.21

Mar 31, 2024

4.0.4.20

Mar 31, 2024

4.0.4.19

Mar 31, 2024

4.0.4.18

Mar 30, 2024

4.0.4.17

Mar 26, 2024

4.0.4.16

Mar 23, 2024

4.0.4.14

Mar 21, 2024

4.0.4.13

Mar 16, 2024

4.0.4.12

Mar 14, 2024

4.0.4.11

Mar 13, 2024

4.0.4.10

Mar 13, 2024

4.0.4.9

Mar 10, 2024

4.0.4.8

Mar 3, 2024

4.0.4.7

Mar 2, 2024

4.0.4.6

Feb 28, 2024

4.0.4.5

Feb 5, 2024

4.0.4.4

Jan 31, 2024

4.0.4.3

Jan 29, 2024

4.0.4

Jan 27, 2024

4.0.3.4

Jan 20, 2024

4.0.3.3

Jan 19, 2024

4.0.3.2

Jan 18, 2024

4.0.3.1

Jan 18, 2024

4.0.3

Jan 18, 2024

4.0.2

Jan 16, 2024

4.0.0b38 pre-release

Jan 12, 2024

4.0.0b36 pre-release

Jan 8, 2024

4.0.0b29 pre-release

Dec 25, 2023

4.0.0b26 pre-release

Dec 21, 2023

4.0.0b24 pre-release

Dec 19, 2023

4.0.0b22 pre-release

Dec 15, 2023

4.0.0b20 pre-release

Dec 11, 2023

4.0.0b19 pre-release

Dec 10, 2023

4.0.0b17 pre-release

Dec 3, 2023

4.0.0b16 pre-release

Dec 3, 2023

4.0.0b15 pre-release

Dec 1, 2023

4.0.0b14 pre-release

Nov 27, 2023

4.0.0b13 pre-release

Nov 26, 2023

4.0.0b11 pre-release

Nov 21, 2023

4.0.0b10 pre-release

Nov 21, 2023

4.0.0b8 pre-release

Nov 17, 2023

4.0.0b7 pre-release

Nov 13, 2023

4.0.0b6 pre-release

Nov 11, 2023

4.0.0b5 pre-release

Oct 31, 2023

4.0.0b4 pre-release

Oct 31, 2023

4.0.0b2 pre-release

Oct 30, 2023

4.0.0b0 pre-release

Oct 28, 2023

3.2.35

Nov 30, 2023

3.2.34

Oct 23, 2023

3.2.33

Sep 22, 2023

3.2.32

Sep 11, 2023

3.2.31

Aug 9, 2023

3.2.30

May 12, 2023

3.2.29

May 12, 2023

3.2.28

May 5, 2023

3.2.27

May 1, 2023

3.2.26

Apr 7, 2023

3.2.25

Apr 6, 2023

3.2.24

Apr 3, 2023

3.2.22

Mar 30, 2023

3.2.21

Mar 30, 2023

3.2.20

Mar 29, 2023

3.2.19

Mar 14, 2023

3.2.16

Mar 11, 2023

3.2.15

Mar 10, 2023

3.2.14

Mar 9, 2023

3.2.13

Mar 8, 2023

3.2.12

Mar 6, 2023

3.2.11

Mar 4, 2023

3.2.10

Mar 4, 2023

3.2.9

Mar 3, 2023

3.2.8

Mar 3, 2023

3.2.7

Mar 2, 2023

3.2.5

Feb 27, 2023

3.2.4

Feb 26, 2023

3.2.3

Feb 24, 2023

3.2.2

Feb 23, 2023

3.2.1

Feb 23, 2023

3.2.0

Feb 22, 2023

3.1.6

Feb 16, 2023

3.1.5

Feb 15, 2023

3.1.4

Feb 7, 2023

3.1.3

Feb 2, 2023

This version

3.1.2

Feb 2, 2023

3.1.1

Jan 28, 2023

3.1.0

Jan 27, 2023

3.0.34

Jan 12, 2023

3.0.33

Jan 11, 2023

3.0.32

Jan 10, 2023

3.0.31

Jan 7, 2023

3.0.30

Jan 5, 2023

3.0.29

Jan 5, 2023

3.0.28

Jan 4, 2023

3.0.27

Jan 2, 2023

3.0.26

Dec 28, 2022

3.0.25

Dec 28, 2022

3.0.24

Dec 28, 2022

3.0.23

Dec 27, 2022

3.0.22

Dec 14, 2022

3.0.21

Dec 13, 2022

3.0.20

Dec 6, 2022

3.0.19

Nov 28, 2022

3.0.18

Nov 28, 2022

3.0.17

Nov 28, 2022

3.0.16

Nov 28, 2022

3.0.15

Nov 27, 2022

3.0.14

Nov 27, 2022

3.0.13

Nov 25, 2022

3.0.12

Nov 25, 2022

3.0.11

Nov 24, 2022

3.0.10

Nov 24, 2022

3.0.9

Nov 23, 2022

3.0.8

Nov 22, 2022

3.0.7

Nov 22, 2022

3.0.6

Nov 21, 2022

3.0.5

Nov 20, 2022

3.0.4

Nov 20, 2022

3.0.3

Nov 20, 2022

3.0.2

Nov 19, 2022

2.7.3

Sep 8, 2022

2.7.2

Jun 30, 2022

2.7.1

Jun 24, 2022

2.7.0

May 28, 2022

2.6.3

May 20, 2022

2.6.2

May 17, 2022

2.6.1

May 17, 2022

2.6.0

May 16, 2022

2.5.9

Apr 17, 2022

2.5.8

Apr 15, 2022

2.5.7

Mar 20, 2022

2.5.6

Mar 16, 2022

2.5.5

Mar 2, 2022

2.5.4

Feb 25, 2022

2.5.3

Feb 19, 2022

2.5.2

Feb 18, 2022

2.5.1

Feb 12, 2022

2.5.0

Jan 29, 2022

2.4.3

Jan 28, 2022

2.4.2

Jan 21, 2022

2.4.1

Jan 19, 2022

2.4.0

Jan 17, 2022

2.3.3

Jan 14, 2022

2.3.1

Jan 13, 2022

2.3.0

Jan 12, 2022

2.2.1

Dec 30, 2021

2.2.0

Dec 29, 2021

2.1.1

Dec 11, 2021

2.1.0

Dec 11, 2021

2.0.3

Dec 4, 2021

2.0.2

Dec 3, 2021

2.0.1

Dec 3, 2021

2.0.0

Dec 2, 2021

1.11.8

Nov 27, 2021

1.11.7

Nov 10, 2021

1.11.6

Nov 2, 2021

1.11.5

Oct 29, 2021

1.11.4

Oct 26, 2021

1.11.3

Sep 23, 2021

1.11.2

Sep 23, 2021

1.11.1

Sep 23, 2021

1.11.0

Aug 30, 2021

1.11.0.beta pre-release

Aug 13, 2021

1.10.2

Jun 10, 2021

1.10.1

Apr 15, 2021

1.10.0

Apr 14, 2021

1.9.3

Feb 25, 2021

1.9.2

Feb 22, 2021

1.9.1

Feb 10, 2021

1.9.0

Feb 7, 2021

1.8.1

Jan 28, 2021

1.8.0

Jan 14, 2021

1.7.12

Dec 29, 2020

1.7.11

Dec 29, 2020

1.7.10

Dec 28, 2020

1.7.9

Dec 28, 2020

1.7.8

Dec 27, 2020

1.7.7

Dec 24, 2020

1.7.6

Dec 24, 2020

1.7.5

Dec 11, 2020

1.7.4

Dec 9, 2020

1.7.3

Dec 8, 2020

1.7.2

Dec 8, 2020

1.7.1

Dec 8, 2020

1.7.0

Dec 4, 2020

1.6.1

Nov 23, 2020

1.6.0

Nov 23, 2020

1.5.4

Nov 18, 2020

1.5.3

Nov 18, 2020

1.5.2

Nov 16, 2020

1.5.1

Nov 15, 2020

1.5.0

Nov 13, 2020

1.4.0

Nov 3, 2020

1.3.0

Oct 29, 2020

1.2.1

Sep 28, 2020

1.2.0

Sep 7, 2020

1.1.4

Aug 19, 2020

1.1.3

Aug 18, 2020

1.1.2

Aug 14, 2020

1.1.1

Aug 13, 2020

1.1.0

Aug 12, 2020

1.0.9

Aug 10, 2020

1.0.7

Aug 7, 2020

1.0.6

Aug 6, 2020

1.0.5

Aug 5, 2020

1.0.4

Aug 3, 2020

1.0.3

Aug 2, 2020

1.0.2

Jul 31, 2020

1.0.1

Jul 27, 2020

1.0.0

Jul 27, 2020

0.15.0

Jul 3, 2020

0.14.1

Jun 19, 2020

0.14.0

Jun 18, 2020

0.13.4

Jun 13, 2020

0.13.3

Jun 10, 2020

0.13.2

Jun 10, 2020

0.13.1

Jun 9, 2020

0.13.0

Jun 8, 2020

0.12.0

Jun 6, 2020

0.11.0

Jun 5, 2020

0.10.2

Jun 3, 2020

0.10.1

Jun 1, 2020

0.10.0

May 31, 2020

0.9.4

May 28, 2020

0.9.3

May 28, 2020

0.9.2

May 28, 2020

0.9.1

May 27, 2020

0.9.0

May 26, 2020

0.9.0.beta pre-release

May 26, 2020

0.8.4

May 22, 2020

0.8.3

May 22, 2020

0.8.2

May 22, 2020

0.8.1

May 21, 2020

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

DrissionPage-3.1.2.tar.gz (115.3 kB view hashes)

Uploaded Feb 2, 2023 Source

Built Distribution

DrissionPage-3.1.2-py3-none-any.whl (145.3 kB view hashes)

Uploaded Feb 2, 2023 Python 3

Hashes for DrissionPage-3.1.2.tar.gz

Hashes for DrissionPage-3.1.2.tar.gz
Algorithm	Hash digest
SHA256	`ae4502c8c1310ff3e2400e94c34ead84f2ec0039b4217ee0fe5d7f25717a1408`
MD5	`cddfe06828c7406b20132dcf7da17c36`
BLAKE2b-256	`04d89873cfb5f315b827bd430e95ecc54ed68fcfb678d6bb1e426e1e3170b356`

Hashes for DrissionPage-3.1.2-py3-none-any.whl

Hashes for DrissionPage-3.1.2-py3-none-any.whl
Algorithm	Hash digest
SHA256	`54e5b90f965ff0ceda53259b8590072e0065ae6b11b8a33cf744f6137613be59`
MD5	`788a603ed1904a57d50ddb25ede74f40`
BLAKE2b-256	`bd4550f66ae24e40269fa69cafc613f31e3f2e8a12356f1c28f2a9c644d6ab8a`