Módulo de scraping de tabelas web para o JornadaRPA
Project description
JornadaRPA.WebScrap
JornadaRPA.WebScrap é um módulo Python projetado para facilitar o scraping de dados de tabelas em páginas web, utilizando o BotCity Web Automation e Pandas.
🚀 Funcionalidades
- Extrai dados tabulares de páginas web.
- Suporte para automação com o framework BotCity.
- Retorna os dados em um DataFrame do Pandas.
🛠️ Pré-requisitos
Certifique-se de ter os seguintes pacotes instalados:
botcity-framework-webpandas
Para instalá-los:
pip install botcity-framework-web pandas
## 📦 Como usar
1. Inicie o BotCity WebBot
from botcity.web import WebBot
# Inicializando o bot
bot = WebBot()
bot.start_browser()
bot.navigate_to("https://sua-pagina-web.com")
2. Use o módulo WebScrap
from jornadaRPA.webScrap import Webscrap
# Configurando o scraper
scraper = Webscrap()
# Extraindo dados da tabela
data = scraper.webscrap(
inBot=bot,
inLines=10, # Máximo de linhas a extrair
inNext="//button[@id='next']", # XPath do botão "Próximo"
inXPATH="//table[@id='data']" # XPath da tabela
)
# Visualizando os dados
print(data)
## 🛡️ Licença
Este projeto está licenciado sob a MIT License. Você pode usar, modificar e distribuir este código livremente, desde que mantenha os créditos.
## 📫 Contato
Se você tiver dúvidas, sugestões ou problemas, entre em contato:
Email: alexdiogo@desafiosrpa.com.br
---
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file jornadarpa_webscrap-0.1.2.tar.gz.
File metadata
- Download URL: jornadarpa_webscrap-0.1.2.tar.gz
- Upload date:
- Size: 4.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.1 CPython/3.11.0
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
92741c68c0508fd38c7db749a2bfe41a43d6de36466c28d701231009c3996823
|
|
| MD5 |
53bf4d8ddde760a10af5fb3b9d9cf872
|
|
| BLAKE2b-256 |
44a919dab68c36872fe53c1848979efe48975a55cc9926dff221676390f1ff9b
|
File details
Details for the file JornadaRPA.WebScrap-0.1.2-py3-none-any.whl.
File metadata
- Download URL: JornadaRPA.WebScrap-0.1.2-py3-none-any.whl
- Upload date:
- Size: 4.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/5.1.1 CPython/3.11.0
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
063f9cdc2600cb6c4ee3448d1e79866daf494d961fe3281c4a4169eac7ef2f6c
|
|
| MD5 |
83d720dfd3f55ba2d6db1578aaec6c17
|
|
| BLAKE2b-256 |
ca5f6e8dae96e0b7c3848ac1d6a91987e39deaacd1b6bb0ff388dc1003f0e2ff
|