A modern, declarative, and modular web scraping framework for Python.
Project description
Xcrap for Python
Xcrap é um framework originalmente feito para Node.js, mas, digamos que eu também sou um desenvolvedor Python e, estava um pouco entediado; por isso, resolvi fazer uma versão para Python.
Ainda está em fase experimental, e muito incompleto, só vou garantir o nome no PyPI, o resto, vou fazendo aos poucos. Talvez nos tornemos uma alternativa ao Scrapy, seria ambicioso demais da minha parte? Não sei, mas, vamos tentar, sou meio doido... (me contratem, Zyte :v)
Eu não sou iniciante em web scraping, mas não posso dizer que sou um especialista também, não enfrentei muitos casos; então, peço que, se você souber de algo que eu não sei e puder me ajudar, que me ajude!
O objetivo do Xcrap é ser modular, fácil de plugar com outros clientes Http (e usar até mesmo navegadores via Selenium ou seja qual lá biblioteca existir par isso), tratar JSON, HTML, Markdown (podendo lidar bem com um documento que tenha inclusive os 3 formatos sem problemas) de forma declarativa.
Quero fazer um transformador de dados, mas, até o momento, não consegui fazer essa façanha nem no Node.js, que eu já tenho um ecossitema maior do Xcrap.
Também sou um tanto quanto leigo em testes, então, se puder me ajudar com isso, eu agradeço!
Enfim, estamos aceitando contribuições, precismos documentar tudo isso, e muito mais! :D
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file xcrap-0.0.1.tar.gz.
File metadata
- Download URL: xcrap-0.0.1.tar.gz
- Upload date:
- Size: 8.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.8.3 CPython/3.12.2 Windows/10
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
c619a66cc7075849477e7ae34bd3f0e7465005e606585d01b7dc7047196821b5
|
|
| MD5 |
7adc791510f87c49f8da85739c624eed
|
|
| BLAKE2b-256 |
8d12bfaf390d360a1bb0307b1ca6fb3bed43f45774d820ea7abdab60f2acec7b
|
File details
Details for the file xcrap-0.0.1-py3-none-any.whl.
File metadata
- Download URL: xcrap-0.0.1-py3-none-any.whl
- Upload date:
- Size: 11.4 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.8.3 CPython/3.12.2 Windows/10
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
dfd86f47c3a0a268eb8dde4f0563a9f03955d0561675a3b471363378b2eca8b9
|
|
| MD5 |
f7662ea2c1a30039396ca5bf7ba49406
|
|
| BLAKE2b-256 |
ee73782ef254f3957db0053175b96200250a2ec944d905296eb734d4c815acfa
|