Skip to main content

A modern, declarative, and modular web scraping framework for Python.

Project description

Xcrap for Python

Xcrap é um framework originalmente feito para Node.js, mas, digamos que eu também sou um desenvolvedor Python e, estava um pouco entediado; por isso, resolvi fazer uma versão para Python.

Ainda está em fase experimental, e muito incompleto, só vou garantir o nome no PyPI, o resto, vou fazendo aos poucos. Talvez nos tornemos uma alternativa ao Scrapy, seria ambicioso demais da minha parte? Não sei, mas, vamos tentar, sou meio doido... (me contratem, Zyte :v)

Eu não sou iniciante em web scraping, mas não posso dizer que sou um especialista também, não enfrentei muitos casos; então, peço que, se você souber de algo que eu não sei e puder me ajudar, que me ajude!

O objetivo do Xcrap é ser modular, fácil de plugar com outros clientes Http (e usar até mesmo navegadores via Selenium ou seja qual lá biblioteca existir par isso), tratar JSON, HTML, Markdown (podendo lidar bem com um documento que tenha inclusive os 3 formatos sem problemas) de forma declarativa.

Quero fazer um transformador de dados, mas, até o momento, não consegui fazer essa façanha nem no Node.js, que eu já tenho um ecossitema maior do Xcrap.

Também sou um tanto quanto leigo em testes, então, se puder me ajudar com isso, eu agradeço!

Enfim, estamos aceitando contribuições, precismos documentar tudo isso, e muito mais! :D

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

xcrap-0.0.1.tar.gz (8.7 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

xcrap-0.0.1-py3-none-any.whl (11.4 kB view details)

Uploaded Python 3

File details

Details for the file xcrap-0.0.1.tar.gz.

File metadata

  • Download URL: xcrap-0.0.1.tar.gz
  • Upload date:
  • Size: 8.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.12.2 Windows/10

File hashes

Hashes for xcrap-0.0.1.tar.gz
Algorithm Hash digest
SHA256 c619a66cc7075849477e7ae34bd3f0e7465005e606585d01b7dc7047196821b5
MD5 7adc791510f87c49f8da85739c624eed
BLAKE2b-256 8d12bfaf390d360a1bb0307b1ca6fb3bed43f45774d820ea7abdab60f2acec7b

See more details on using hashes here.

File details

Details for the file xcrap-0.0.1-py3-none-any.whl.

File metadata

  • Download URL: xcrap-0.0.1-py3-none-any.whl
  • Upload date:
  • Size: 11.4 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/1.8.3 CPython/3.12.2 Windows/10

File hashes

Hashes for xcrap-0.0.1-py3-none-any.whl
Algorithm Hash digest
SHA256 dfd86f47c3a0a268eb8dde4f0563a9f03955d0561675a3b471363378b2eca8b9
MD5 f7662ea2c1a30039396ca5bf7ba49406
BLAKE2b-256 ee73782ef254f3957db0053175b96200250a2ec944d905296eb734d4c815acfa

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page