Skip to main content

Ferramenta de scraping de categorias da OLX BR com suporte a notificação de anúncios novos no GMail.

Project description

OLXCRAPPER

Introdução

Script em Python + Beautiful Soup que realiza consultas exaustivas em categorias da OLX em busca de anúncios novos, ao encontrar um novo anúncio nessa categoria, ele usa as credenciais de login do GMail fornecidas nas variáveis do script para enviar para o próprio usuário um Email com informações sobre o novo produto da categoria.

Requisitos

Esse script depende do Python e dos módulos: bs4, requests, lxml, argparse.

O usuário tem que usar uma conta do GMail, por enquanto é o unico servidor suportado.

Instalação e uso

pip install olxcrapper
olxcrapper -g seuemail@gmail.com -s senhadogmail -u https://sp.olx.com.br/celulares -t 60

Substitua os dados de login acima com suas credenciais do gmail e com o link da categoria desejada.

  • Quanto a conta do GMail, sugiro criar uma nova conta pra uso desse script para que sua caixa de entrada não seja floodada com emails do tipo, é importante que na conta do GMail utilizada esteja habilitada a opção de acesso de apps menos confiáveis.

  • Caso deseje mais segurança ao utilizar sua conta, habilite a opção de autenticação de dois fatores e crie uma senha exclusiva para o uso desse script, esse tipo de senha é gerada automaticamente pela conta da google e tem 16 caracteres, ex: "gzhupbrkrdbfhpiy", você pode gerar uma senha de app aqui: https://security.google.com/settings/security/apppasswords

  • Quanto ao link da categoria da olx desejada, para obter um link utilizável, acesse a categoria da olx desejada escolha seu estado e/ou cidade e copie o link do navegador pra substituir no comando exemplificado acima.

  • O script irá executar continuamente e irá atualizar a lista a cada -t segundos, sempre que encontrar um anúncio novo na categoria referida pelo usuário, o mesmo enviará um email para a caixa de entrada do GMail indicado, esse script só enviará email caso haja um anuncio novo, assim evitando floodar a caixa de entrada.

OBS: é importante inserir os dados de login corretamente, caso estejam incorretos, o script executará, mostrará a listagem de anúncios mas não conseguirá notificar por email. Também é interessante deixar o argumento -t com valor 60 pois a listagem da olx só atualiza a cada 1 minuto, valores menores que 60 segundos pode causar mau comportamento do script.

Autor

Yago Lima Lins

Contribua com o projeto

Contribuições, bugs e pedidos de novas funcionalidades são bem vindos! Sinta-se a vontade para conferir: issues page.

Apoie o autor

Considere fazer uma contribuição no patreon caso esse script seja útil pra você :)

https://www.patreon.com/yagolimalins

Licença

Copyright © 2020 Yago Lima Lins. This project is GNU licensed.


Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

olxcrapper-0.1.8.tar.gz (17.3 kB view details)

Uploaded Source

Built Distribution

olxcrapper-0.1.8-py3-none-any.whl (17.3 kB view details)

Uploaded Python 3

File details

Details for the file olxcrapper-0.1.8.tar.gz.

File metadata

  • Download URL: olxcrapper-0.1.8.tar.gz
  • Upload date:
  • Size: 17.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/47.3.1 requests-toolbelt/0.9.1 tqdm/4.46.1 CPython/3.8.3

File hashes

Hashes for olxcrapper-0.1.8.tar.gz
Algorithm Hash digest
SHA256 606e7b179ef383f5a45f8cecf009127a11e33617133b2380e8ddbc5af835be91
MD5 aa73ee2d7898ef5cde7efe76cae50b81
BLAKE2b-256 adc1b4776fe46fc946ecb741414ae0139aaf1e58d4dfc3a350ed453a76ec7e49

See more details on using hashes here.

File details

Details for the file olxcrapper-0.1.8-py3-none-any.whl.

File metadata

  • Download URL: olxcrapper-0.1.8-py3-none-any.whl
  • Upload date:
  • Size: 17.3 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/47.3.1 requests-toolbelt/0.9.1 tqdm/4.46.1 CPython/3.8.3

File hashes

Hashes for olxcrapper-0.1.8-py3-none-any.whl
Algorithm Hash digest
SHA256 174cc80538bc68e987408813587d502742f8c6c0190cf14cfa5b34ea00d483ec
MD5 952b8fc832537f3175a4b075f4a0834f
BLAKE2b-256 3816c893a4a0cb92ff5acc8d647a701bfecba58f997bd5d58713401f79b0c791

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page