JobScraper, um pacote de raspagem de vagas na internet.

Project description

Projeto JobScraper - Centralize as Vagas Online

O JobScraper Ã© usado puramente para recolher vagas de empregos nos domÃnios especificados abaixo, os centralizando em um arquivo .xlsx:

LinkedIn
Vagas.com
Catho
Glassdoor

InstalaÃ§Ã£o

Use o gerenciador de pacotes pip para instalar o JobScraper:

pip install jb-scraper

UtilizaÃ§Ã£o

from job_scraper.scraping import JobScraper

# Coloque suas pesquisas em uma lista.
query_list = [
    "query 1",
    "query 2",
    "query 3",
    "query n",
]

# Crie o objeto com a classe JobScraper.
objeto = JobScraper(
    domain="palavra-chave",  # Consulte as palavras-chave
    archive_name="sua-escolha",
    query=query_list,
)

# Instancie o objeto com o sequinte mÃ©todo.
objeto.create_archive()

A execuÃ§Ã£o deste cÃ³digo irÃ¡ ativar o Selenium, recolher os dados das vagas e armazenÃ¡-los em um arquivo .xlsx, que por ventura serÃ¡ criado no mesmo local onde estÃ¡ localizado o mÃ³dulo de execuÃ§Ã£o deste pacote.

Sobre o arquivo .xlsx

Como anteriormente dito, o arquivo serÃ¡ criado no diretÃ³rio do mÃ³dulo de execuÃ§Ã£o, o nome deste serÃ¡ decidido no momento de criaÃ§Ã£o do objeto. Em casos de arquivos com o mesmo nome, este serÃ¡ simplesmente atualizado.

Arquivos .xlsx possuem planilhas, estas sÃ£o nomeadas de acordo com a palavra- chave utilizada no parÃ¢metro "dominio", na criaÃ§Ã£o do objeto. Em situaÃ§Ãµes onde o usuÃ¡rio utilize o mesmo nome de arquivo em uma pesquisa nova, em adiÃ§Ã£o a isso, o mesmo nome de planilha, todos os dados da planilha antiga serÃ£o apagados e novos dados serÃ£o postos no lugar, fique ciente disso.

Em casos de arquivos com o mesmo nome, porÃ©m planilhas com nomes diferentes, uma nova planilha serÃ¡ adicionada ao arquivo jÃ¡ existente.

Palavras-chave

"linkedin" --- DomÃnio Utilizado: LinkedIn --- Nome da Planilha: "linkedin"
"vagas.com" --- DomÃnio Utilizado: Vagas.com --- Nome da Planilha: "vagas.com"
"catho" --- DomÃnio Utilizado: Catho --- Nome da Planilha: "catho"
"glassdoor" --- DomÃnio Utilizado: Vagas.com --- Nome da Planilha: "glassdoor"

Sobre os domÃnios

HÃ¡ alguns domÃnios que exigem login, ou informaÃ§Ã£o adicional, como localidade das vagas e afins. Para tanto, Ã© necessÃ¡rio exemplificar as peculiaridades de cada site envolvido no scraping.

O LinkedIn nÃ£o irÃ¡ fazer o scraping imediatamente, para acessar as vagas Ã© preciso fazer o login com a sua conta, no site. Assim que tal aÃ§Ã£o for feita, o script continuarÃ¡ normalmente. A localidade usada serÃ¡ a configurada na sua conta do LinkedIn.

Vagas.com

O site Vagas.com terÃ¡ a query concatenada com a localidade, "cidade estado" ou apenas "estado(por extenso)".

Catho

UsarÃ¡ os dados da query e em seguida, a localidade inserida no parÃ¢metro, certifique-se de usar um local vÃ¡lido, "cidade estado(abreviado)" ou apenas "estado(sigla)".

Glassdoor

UsarÃ¡ os dados da query e em seguida, a localidade inserida no parÃ¢metro, certifique-se de usar um local vÃ¡lido, "cidade estado" ou apenas "estado".

Desenvolvedor

Lucas Aquino de Oliveira --- Meu LinkedIn

LicenÃ§a

MIT

Project details

Release history Release notifications | RSS feed

0.1.2

May 10, 2025

0.1.1

May 10, 2025

0.1.0

May 10, 2025

0.0.9

May 9, 2025

0.0.8 yanked

May 9, 2025

Reason this release was yanked:

import error

0.0.7 yanked

Apr 19, 2025

Reason this release was yanked:

bug with linkedin footer element

0.0.6

Apr 19, 2025

0.0.5 yanked

Apr 15, 2025

Reason this release was yanked:

Does not work

This version

0.0.4

Apr 9, 2025

0.0.3

Apr 9, 2025

0.0.2

Apr 9, 2025

0.0.1 yanked

Apr 8, 2025

Reason this release was yanked:

unconventional root name

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

jb_scraper-0.0.4.tar.gz (5.5 kB view details)

Uploaded Apr 9, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

jb_scraper-0.0.4-py3-none-any.whl (7.8 kB view details)

Uploaded Apr 9, 2025 Python 3

File details

Details for the file jb_scraper-0.0.4.tar.gz.

File metadata

Download URL: jb_scraper-0.0.4.tar.gz
Upload date: Apr 9, 2025
Size: 5.5 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.1.0 CPython/3.12.6

File hashes

Hashes for jb_scraper-0.0.4.tar.gz
Algorithm	Hash digest
SHA256	`4c6814812c5d83ccb3ba10567190d4325fd7e9c3f452ac9c82c4b890520f9b9c`
MD5	`632835826b209a50050bbf2be8aef7f4`
BLAKE2b-256	`cbc5bd3a48d9d6d86c3e01381d51b42c347f0754dac88e4c7d2e05786a74dd6e`

See more details on using hashes here.

File details

Details for the file jb_scraper-0.0.4-py3-none-any.whl.

File metadata

Download URL: jb_scraper-0.0.4-py3-none-any.whl
Upload date: Apr 9, 2025
Size: 7.8 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.1.0 CPython/3.12.6

File hashes

Hashes for jb_scraper-0.0.4-py3-none-any.whl
Algorithm	Hash digest
SHA256	`cc7d3f5b62d7beafb4fea78c3979cdf17d9deeb4d9ecf81f340076340f31158a`
MD5	`b785afa79d8eb8deea5cfb3db83e4e9c`
BLAKE2b-256	`81ab6a35d02fec2de349f253b1b376dba6f2650d3eaa30146ae4e49ceba2db07`

See more details on using hashes here.

jb-scraper 0.0.4

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Project description

Projeto JobScraper - Centralize as Vagas Online

InstalaÃ§Ã£o

UtilizaÃ§Ã£o

Sobre o arquivo .xlsx

Palavras-chave

Sobre os domÃnios

LinkedIn

Vagas.com

Catho

Glassdoor

Desenvolvedor

LicenÃ§a

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

jb-scraper 0.0.4

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Project description

Projeto JobScraper - Centralize as Vagas Online

InstalaÃ§Ã£o

UtilizaÃ§Ã£o

Sobre o arquivo .xlsx

Palavras-chave

Sobre os domÃ­nios

LinkedIn

Vagas.com

Catho

Glassdoor

Desenvolvedor

LicenÃ§a

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

Sobre os domÃnios