Raspador de tribunais e outros sistemas relacionados ao poder judiciário.

These details have not been verified by PyPI

Project description

juscraper

Raspador de tribunais e outros sistemas relacionados ao poder judiciário brasileiro.

📦 Instalação

Via PyPI (Recomendado)

pip install juscraper

Com uv

uv add juscraper

Versão de Desenvolvimento

Para instalar a versão mais recente do repositório:

pip install git+https://github.com/jtrecenti/juscraper.git

🚀 Exemplo Rápido

import juscraper as jus

# Criar scraper para o TJSP
tjsp = jus.scraper('tjsp')

# Buscar jurisprudência
dados = tjsp.cjpg('golpe do pix', paginas=range(1, 4))
print(f"Encontrados {len(dados)} resultados")

# Visualizar primeiros resultados
dados.head()

📊 Implementações

Tribunais Disponíveis

Tribunal	Funcionalidades Disponíveis
TJSP	cpopg, cposg, cjsg, cjpg, acordao
TJRS	cjsg
TJPR	cjsg
TJDFT	cjsg

Agregadores Disponíveis

Nome	Funcionalidades
Datajud	listar_processos
Jusbr	cpopg, download_documents

Notebooks de Exemplo

Detalhes

O pacote foi pensado para atender a requisitos básicos de consulta de dados de processos judiciais em alguns tribunais.

Os tribunais implementados vão apresentar os seguintes métodos:

.cpopg(): consulta de processos originários do primeiro grau
.cposg(): consulta de processos originários do segundo grau
.cjsg(): consulta de jurisprudência

Os métodos .cpopg() e .cposg() recebem como input um número de processo no padrão CNJ (NNNNNNN-DD.AAAA.J.TT.OOOO), com ou sem separadores, e retorna um dict com tabelas dos elementos do processo (dados básicos, partes, movimentações, entre outros específicos por tribunal).

O método .cjsg() recebe como input parâmetros de busca de jurisprudência (que variam por tribunal) e retorna uma tabela com os resultados da consulta. Boa parte dos tribunais apresentam limites de paginação ao realizar buscas muito gerais (i.e. que retornam muitos resultados). Nesses casos, o método dará um aviso ao usuário com o número total de resultados, confirmando se deseja mesmo baixar todos os resultados.

Controle de arquivos

Caso o usuário queira controlar o armazenamento dos arquivos brutos dos processos, deverá implementar as seguintes funções:

.cpopg_download(): baixa o arquivo bruto da consulta de processos originários do primeiro grau, retornando o caminho do arquivo baixado.
.cpopg_parse(): lê e processa um arquivo bruto ou arquivos dentro de uma pasta resultantes da consulta de processos, retornando o dict com tabelas dos elementos do processo, como na função .cpopg().

O mesmo se aplica para as funções .cposg_download() e .cposg_parse().

Observação: Em alguns tribunais ou situações específicas, a consulta a um processo pode gerar vários arquivos brutos. Por esse motivo, toda consulta cria uma pasta com o número do processo e, dentro dessa pasta, cria os arquivos correspondentes ao download.

Para a função .cjsg(), uma consulta pode resultar

Diferenciais do `juscraper`

Controle sobre arquivos brutos: o pacote fornece uma interface para baixar e armazenar arquivos brutos (HTML e JSON, por exemplo) dos processos. Por padrão, no entanto, esses arquivos brutos são descartados assim que os dados são processados, com exceção dos arquivos que apresentaram algum problema na leitura.

Restrições

Por ser um pacote bastante complexo e também nichado, adotamos algumas restrições sobre o escopo do pacote para que seja simples de usar.

O pacote não utiliza paralelização, ou seja, se o usuário tiver interesse em realizar requisições em paralelo, deverá desenvolver as adaptações necessárias.
O pacote não possui absolutamente todas as funcionalidades que os tribunais permitem. Se o usuário tiver interesse em consultar processos em mais tribunais, deverá desenvolver os raspadores.

Por que não um `juscraper` no R?

O pacote juscraper foi criado em python inicialmente com o propósito de ser usado em aulas de Ciência de Dados no Direito do Insper. Portanto, não houve incentivo nem fôlego para criar uma alternativa em R.

Já existem soluções usando o R para esses raspadores, como os pacotes tjsp e stj, mas a comunidade convergiu para soluções em python, que atualmente são mais populares.

Observação sobre o parâmetro `paginas`

O parâmetro paginas é 1-based em todos os scrapers. Ao utilizar as funções de download, range(1, n+1) faz o download das páginas 1 até n, ou seja, range(1, 4) baixa as páginas 1, 2 e 3. Onde suportado, passar um inteiro (ex: paginas=3) é equivalente a range(1, 4).

Exemplo de uso:

scraper.cjsg_download(pesquisa="dano moral", paginas=range(1, 6))  # Baixa as páginas 1 a 5
scraper.cjpg_download(pesquisa="contrato", paginas=range(1, 3))    # Baixa as páginas 1 e 2

Instalação em desenvolvimento

Para instalar o pacote em modo desenvolvimento, siga os passos abaixo:

# Clone o repositório (caso ainda não tenha feito)
$ git clone https://github.com/jtrecenti/juscraper.git
$ cd juscraper

# Instale as dependências e o pacote em modo editável
$ uv pip install -e .

Contribuição

Interessado em contribuir? Verifique as diretrizes de contribuição. Por favor, note que este projeto é lançado com um Código de Conduta. Ao contribuir para este projeto, você concorda em obedecer às suas termos.

Licença

juscraper foi criado por Julio Trecenti. Está licenciado sob os termos da licença MIT.

Créditos

juscraper foi criado com cookiecutter e o template py-pkgs-cookiecutter.

Project details

These details have not been verified by PyPI

Release history Release notifications | RSS feed

0.3.0

May 3, 2026

0.2.1

Apr 13, 2026

0.2.0

Apr 9, 2026

This version

0.1.7

Mar 31, 2026

0.1.6

Mar 31, 2026

0.1.5

Dec 28, 2025

0.1.4

Nov 29, 2025

0.1.3

Jul 20, 2025

0.1.0

Jul 19, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

juscraper-0.1.7.tar.gz (93.3 kB view details)

Uploaded Mar 31, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

juscraper-0.1.7-py3-none-any.whl (69.6 kB view details)

Uploaded Mar 31, 2026 Python 3

File details

Details for the file juscraper-0.1.7.tar.gz.

File metadata

Download URL: juscraper-0.1.7.tar.gz
Upload date: Mar 31, 2026
Size: 93.3 kB
Tags: Source
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for juscraper-0.1.7.tar.gz
Algorithm	Hash digest
SHA256	`551640704004c1bdc10c740d8ffa05dab3fa6d018c8374984fb10e2ac58f9f57`
MD5	`3fd8d19b9b480227fbd121936c91fa96`
BLAKE2b-256	`0615343b9ed3eac23cc4475251f7957d0b12dd0ae1937baaceadf3ae596efa91`

See more details on using hashes here.

Provenance

The following attestation bundles were made for juscraper-0.1.7.tar.gz:

Publisher: publish.yml on jtrecenti/juscraper

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: juscraper-0.1.7.tar.gz
- Subject digest: 551640704004c1bdc10c740d8ffa05dab3fa6d018c8374984fb10e2ac58f9f57
- Sigstore transparency entry: 1203593914
- Sigstore integration time: Mar 31, 2026
Source repository:
- Permalink: jtrecenti/juscraper@31ff4fd83b42f37428f3f984a737ab46ea9ddaf4
- Branch / Tag: refs/heads/main
- Owner: https://github.com/jtrecenti
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: publish.yml@31ff4fd83b42f37428f3f984a737ab46ea9ddaf4
- Trigger Event: workflow_dispatch

File details

Details for the file juscraper-0.1.7-py3-none-any.whl.

File metadata

Download URL: juscraper-0.1.7-py3-none-any.whl
Upload date: Mar 31, 2026
Size: 69.6 kB
Tags: Python 3
Uploaded using Trusted Publishing? Yes
Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for juscraper-0.1.7-py3-none-any.whl
Algorithm	Hash digest
SHA256	`6aa04e637398a06794a35d88dd55c3d801c03e1cd3c52bce512cef9774ec6505`
MD5	`16b199e7a28df50c651da26a94320bd4`
BLAKE2b-256	`664d3953b9d738fda1499d49a8a3171b987e229ebe98554ff2ffcf93ece754d8`

See more details on using hashes here.

Provenance

The following attestation bundles were made for juscraper-0.1.7-py3-none-any.whl:

Publisher: publish.yml on jtrecenti/juscraper

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Statement:
- Statement type: https://in-toto.io/Statement/v1
- Predicate type: https://docs.pypi.org/attestations/publish/v1
- Subject name: juscraper-0.1.7-py3-none-any.whl
- Subject digest: 6aa04e637398a06794a35d88dd55c3d801c03e1cd3c52bce512cef9774ec6505
- Sigstore transparency entry: 1203593916
- Sigstore integration time: Mar 31, 2026
Source repository:
- Permalink: jtrecenti/juscraper@31ff4fd83b42f37428f3f984a737ab46ea9ddaf4
- Branch / Tag: refs/heads/main
- Owner: https://github.com/jtrecenti
- Access: public
Publication detail:
- Token Issuer: https://token.actions.githubusercontent.com
- Runner Environment: github-hosted
- Publication workflow: publish.yml@31ff4fd83b42f37428f3f984a737ab46ea9ddaf4
- Trigger Event: workflow_dispatch

juscraper 0.1.7

Navigation

Verified details

Project links

GitHub Statistics

Maintainers

Unverified details

Meta

Classifiers

Project description

juscraper

📦 Instalação

Via PyPI (Recomendado)

Com uv

Versão de Desenvolvimento

🚀 Exemplo Rápido

📊 Implementações

Tribunais Disponíveis

Agregadores Disponíveis

Notebooks de Exemplo

Detalhes

Controle de arquivos

Diferenciais do juscraper

Restrições

Por que não um juscraper no R?

Observação sobre o parâmetro paginas

Instalação em desenvolvimento

Contribuição

Licença

Créditos

Project details

Verified details

Project links

GitHub Statistics

Maintainers

Unverified details

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

Provenance

File details

File metadata

File hashes

Provenance

Diferenciais do `juscraper`

Por que não um `juscraper` no R?

Observação sobre o parâmetro `paginas`