Skip to main content

CLI Tool for ENEM PDF Extraction and JSON Export.

Project description

Enem Extractor

en PyPI version Downloads PyPI - Python Version License Issues

English version

⭐ Star this project to support!

Enem Extractor é uma ferramenta CLI que extrai/corrige questões de provas do ENEM e as converte em JSON mantendo assets (imagens, gráficos, etc.)

🏓 Veja uma prova extraida pelo Enem Extractor no mundo real aqui

🗝️ Provas Extraídas

Neste repositório você pode encontrar todas as provas do Enem em JSON extraídas pelo Enem Extractor. Clique aqui para ver.

🎯 Aplicações

  • Machine Learning: Treine modelos de IA com questões do ENEM.

  • Web Apps: Crie aplicativos web para estudantes com questões do ENEM.

  • Banco de Questões: Crie ou Alimente bancos de questões com questões do ENEM.

🚀 Rodando

Para rodar esse projeto você precisa ter o Python (3.6+) e o pip instalados. Você pode baixar o Python aqui.

1. Instale o Enem Extractor

Para rodar o Enem Extractor via pip, execute o seguinte comando no terminal:

pip install enem

2. Extraia uma prova

Após a instalação, você pode extrair questões de uma prova em formato PDF. Supondo que você tenha um arquivo de prova do ENEM chamado prova.pdf no mesmo diretório, basta rodar:

python -m enem prova.pdf

O script irá analisar a prova e extrair as questões, gerando uma pasta com um arquivo de saída em JSON com os dados extraídos e outros assets da prova. Veja mais detalhes da saída do comando aqui.

3. Parâmetros adicionais

Você pode fornecer parâmetros adicionais para personalizar o processo de extração:

  • -f ou --file: Caminho para o arquivo PDF da prova. (obrigatório)
  • -g ou --key: Caminho para o arquivo PDF do gabarito. (opcional)
  • -o ou --output: Caminho onde a pasta dos arquivos extraídos será criada. (opcional)
  • -m ou --minimal: Extração mínima, sem detalhamento de fontes de texto e espaçamento. (opcional)

Exemplo de uso com parâmetros:

python -m enem -f prova.pdf -g gabarito.pdf -o C:\documents

Este comando irá extrair as questões da prova prova.pdf, corrigir com o gabarito gabarito.pdf e salvar a pasta dos resultados em C:\documents.

Saída

Aprenda sobre as saídas que da extração clicando aqui.

demo_enem

🔧 Como Contribuir

  1. Faça um fork deste repositório.
  2. Crie uma venv (python -m venv venv) e ative-a (source venv/bin/activate ou venv/script/activate).
  3. Instale as dependências (pip install -r requirements.txt).
  4. Faça as alterações desejadas, instale o pacote localmente (pip install -e .) e teste.
  5. Faça o commit das suas alterações (git commit -am 'Adiciona nova funcionalidade').
  6. Crie uma branch para a sua modificação (git checkout -b feature/nova-funcionalidade).
  7. Faça suas alterações e commit (git commit -am 'Adiciona nova funcionalidade').
  8. Envie para o repositório original (git push origin feature/nova-funcionalidade).
  9. Crie um novo Pull Request.

📜 Licença

Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para mais detalhes.

📚 Links Úteis


📢 Issues

Caso você tenha alguma dúvida, queira sugerir melhorias ou encontre problemas, fique à vontade para abrir um issue.

🌀 Subdependências

Created with ❤️ by Pedro L. Dias

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

enem-1.0.4.tar.gz (13.3 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

enem-1.0.4-py3-none-any.whl (13.2 kB view details)

Uploaded Python 3

File details

Details for the file enem-1.0.4.tar.gz.

File metadata

  • Download URL: enem-1.0.4.tar.gz
  • Upload date:
  • Size: 13.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.12.7

File hashes

Hashes for enem-1.0.4.tar.gz
Algorithm Hash digest
SHA256 31f007558cc64aad4d4d95f7d2b93cf7d5e6b95e75477eab71286da580dd08d1
MD5 201fd440799d12667a3e705337b87893
BLAKE2b-256 f05c508d38cb64e9e47a5dc957a6329914732c6287592294844039c671c353bd

See more details on using hashes here.

File details

Details for the file enem-1.0.4-py3-none-any.whl.

File metadata

  • Download URL: enem-1.0.4-py3-none-any.whl
  • Upload date:
  • Size: 13.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.12.7

File hashes

Hashes for enem-1.0.4-py3-none-any.whl
Algorithm Hash digest
SHA256 46d4dc9a74140f0f191871bef481b344a52bbcf8d4c8718a6898655ca13d114d
MD5 e77f87af269fc1ee058f25e1167f2092
BLAKE2b-256 25c0f7d6b877cfae527fdb58424fd860125f6cb9ee270aef23668ce7b1ab64dd

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page