CLI Tool for ENEM PDF Extraction and JSON Export.
Project description
Enem Extractor
⭐ Star this project to support!
Enem Extractor é uma ferramenta CLI que extrai/corrige questões de provas do ENEM e as converte em JSON mantendo assets (imagens, gráficos, etc.)
🏓 Veja uma prova extraida pelo Enem Extractor no mundo real aqui
🗝️ Provas Extraídas
Neste repositório você pode encontrar todas as provas do Enem em JSON extraídas pelo Enem Extractor. Clique aqui para ver.
🎯 Aplicações
-
Machine Learning: Treine modelos de IA com questões do ENEM.
-
Web Apps: Crie aplicativos web para estudantes com questões do ENEM.
-
Banco de Questões: Crie ou Alimente bancos de questões com questões do ENEM.
🚀 Rodando
Para rodar esse projeto você precisa ter o Python (3.6+) e o pip instalados. Você pode baixar o Python aqui.
1. Instale o Enem Extractor
Para rodar o Enem Extractor via
pip, execute o seguinte comando no terminal:
pip install enem
2. Extraia uma prova
Após a instalação, você pode extrair questões de uma prova em formato PDF. Supondo que você tenha um arquivo de prova do ENEM chamado prova.pdf no mesmo diretório, basta rodar:
python -m enem prova.pdf
O script irá analisar a prova e extrair as questões, gerando uma pasta com um arquivo de saída em JSON com os dados extraídos e outros assets da prova. Veja mais detalhes da saída do comando aqui.
3. Parâmetros adicionais
Você pode fornecer parâmetros adicionais para personalizar o processo de extração:
-fou--file: Caminho para o arquivo PDF da prova. (obrigatório)-gou--key: Caminho para o arquivo PDF do gabarito. (opcional)-oou--output: Caminho onde a pasta dos arquivos extraídos será criada. (opcional)-mou--minimal: Extração mínima, sem detalhamento de fontes de texto e espaçamento. (opcional)
Exemplo de uso com parâmetros:
python -m enem -f prova.pdf -g gabarito.pdf -o C:\documents
Este comando irá extrair as questões da prova prova.pdf, corrigir com o gabarito gabarito.pdf e salvar a pasta dos resultados em C:\documents.
Saída
Aprenda sobre as saídas que da extração clicando aqui.
🔧 Como Contribuir
- Faça um fork deste repositório.
- Crie uma venv (
python -m venv venv) e ative-a (source venv/bin/activateouvenv/script/activate). - Instale as dependências (
pip install -r requirements.txt). - Faça as alterações desejadas, instale o pacote localmente (
pip install -e .) e teste. - Faça o commit das suas alterações (
git commit -am 'Adiciona nova funcionalidade'). - Crie uma branch para a sua modificação (
git checkout -b feature/nova-funcionalidade). - Faça suas alterações e commit (
git commit -am 'Adiciona nova funcionalidade'). - Envie para o repositório original (
git push origin feature/nova-funcionalidade). - Crie um novo Pull Request.
📜 Licença
Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para mais detalhes.
📚 Links Úteis
📢 Issues
Caso você tenha alguma dúvida, queira sugerir melhorias ou encontre problemas, fique à vontade para abrir um issue.
🌀 Subdependências
Created with ❤️ by Pedro L. Dias
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file enem-1.0.4.tar.gz.
File metadata
- Download URL: enem-1.0.4.tar.gz
- Upload date:
- Size: 13.3 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
31f007558cc64aad4d4d95f7d2b93cf7d5e6b95e75477eab71286da580dd08d1
|
|
| MD5 |
201fd440799d12667a3e705337b87893
|
|
| BLAKE2b-256 |
f05c508d38cb64e9e47a5dc957a6329914732c6287592294844039c671c353bd
|
File details
Details for the file enem-1.0.4-py3-none-any.whl.
File metadata
- Download URL: enem-1.0.4-py3-none-any.whl
- Upload date:
- Size: 13.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
46d4dc9a74140f0f191871bef481b344a52bbcf8d4c8718a6898655ca13d114d
|
|
| MD5 |
e77f87af269fc1ee058f25e1167f2092
|
|
| BLAKE2b-256 |
25c0f7d6b877cfae527fdb58424fd860125f6cb9ee270aef23668ce7b1ab64dd
|