Skip to main content

CLI para transcrição de audiências judiciais com WhisperX e diarização

Project description

tecjustica-transcribe

CLI para transcrição de audiências judiciais com WhisperX e diarização de falantes.

Transcreve vídeos MP4 gerando texto com timestamps e identificação de quem está falando (Juiz, Promotor, Advogado, etc. — identificados como SPEAKER_00, SPEAKER_01...).

Requisitos do Sistema

Sistema Operacional

SO Suporte Observações
Ubuntu/Debian (WSL2) ✅ Testado Recomendado para usuários Windows
Ubuntu/Debian nativo ✅ Compatível Instalação direta
Windows nativo ❌ Não suportado Use WSL2 (veja Guia WSL2)
macOS ❌ Não suportado Requer GPU NVIDIA (CUDA)

Usuários Windows: instale o WSL2 com Ubuntu. O WSL2 acessa a GPU NVIDIA do Windows automaticamente.

Hardware

Componente Mínimo Recomendado
GPU NVIDIA 6 GB VRAM (ex: RTX 3050) 8 GB+ VRAM (ex: RTX 3060, RTX 4060)
RAM 8 GB 16 GB
Disco 10 GB livres (para modelos de IA) 15 GB+

GPUs AMD e Intel não são compatíveis. É necessária uma GPU NVIDIA com suporte a CUDA.

Software

Dependência Como instalar Verificar
Driver NVIDIA nvidia.com/drivers ou Windows Update nvidia-smi
CUDA Instalado automaticamente junto com o PyTorch python3 -c "import torch; print(torch.cuda.is_available())"
ffmpeg sudo apt install ffmpeg ffmpeg -version
Python 3.10–3.13 sudo apt install python3.12 python3 --version
uv (gerenciador recomendado) curl -LsSf https://astral.sh/uv/install.sh | sh uv --version

Não sabe se está tudo certo? Rode tecjustica-transcribe init após instalar — ele verifica tudo e mostra o que está faltando.

Token HuggingFace (necessário para identificar falantes)

A diarização (identificar quem está falando) usa o modelo pyannote, que exige um token gratuito do HuggingFace:

  1. Crie uma conta em https://huggingface.co/join
  2. Acesse https://huggingface.co/pyannote/speaker-diarization-community-1 e clique em "Agree and access repository"
  3. Gere um token do tipo "Read" em https://huggingface.co/settings/tokens

O comando init vai pedir esse token e salvá-lo na sua máquina.

Sem o token, você ainda pode transcrever usando --sem-diarizacao — a transcrição funciona normalmente, só não identifica os falantes.

Instalação

Primeiro, instale o uv (se ainda não tiver):

curl -LsSf https://astral.sh/uv/install.sh | sh
source ~/.bashrc  # recarregar o terminal

Depois, instale o tecjustica-transcribe:

uv tool install tecjustica-transcribe

Alternativa com pip (se preferir não usar uv):

pip install tecjustica-transcribe

Atualizar para versão mais recente

uv tool install tecjustica-transcribe --force --refresh

Passo a Passo: Do Zero à Transcrição

1. Verificar requisitos (só precisa rodar uma vez)

tecjustica-transcribe init

O init verifica seu sistema, baixa os modelos de IA (~3 GB no primeiro uso) e pede o token HuggingFace:

╭──────────────── TecJustiça Transcribe — Diagnóstico ─────────────────╮
│ Python            ✅ 3.12.3                                          │
│ Driver NVIDIA     ✅ 591.44                                          │
│ CUDA              ✅ 12.8                                            │
│ GPU               ✅ NVIDIA GeForce RTX 3050 6GB Laptop GPU (6.0 GB) │
│ ffmpeg            ✅ 6.1.1                                           │
│ Token HuggingFace ✅ hf_pcgK...                                      │
╰──────────────────────────────────────────────────────────────────────╯
✅ Tudo pronto para transcrever!

Se algum item mostrar ❌, resolva antes de transcrever (veja Solução de Problemas).

2. Transcrever

# Com identificação de falantes (~13 min para 1h de vídeo)
tecjustica-transcribe transcrever audiencia.mp4

# Sem identificar falantes, mais rápido (~2 min para 1h de vídeo)
tecjustica-transcribe transcrever audiencia.mp4 --sem-diarizacao

# Escolher pasta de saída (padrão: ./transcricoes/)
tecjustica-transcribe transcrever audiencia.mp4 --output ./minha-pasta

Usuários WSL2: os arquivos do Windows ficam em /mnt/c/. Exemplo:

# Arquivo em C:\Users\marcos\Downloads\audiencia.mp4
tecjustica-transcribe transcrever /mnt/c/Users/marcos/Downloads/audiencia.mp4

3. Resultado

Os arquivos são salvos na pasta ./transcricoes/ (relativa a onde você rodou o comando):

Arquivo Formato Para que serve
audiencia.txt Texto puro com [SPEAKER_00] Leitura e análise
audiencia.srt Legendas com timestamps Abrir em players (VLC, etc.)
audiencia.json Dados completos por palavra Integração com outros sistemas

Exemplo do .txt:

[SPEAKER_02]
Boa tarde, meu nome é Fabriziane, eu sou juiz aqui na violência doméstica.

[SPEAKER_00]
Boa tarde, senhora Neide, meu nome é Vinícius, eu sou promotor de justiça.

[SPEAKER_04]
Boa tarde, tudo bem.

Solução de Problemas

Problema Solução
nvidia-smi não encontrado Instale o driver NVIDIA: nvidia.com/drivers
CUDA não disponível Verifique se o driver NVIDIA é compatível com CUDA 12+. No WSL2, atualize o driver do Windows
Erro de memória (OOM) Feche outros programas (especialmente navegadores). Tente --sem-diarizacao
Token HuggingFace negado (403) Aceite os termos em huggingface.co/pyannote/speaker-diarization-community-1
ffmpeg não encontrado sudo apt install ffmpeg
uv: command not found Instale o uv: curl -LsSf https://astral.sh/uv/install.sh | sh e depois source ~/.bashrc
Transcrição muito lenta Verifique se está usando GPU (init deve mostrar GPU ✅). CPU é 10x mais lento

Guia Rápido: Windows com WSL2

Se você usa Windows e nunca usou WSL2, siga estes passos:

# 1. Abrir PowerShell como Administrador e instalar WSL2
wsl --install
# Reinicie o computador quando solicitado
# 2. Abrir o Ubuntu (WSL2) e instalar dependências
sudo apt update && sudo apt install -y ffmpeg python3.12

# 3. Instalar uv (gerenciador de pacotes Python)
curl -LsSf https://astral.sh/uv/install.sh | sh
source ~/.bashrc

# 4. Instalar tecjustica-transcribe
uv tool install tecjustica-transcribe

# 5. Configurar (só uma vez — pede o token HuggingFace)
tecjustica-transcribe init

# 6. Transcrever! (arquivo do Windows acessível via /mnt/c/)
tecjustica-transcribe transcrever /mnt/c/Users/SeuUsuario/Downloads/audiencia.mp4

Dica: No WSL2, C:\Users\marcos\Downloads\ vira /mnt/c/Users/marcos/Downloads/

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

tecjustica_transcribe-0.1.5.tar.gz (8.7 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

tecjustica_transcribe-0.1.5-py3-none-any.whl (11.2 kB view details)

Uploaded Python 3

File details

Details for the file tecjustica_transcribe-0.1.5.tar.gz.

File metadata

  • Download URL: tecjustica_transcribe-0.1.5.tar.gz
  • Upload date:
  • Size: 8.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.9.16 {"installer":{"name":"uv","version":"0.9.16","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"24.04","id":"noble","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}

File hashes

Hashes for tecjustica_transcribe-0.1.5.tar.gz
Algorithm Hash digest
SHA256 aa6f4cb55851dbcd105a3471e68ecc1073965d6b1f6a6fb40aaa653771bc4506
MD5 e822f322b90e1ed8bbd0abc975dd9756
BLAKE2b-256 8a6a864cd24a54b65320d39baaaab77cf25477efe0227eb8da36b3946ca8dfb2

See more details on using hashes here.

File details

Details for the file tecjustica_transcribe-0.1.5-py3-none-any.whl.

File metadata

  • Download URL: tecjustica_transcribe-0.1.5-py3-none-any.whl
  • Upload date:
  • Size: 11.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.9.16 {"installer":{"name":"uv","version":"0.9.16","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"24.04","id":"noble","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}

File hashes

Hashes for tecjustica_transcribe-0.1.5-py3-none-any.whl
Algorithm Hash digest
SHA256 b6dc62b1c6d5e6c702f874200d325d3c96caa9d5e2e1dafd2d30ad100dd1d947
MD5 d7c1be9887612f4756ff6b38050d8e10
BLAKE2b-256 4d831c2baf8593eb64eff0728b2cd0a267638b6a49b612475ef92232e79ed469

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page