Skip to main content

~70% menos tokens em documentos PT-BR — extracao de entidades fiscal/juridico/ERP para Claude Code via MCP

Project description

hane-mcp-client

PyPI Python

Pare de gastar tokens enviando documentos inteiros para o LLM.

hane-mcp-client conecta o Claude Code (ou qualquer cliente MCP) ao pipeline HANE — um extrator de entidades com compressão semântica hierárquica que entrega ao LLM apenas a informação estruturada de um documento, sem chamar nenhum LLM internamente e sem expor o conteúdo bruto.

Resultado típico: ~70% menos tokens no prompt, em PT-BR, para contratos, notas fiscais, código ERP e documentos jurídicos.

🚀 Experimente agora, sem instalar nem precisar de chave: demo ao vivo em haneia.com.br — cole um trecho e veja a compressão acontecer.


O problema que ele resolve

No fluxo normal, para o Claude analisar um arquivo de 1.000 palavras ele precisa lê-lo para o contexto — e você paga por cada token, duas vezes (entrada do arquivo + reprocessamento):

Claude lê o arquivo    →  ~1.000 tokens no contexto
Claude reenvia o texto →  +1.000 tokens
Total: ~2.000 tokens por documento

Com o HANE, o arquivo é lido no seu disco, processado e o Claude recebe só as entidades comprimidas:

annotate_file_local("contrato.pdf")  →  1 linha
HANE extrai e comprime               →  ~80 tokens de entidades
Total: ~80 tokens  ·  o Claude nunca vê o documento bruto

~25× menos tokens no documento — e o conteúdo sensível não transita pelo modelo.

Exemplo real

Entrada — seção CALENDÁRIO de um edital público (Programa Scale IA 2026 — Sebrae Startups + AKCIT/CEIA/UFG):

5. CALENDÁRIO. Período de inscrições do Programa Scale IA, com etapas em
São Paulo (Feira do Empreendedor 2026) e Florianópolis: 26/04/2026,
05/05/2026, 06/05/2026, 30/05/2026, 27/06/2026, 25/07/2026, 15/08/2026,
12/09/2026, 03/10/2026 e Demo Day de 19 a 22/10/2026.

Saída do HANE — domínio juridico, −66% tokens, sem chamar nenhum LLM:

[Data]         26/04/2026 | 05/05/2026 | 06/05/2026 | 30/05/2026 | 27/06/2026 |
               25/07/2026 | 15/08/2026 | 12/09/2026 | 03/10/2026
[Cidade]       São Paulo | Florianópolis
[Periodo]      Feira do Empreendedor 2026 | 19 a 22/10/2026
[ORGANIZACAO]  Programa Scale IA

É isso que o Claude recebe — só os fatos estruturados, não o documento inteiro. (Run real do pipeline; a cobertura por entidade varia com o domínio e o threshold.)


Por que confiar nos números

Medições reais do pipeline HANE (não estimativas de marketing):

Métrica Valor Contexto
Redução de tokens no prompt ~70% média em lote de documentos
F1 de extração 0.853 28 manuais técnicos TOTVS
Custo GPT-4o em lote $2.99 → $0.44 mesmos 28 documentos, pós-compressão
Caso real (TJ-GO) −86% tokens 63 acórdãos, latência E2E mediana 147ms
Latência pós-otimização 11,4× mais rápido 248s → 21s por documento

Motor por trás do client: pipeline HANE de 6 camadas (grafo semântico comprimido → NER hierárquico por ontologia → budget adaptativo por entropia → cache matricial de padrões → extração determinística por regex → grafo de memória de contexto entre turnos). Software registrado no INPI (BR 51 2026 002247-9).


Início rápido (3 passos)

1. Instale

pip install hane-mcp-client
# ou, sem instalar de forma permanente:
uvx hane-mcp-client

2. Pegue sua API Key em haneia.com.br — há plano de avaliação (trial).

3. Configure o Claude Code — adicione ao ~/.claude.json (já apontando para a API oficial; basta colar sua chave):

{
  "mcpServers": {
    "hane": {
      "command": "uvx",
      "args": ["hane-mcp-client"],
      "env": {
        "HANE_MODE": "rest",
        "HANE_API_URL": "https://haneia.com.br",
        "HANE_API_KEY": "COLE_SUA_API_KEY_AQUI"
      }
    }
  }
}

Reinicie o Claude Code e as ferramentas HANE ficam disponíveis no chat. Sem servidor para subir, sem modelo para baixar — a API oficial já está no ar.

Requer Python 3.10+. Este pacote é só o cliente (a ponte MCP, ~15 kB): o modelo e o pipeline rodam no servidor HANE, o que mantém o client leve (apenas fastmcp + pypdf) e o motor protegido.


Ferramentas disponíveis

Ferramenta O que faz
annotate_file_local Lê um arquivo do disco (.pdf, .docx, .txt, .prw, .py…) e retorna só as entidades comprimidas. O Claude nunca vê o conteúdo bruto.
extract_entities Extrai entidades de um texto colado no chat, por domínio.
compare_documents Diff semântico entre duas versões de um documento — o que mudou de fato, não diferença de texto cru.
estimate_tokens Estima a economia de tokens antes de processar (leve, sem GPU).
get_status Estado do servidor HANE e configuração de privacidade.

Domínios suportados em extract_entities

Domínio Ideal para
fiscal NF-e, SPED, DANFE, ICMS, CFOP, NCM
juridico contratos, cláusulas, partes, prazos, nº de processo
erp Protheus / TOTVS, módulos, parâmetros MV_
advpl código .prw/.tlpp, funções, tabelas SA/SB
financeiro CNAB, remessa, retorno, débitos
medico prontuários, CID, diagnósticos
code Python, JavaScript, SQL e outras linguagens
auto detecção automática de domínio

On-premise (sua infraestrutura, seus dados)

Para quem não pode enviar documentos para fora — órgãos públicos, jurídico, saúde, fiscal — o HANE roda on-premise, em container Docker na sua rede:

  • Documentos nunca saem da sua infraestrutura
  • Licença assinada (RSA-PSS), validação local
  • Mesmas ferramentas, apontando o client para o seu servidor (HANE_API_URL=http://seu-servidor:8000)

A contratação on-premise é feita sob demanda — Falar com a equipe → (resposta em até 24h). Ou por e-mail: contato@haneia.com.br.


Modos de operação e privacidade (LGPD)

Onde o seu texto trafega depende da combinação de modo e destino. Seja explícito sobre isso ao tratar dados pessoais:

Cenário Configuração Onde o texto vai Anonimização
On-premise rest + HANE_API_URL=http://seu-servidor Não sai da sua rede Desnecessária
SaaS oficial rest + HANE_API_URL=https://haneia.com.br Servidor HaneIA, tratado conforme a Política de Privacidade (LGPD) Não atua no client
MCP remoto mcp + HANE_ANONYMIZE=true Servidor MCP remoto Mascara CPF e e-mail pessoal antes do envio

Anonimização no client (HANE_ANONYMIZE)

Ativa somente com HANE_MODE=mcp — quando o texto trafega por um servidor MCP remoto que você não controla:

"env": { "HANE_MODE": "mcp", "HANE_ANONYMIZE": "true" }

O que é mascarado antes de o texto sair da sua máquina, em conformidade com a Lei 13.709/2018 (LGPD):

Dado Regra Vira
CPF \d{3}.\d{3}.\d{3}-\d{2} [CPF]
E-mail pessoal domínios gmail / hotmail / outlook / yahoo / icloud / live [EMAIL]
  • CNPJ e razão social NÃO são mascarados — identificam pessoa jurídica, que está fora do escopo da LGPD (Art. 5º, I). Os dados de empresa permanecem para a extração de entidades.
  • O resultado inclui um contador lgpd_anonimizacao: {cpf, email} com o número de substituições feitas — auditável.
  • get_status reporta anonimizacao_ativa e o escopo em vigor.

Em HANE_MODE=rest a anonimização não roda: ou o texto fica na sua infraestrutura (on-premise) ou vai para a API oficial sob a Política de Privacidade da HaneIA. Para mascaramento client-side antes do envio, use mcp + HANE_ANONYMIZE=true.

Variáveis de ambiente

Variável Padrão Descrição
HANE_MODE rest rest ou mcp
HANE_API_URL http://localhost:8000 URL base da REST API (oficial: https://haneia.com.br)
HANE_MCP_URL http://localhost:8081/mcp URL do servidor MCP remoto
HANE_API_KEY Chave da REST API
HANE_MCP_TOKEN Bearer token do MCP
HANE_ANONYMIZE false Anonimiza CPF/e-mail (só em HANE_MODE=mcp)

Sobre a HaneIA

HANE — Hierarchical Adaptive NER Encoder. Desenvolvido pela HANEIA TECNOLOGIA E INOVAÇÃO LTDA, focado em documentos brasileiros em português.

Falar com a equipe → · Site: haneia.com.br · E-mail: contato@haneia.com.br · Software registrado no INPI (BR 51 2026 002247-9)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

hane_mcp_client-1.2.4.tar.gz (12.7 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

hane_mcp_client-1.2.4-py3-none-any.whl (12.5 kB view details)

Uploaded Python 3

File details

Details for the file hane_mcp_client-1.2.4.tar.gz.

File metadata

  • Download URL: hane_mcp_client-1.2.4.tar.gz
  • Upload date:
  • Size: 12.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.13.3

File hashes

Hashes for hane_mcp_client-1.2.4.tar.gz
Algorithm Hash digest
SHA256 e91aa85192b74fce020b06ea65c14901dad5290d64c447450a23ea40b45971df
MD5 11b0f2f23f617d486f39657b886668e7
BLAKE2b-256 41ad7a398f64eee97d5b04f00a11d1f3ef2b47be8bda4d92b7ff3157e372ad15

See more details on using hashes here.

File details

Details for the file hane_mcp_client-1.2.4-py3-none-any.whl.

File metadata

File hashes

Hashes for hane_mcp_client-1.2.4-py3-none-any.whl
Algorithm Hash digest
SHA256 b6dfbdbbd824f7ea5595073fe9386f24a2546f451b8d0e0c26ca4c9e67207777
MD5 2c6373c7306977d91b2074370077197d
BLAKE2b-256 b21795b10fc813596c1880f23b324aaa5f5b0e454a9f135afce91cd3fc175408

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page