Juiz Computacional para LLMs - MCP Server
Project description
mcp_judge
Índice
- Introdução
- Estrutura do projeto
- Tecnologias utilizadas
- Requisitos
- Como instalar no Claude Desktop
- Links úteis
- Contribuições
- Licença
- Contato
Introdução
O mcp-judge é um servidor que implementa o Model Context Protocol (MCP) para atuar como um juiz imparcial e rigoroso de saídas de LLMs. Diferente de uma avaliação puramente subjetiva, este projeto utiliza uma ferramenta computacional para aplicar pesos exatos e penalidades lógicas baseadas em critérios como alucinação e precisão. O objetivo é fornecer um veredito matemático ("Aprovado", "Requer Revisão" ou "Reprovado"), punindo erros graves independentemente da qualidade da escrita.
Estrutura do projeto
É um MCP-Server simples que utiliza somente o pacote FastMCP, seguindo também as orientações do repositório oficial do Model Context Protol, da Anthropic.
Este MCP-Server tem as seguintes classes:
calcular_veredito (Tool)
Realiza o cálculo da nota final aplicando pesos e penalidades:
- Pesos: Alucinação (40%), Precisão (30%), Completude (15%), Clareza (15%).
- Penalidades: Notas baixas em Alucinação ou Precisão travam o score final em "Reprovado".
prompt_juiz (Prompt)
Define a persona de um "Juiz Crítico" para o Claude. Instrui o modelo a analisar o input/output, atribuir notas mentais e obrigatoriamente invocar a tool calcular_veredito para o resultado oficial.
[!IMPORTANT] Se quiser conversar sobre esse projeto, basta acessar a versão
TalkToGitHub
Want to better understand this repository, but you don't speak Portuguese? Check out this complete tutorial:Codebase - mcp_judge
Tecnologias utilizadas
- MCP (Model Context Protocol);
- Python;
- Claude Desktop;
- Antigravity.
Requisitos
Antes de começar, certifique-se de ter instalado:
- Python 3.10 ou superior.
- UV (Recomendado) ou PIP.
- Claude Desktop.
Como instalar no Claude Desktop
1. Baixar o projeto
Se você não sabe usar o Git, pode simplesmente baixar o projeto clicando no botão verde Code no topo da página do GitHub e selecionando Download ZIP. Extraia a pasta em um local de sua preferência (Ex: Área de Trabalho).
2. Configurar o Claude Desktop
Abra o arquivo de configuração do Claude Desktop (claude_desktop_config.json). Na docuemntação oficial do MCP a orientação do caminho para o arquivo .json é esta:
- Windows:
%APPDATA%\Claude\claude_desktop_config.json - macOS:
~/Library/Application Support/Claude/claude_desktop_config.json
[!IMPORTANT] Depois de instalar o Claude Desktop, verifique se o caminho para o json é este mesmo da documentação. Por via das dúvidas, você pode acessar o arquivo via Claude Deskktop: Menu da barra lateral > Desenvolvedor > Abrir Arquivo de Configuração de Aplicativo
Adicione a configuração abaixo. Importante: Substitua o caminho em args e --directory pelo local onde você salvou a pasta extraída (mcp_judge).
"mcp-judge": {
"command": "uv",
"args": [
"--directory",
"C://Users//meu_usuario//OneDrive//area_de_trabalho//MCPs//mcp_judge",
"run",
"server.py"
]
}
O comando acima usa o uv para criar ambiente e instalar dependências automaticamente antes de rodar.
Links úteis
- Documentação oficial do Model Context Protocol - Você saberá todos os detalhes dessa inovação da Anthropic
- Site oficial da Anthropic - Para ficar por dentro das novidaddes e estudos dos modelos Claude
- Como baixar o Claude Desktop - Link direto para download
- Como instalar o VSCode- Link direto para download
- Documentação oficial do pacote uv - Você saberá todos os detalhes sobre o
uve como ele é importante no python - venv — Criação de ambientes virtuais - Explicação completa de como funcionam os venvs
- Conjunto de ícones de modelos de IA/LLM - site muito bom para conseguir ícones do ecossistema de IA
- Devicon - site bem completo também com ícones gerais sobre tecnologia
- Smolagents - documenttação oficial da biblioteca smolagents
- Como baixar o Antigravity - Página oficial de download da IDE do Google DeepMind
- LLM as a Judge (Paper) - Explicação técnica sobre o conceito de usar LLMs para avaliar outros modelos ("Judging LLM-as-a-Judge")
Contribuições
Contribuições são bem-vindas! Se você tem ideias para melhorar este projeto, sinta-se à vontade para fazer um fork do repositório.
Licença
Este projeto está licenciado sob a licença MIT - veja o arquivo LICENSE para detalhes.
Contato
Mário Lúcio - Prazo Certo®
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file mcpserver_judge-0.1.0.tar.gz.
File metadata
- Download URL: mcpserver_judge-0.1.0.tar.gz
- Upload date:
- Size: 6.7 kB
- Tags: Source
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/6.1.0 CPython/3.13.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
128c533cc8d8d5e5a2bfc22a6bf869d00116050b37c8e18d0c0396f27689eb3e
|
|
| MD5 |
2f157c04272643725a2109222c1eab8b
|
|
| BLAKE2b-256 |
d562041ae121a360f4fb24981fe9e93b7e4ace68953c3c30c6576dd4b5f579f9
|
Provenance
The following attestation bundles were made for mcpserver_judge-0.1.0.tar.gz:
Publisher:
python-publish.yml on marioluciofjr/mcp_judge
-
Statement:
-
Statement type:
https://in-toto.io/Statement/v1 -
Predicate type:
https://docs.pypi.org/attestations/publish/v1 -
Subject name:
mcpserver_judge-0.1.0.tar.gz -
Subject digest:
128c533cc8d8d5e5a2bfc22a6bf869d00116050b37c8e18d0c0396f27689eb3e - Sigstore transparency entry: 789765242
- Sigstore integration time:
-
Permalink:
marioluciofjr/mcp_judge@7a48c64bd4eab6eea117c32aaa7d12ef13961700 -
Branch / Tag:
refs/tags/v0.1.1 - Owner: https://github.com/marioluciofjr
-
Access:
public
-
Token Issuer:
https://token.actions.githubusercontent.com -
Runner Environment:
github-hosted -
Publication workflow:
python-publish.yml@7a48c64bd4eab6eea117c32aaa7d12ef13961700 -
Trigger Event:
release
-
Statement type:
File details
Details for the file mcpserver_judge-0.1.0-py3-none-any.whl.
File metadata
- Download URL: mcpserver_judge-0.1.0-py3-none-any.whl
- Upload date:
- Size: 7.0 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/6.1.0 CPython/3.13.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
ba291f5527d2edb59039f9823232b25a60f867ee3805517c727eae5a9adf9716
|
|
| MD5 |
dd57172ee853ef2a79cee924f600dd64
|
|
| BLAKE2b-256 |
dd7a8fecfbe5dd0e0b65a890f6dc9db52adf1ba0b8f3518b41e70dbda0649eb7
|
Provenance
The following attestation bundles were made for mcpserver_judge-0.1.0-py3-none-any.whl:
Publisher:
python-publish.yml on marioluciofjr/mcp_judge
-
Statement:
-
Statement type:
https://in-toto.io/Statement/v1 -
Predicate type:
https://docs.pypi.org/attestations/publish/v1 -
Subject name:
mcpserver_judge-0.1.0-py3-none-any.whl -
Subject digest:
ba291f5527d2edb59039f9823232b25a60f867ee3805517c727eae5a9adf9716 - Sigstore transparency entry: 789765247
- Sigstore integration time:
-
Permalink:
marioluciofjr/mcp_judge@7a48c64bd4eab6eea117c32aaa7d12ef13961700 -
Branch / Tag:
refs/tags/v0.1.1 - Owner: https://github.com/marioluciofjr
-
Access:
public
-
Token Issuer:
https://token.actions.githubusercontent.com -
Runner Environment:
github-hosted -
Publication workflow:
python-publish.yml@7a48c64bd4eab6eea117c32aaa7d12ef13961700 -
Trigger Event:
release
-
Statement type: