Skip to main content

LLM이 확률 추론으로 산수를 틀리는 구조적 한계를 차단하는 정밀 계산 MCP 서버. Decimal 전용 커널, 18개 계산 도메인 254개 기본 도구 + 10개 admin 정책 도구, 5종 전송(stdio/HTTP/SSE/WebSocket/Unix).

Project description

SooTool logo

SooTool

Precision Calc MCP for LLM tool use.

CI PyPI version Python 3.12+ License: MIT

LLM이 확률 추론으로 산수를 틀리는 구조적 한계를 차단하고, 그 틀리는 작업을 한 번에 500건까지 결정적 병렬로 돌려 실무에 투입할 수 있게 만드는 정밀 계산 MCP 서버. Python 3.12 · Decimal 전용 커널 · 18개 계산 도메인 254개 기본 도구 + 10개 admin 정책 도구 · core.batch 500 items 병렬 · core.pipeline DAG 체인 · 감사 트레이스 · 정책 YAML 외부화 · 5종 전송(stdio/HTTP/SSE/WebSocket/Unix).

왜 필요한가

LLM은 숫자를 토큰 시퀀스로 생성한다. 부가세 역산, 복리 이자, 누진세 구간, 양도소득세 장기보유특별공제, 이항분포 CDF 같은 실무 계산에서 반올림 방향·구간 경계·정책 해석이 미묘하게 어긋난다. 검증 없이 LLM 산출을 그대로 쓰면 세무 신고·재무 의사결정·의료 용량·공학 설계에서 치명적 오차가 누적된다.

문제의 층위는 두 겹이다. 첫째, 모델 자체가 산술을 수행하지 않는다. 확률 추론으로 그럴듯한 숫자를 내놓을 뿐이라 회계·세무·약제 용량 현장에서 잘못된 수치가 그대로 보고서·전표·처방에 남는다. 검증 여력이 빠듯한 전문직 실무에서는 오차 한 건이 신고 오류·환불·의료 사고로 직결된다.

둘째, 최신 대형 LLM은 내부에 계산기·Python 인터프리터를 내장하고 있지만 그 도구를 호출할지는 여전히 모델 재량이다. MCP 도구도 같은 제약을 공유한다. 구조적 한계가 단일 방어막 하나로는 닫히지 않는다는 뜻이다. SooTool은 모델 내장 도구와 독립된 두 번째 층의 MCP 서버로서 결정적 Decimal 경로, 외부화된 정책 데이터, 감사 가능한 트레이스를 제공해 방어 깊이를 늘린다. 호출 여부 자체는 AI 재량으로 남지만, 불리면 결과는 산술적으로 정확하다는 점이 보증된다.

셋째, 실무는 한 건씩 묻지 않는다. 직원 500명 월급·4대보험·소득세 일괄 정산, 대출 50종 NPV·IRR·듀레이션 비교, 거래명세서 수천 건 VAT 역산, 양도세 시나리오 수십 가지 교차 검증은 한 번의 LLM 대화로는 신뢰할 수 없다. SooTool은 core.batch로 N개 독립 연산을 ThreadPool 병렬 실행하고 입력 id 순으로 결정적 재정렬하며, core.pipeline으로 DAG 의존(연봉→세액→실수령액) 체인을 한 왕복에 끝낸다. LLM이 도구 호출 한 번 하면 실무 수백 행의 결정적 계산이 즉시 반환된다.

SooTool은 그 경로를 원천 차단한다.

  • Decimal 전용 커널. 입력 JSON은 parse_float=Decimal로 파싱되어 float이 도메인 내부로 유입되지 못한다.
  • 반올림 정책 6종(HALF_EVEN · HALF_UP · DOWN · UP · FLOOR · CEIL)을 enum으로 고정하고 도구 기본값을 금지한다. 호출자가 반드시 선택한다(ADR-002).
  • 세법·부동산 규제 데이터를 src/sootool/policies/{domain}/{key}_{year}.yaml로 외부화하고 SHA-256 무결성 검증 + lru_cache로 로드한다(ADR-009).
  • 모든 응답은 trace.{tool, formula, inputs, steps, output} 필드를 포함한다. 계산 근거를 사용자에게 직접 보여줄 수 있다(ADR-003).
  • 결정론. ThreadPool 결과는 입력 id 순으로 재정렬하고, 비결정 허용 시 non_deterministic:true 플래그를 강제한다(ADR-011).

감사 트레이스 실물 샘플

"이 숫자는 어떻게 나왔는가"에 즉답하기 위해 모든 도구는 trace 필드를 반환한다. 아래는 finance.npv(rate=0.08, cashflows=[-1000, 300, 400, 500, 200], rounding=HALF_EVEN, decimals=2) 실제 응답이다. 공식·입력·중간 단계·출력이 원자적으로 기록된다.

{
  "npv": "164.64",
  "trace": {
    "tool": "finance.npv",
    "formula": "NPV = sum(CF_t / (1+r)^t, t=0..n)",
    "inputs": {
      "rate": "0.08",
      "cashflows": ["-1000", "300", "400", "500", "200"],
      "rounding": "HALF_EVEN",
      "decimals": 2
    },
    "steps": [
      {
        "label": "npv_raw",
        "value": "164.63539696786661172171511042618089308126395968697"
      }
    ],
    "output": "164.64"
  },
  "_meta": {
    "hints": [],
    "session_stats": {"tool_calls": 1, "unique_tools": 1}
  }
}

중간 단계의 npv_raw는 반올림 이전 완전 정밀 Decimal 값으로, 반올림 정책(HALF_EVEN)이 소수점 2자리(decimals=2)에 적용된 결과가 outputnpv 필드에 일치하게 노출된다. 감사 추적은 trace 필드만 보면 충분하며, _meta는 미들웨어 주입 영역(ADR-014)으로 결과 신뢰에 영향을 주지 않는다(ADR-011).

벤치마크 결과 (2026-04-24)

20 케이스(한국 소득세 8 · 부가세 3 · 복리 2 · 확률통계 3 · 공학 2 · 양도세 2) × 대형 LLM 실측. exact 문자열 일치, approx 상대오차 ≤ 0.01%, wrong 그 외.

표준 모델

Provider Model Exact Approx Wrong 정확율
SooTool Decimal 커널 20 0 0 100%
Google gemini-2.5-pro 13 3 4 65%
Anthropic claude-sonnet-4-5 3 3 13 15%
OpenAI gpt-4o 2 4 14 10%

현존 최고 모델 (SOTA)

Provider Model Exact Approx Wrong 정확율
SooTool Decimal 커널 20 0 0 100%
Google gemini-3-pro-preview 12 4 4 60%
Anthropic claude-opus-4-7 9 3 8 45%
OpenAI gpt-5.4 5 3 12 25%

모델을 최신 SOTA로 올려도 어느 LLM도 20/20에 도달하지 못한다. Claude 3→9 (3배 개선), OpenAI 2→5 (2.5배), Gemini는 보합. 공통 실패 지점은 누진세 구간 경계, 양도소득세 장기보유특별공제(실세액 8% 이상 오차), 부가세 HALF_EVEN 반올림, AC 임피던스 정밀도다. 모델 발전만으로 닫히지 않는 구조적 한계를 SooTool이 Decimal + 정책 YAML + 명시적 rounding enum 세 층위로 메운다. 상세: bench/results/2026-04-24-final.md (표준), bench/results/2026-04-24-sota.md (SOTA).

설치

cd SooTool
uv sync

실행

기본(stdio, MCP 클라이언트 연동):

uv run python -m sootool

전송별 단일 기동:

uv run python -m sootool --transport http      --port 10535
uv run python -m sootool --transport sse-legacy --port 10536
uv run python -m sootool --transport websocket --port 10537
uv run python -m sootool --transport unix      --socket /tmp/sootool.sock

다중 전송 동시 기동:

uv run python -m sootool --transports stdio,http,websocket

기본 바인딩은 127.0.0.1. 외부 노출은 --host 0.0.0.0 + Bearer 토큰이 의무다(ADR-014).

Claude Code 연동

user-scope로 글로벌 등록 (권장, 어느 디렉토리에서든 호출 가능):

claude mcp add --scope user sootool -- uv run --directory /path/to/SooTool python -m sootool

또는 프로젝트 스코프로 SooTool 저장소 내에서만:

cd SooTool
claude mcp add sootool -- uv run python -m sootool

도구 카탈로그 (254개 기본 + 10개 admin, 18 계산 도메인 + sootool 운영 도구)

Namespace Count 대표 도구
core 8 add, sub, mul, div, calc, batch, pipeline, pipeline_resume
accounting 11 vat_extract, vat_add, balance, depreciation 3종, interest_compound 외
finance 15 pv, fv, npv, irr, loan_schedule, bond_ytm, bond_duration, black_scholes, var_parametric, sharpe 외
tax 10 progressive, kr_income, kr_withholding_simple, capital_gains_kr, kr_local_income_tax, kr_education_tax_add, kr_rural_special_tax 외
realestate 8 kr_ltv, kr_dti, kr_dsr, kr_acquisition_tax, kr_transfer_tax, rental_yield 외
stats 14 descriptive, ttest 3종, chi_square_independence, ci_mean, regression_linear, anova, correlation 외
probability 30 normal/binomial/poisson, gamma, beta, exponential, lognormal, chi_square, F, bayes, factorial, nCr, nPr, expected_value
datetime 14 add/count_business_days, day_count, age, diff, tz_convert, solar↔lunar, solar_terms, lunar_holiday, fiscal_year, fiscal_quarter, tax_period_kr, payroll_period
math 10 integrate_simpson, integrate_gauss_legendre, diff_central, diff_five_point, interpolate_linear, interpolate_cubic_spline, polynomial_roots, polynomial_horner, fft, ifft
geometry 15 area·volume 7종, vector dot/cross/norm, matrix 4종, haversine
engineering 56 electrical_*, electrical_ac 11종, fluid, thermal, mechanical, structural, control 5종, si_prefix_convert
units 8 convert (pint), fx_convert, fx_triangulate, temperature, energy_convert, pressure_convert, data_size_convert, time_small_convert
medical 12 bmi, bsa, dose_weight_based, egfr, pregnancy_weeks, cha2ds2_vasc, has_bled, framingham_cvd_10y, qtc_bazett/fridericia/framingham/hodges
science 11 half_life, ideal_gas, molar_mass, stoichiometry, nernst, faraday_electrolysis, battery_capacity, snell_law, thin_lens, bragg, intensity
crypto 10 gcd, lcm, hash, is_prime, modinv, modpow, egcd, crt, euler_totient, carmichael_lambda
pm 5 critical_path (CPM), evm, pert, earned_schedule, monte_carlo_schedule
payroll 5 kr_net_monthly, kr_severance_pay, kr_year_end_tax_settlement, kr_bonus_tax, hourly_to_monthly_net
sootool 1+10 skill_guide (항시) + policy_mgmt 10종 (admin 모드)

전체 도구 사양은 docs/user_guide.mdsootool.skill_guide MCP 호출로 조회한다.

실전 예시

세무 체인 파이프라인. 월급 3,000,000원을 연소득으로 환산한 뒤 2026년 한국 소득세를 계산한다.

{
  "name": "core.pipeline",
  "arguments": {
    "steps": [
      {"id": "annual", "tool": "core.mul",       "args": {"operands": ["3000000", "12"]}},
      {"id": "tax",    "tool": "tax.kr_income",  "args": {"taxable_income": "${annual.result.result}", "year": 2026}}
    ]
  }
}

재무 시나리오 비교 배치. 동일 현금흐름에 대해 할인율 3종 NPV를 동시 산출한다.

{
  "name": "core.batch",
  "arguments": {
    "items": [
      {"id": "s1", "tool": "finance.npv", "args": {"rate": "0.05", "cashflows": ["-100","30","40","50"], "rounding": "HALF_EVEN", "decimals": 2}},
      {"id": "s2", "tool": "finance.npv", "args": {"rate": "0.08", "cashflows": ["-100","30","40","50"], "rounding": "HALF_EVEN", "decimals": 2}},
      {"id": "s3", "tool": "finance.npv", "args": {"rate": "0.10", "cashflows": ["-100","30","40","50"], "rounding": "HALF_EVEN", "decimals": 2}}
    ]
  }
}

공학 레이놀즈 수. 밀도·속도·특성길이·점성으로 층류/전이/난류 영역을 판정하고 trace에 공식을 남긴다.

{
  "name": "engineering.fluid_reynolds",
  "arguments": {"density": "1000", "velocity": "2", "length": "0.05", "viscosity": "0.001"}
}

통계 회귀 + 신뢰구간 배치. 단일 왕복으로 선형회귀 계수·p-value와 평균 95% 신뢰구간을 동시 반환한다.

{
  "name": "core.batch",
  "arguments": {
    "items": [
      {"id": "reg", "tool": "stats.regression_linear", "args": {"X": [[1],[2],[3],[4]], "y": [2.1, 4.0, 6.2, 8.1]}},
      {"id": "ci",  "tool": "stats.ci_mean",           "args": {"data": [2.1, 4.0, 6.2, 8.1], "confidence": 0.95}}
    ]
  }
}

실무 대량 처리

LLM이 한 건씩 산출하면 재현성·신뢰성이 흔들린다. SooTool은 한 호출로 수백 행의 결정적 계산을 즉시 반환한다.

시나리오 규모 도구 조합 반환
급여 마감 직원 500명 core.batch + payroll.kr_salary 행별 net·4대보험·소득세·trace
투자 민감도 할인율 9 × 현금흐름 5 = 45 지점 core.batch + finance.npv·finance.irr 시나리오별 NPV/IRR 표
거래명세서 VAT 분리 수백~수천 건 core.batch + accounting.vat_extract 공급가 합계·VAT 합계
채권 포트폴리오 종목 수십 core.batch + finance.bond_ytm·bond_duration 종목별 수익률·듀레이션
양도세 교차 검증 보유기간 10종 × 취득·양도가 세트 core.batch + tax.capital_gains_kr 시나리오별 실세액
세무 체인 월급→연봉→소득세→실수령액 4 단계 core.pipeline 단일 왕복

구현 세부:

  • core.batch — N개 독립 연산을 ThreadPoolExecutor로 병렬 실행. id 중복 거부, per-item 격리(ok|error|timeout|skipped), 최대 500 items, per-item 10s, batch 60s 제한. 결과는 입력 id 순으로 결정적 재정렬된다(ADR-011).
  • core.pipelinegraphlib.TopologicalSorter 기반 DAG 실행기. ${step_id.result.field} 참조 문법으로 단계 간 데이터 전달. max_steps=50, max_depth=10, step_timeout_s=2.0, pipeline_timeout_s=30.0(ADR-006).
  • core.pipeline_resume — 실패한 스텝을 TTL 10분 in-memory 캐시로부터 부분 재실행.

전송 지원

Transport 용도 Flag
stdio Claude Code·Desktop 기본 --transport stdio
http Streamable HTTP, 권장 원격 --transport http
sse-legacy 2024-11 프로토콜 호환 --transport sse-legacy
websocket 저지연 양방향 --transport websocket
unix 로컬 고처리 --transport unix --socket PATH
multi 동시 기동 --transports stdio,http,...

모든 HTTP 계열 전송은 Bearer 인증, Accept-Language 기반 로케일 감지(ko 기본), 전 도구 _meta.hints 자동 주입, CORS 화이트리스트를 공통 미들웨어로 적용한다(ADR-014).

개발

  • 테스트: make test (pytest 1097건, 97% 커버리지)
  • 린트: make lint (ruff)
  • 타입체크: make typecheck (mypy)
  • 포맷: make format
  • 전송 스모크: uv run python scripts/mcp_smoke_{stdio,http,sse,ws,unix}.py

새 도메인 도구 추가는 src/sootool/modules/<domain>/<tool>.py@REGISTRY.tool(namespace, name, description, version) 데코레이터로 구현하고 도메인 __init__.py에서 import하면 런타임 자동 등록된다(ADR-004).

아키텍처

설계 결정과 근거는 docs/architecture.md ADR-001~017에 기록되어 있다. 핵심 invariant:

  • Decimal-only 경계 · 명시적 rounding · 감사 트레이스 · 모듈 stateless / batch-safe
  • 자료형 이원화: 회계·세무·금융은 전 구간 Decimal, 통계·기하·확률은 내부 float64 + 경계 Decimal 직렬화(ADR-008)
  • 정책 YAML 외부화 + SHA-256 무결성(ADR-009)
  • trace_level none·summary·full + SOOTOOL_MAX_PAYLOAD_KB(기본 512KB) 초과 시 trace.steps tail 절단(ADR-010)
  • KRWMoney는 Decimal 상속 대신 합성(ADR-013)
  • 도메인별 *_bulk 도구 금지, core.batch 일반해로 통일(ADR-006)

스킬 가이드

에이전트가 언제 어떤 도구를 호출해야 하는지 기술한 트리거 테이블·예시·플레이북은 sootool.skill_guide MCP 도구를 호출하여 조회한다. 섹션은 triggers | examples | anti_patterns | playbooks | all, 언어는 ko | en.

라이선스

LICENSE 파일 참조.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

sootool-0.1.4.tar.gz (254.8 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

sootool-0.1.4-py3-none-any.whl (386.9 kB view details)

Uploaded Python 3

File details

Details for the file sootool-0.1.4.tar.gz.

File metadata

  • Download URL: sootool-0.1.4.tar.gz
  • Upload date:
  • Size: 254.8 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for sootool-0.1.4.tar.gz
Algorithm Hash digest
SHA256 70e3eadf09851295ef6d2e6208af1785116c0231ead019fd1ce811aaf87db986
MD5 cf441d6217c5143b1026edc7077571eb
BLAKE2b-256 ae8f21d8e2c41b4d19baac9f778121ffa67fadf47efb6bb8c2a9a0f8525ffb47

See more details on using hashes here.

Provenance

The following attestation bundles were made for sootool-0.1.4.tar.gz:

Publisher: publish-pypi.yml on JinHo-von-Choi/SooTool

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file sootool-0.1.4-py3-none-any.whl.

File metadata

  • Download URL: sootool-0.1.4-py3-none-any.whl
  • Upload date:
  • Size: 386.9 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.12

File hashes

Hashes for sootool-0.1.4-py3-none-any.whl
Algorithm Hash digest
SHA256 142f2c785b86dd59e1f71dfa1d1a9aefb174f39decfc25df6f56892803f40af8
MD5 5db01d6b7a519b938e1e08ab45c67205
BLAKE2b-256 cbe1cf9287b619ea21ce1ca46c299cba519a1275babe305cd4f066536d14bc96

See more details on using hashes here.

Provenance

The following attestation bundles were made for sootool-0.1.4-py3-none-any.whl:

Publisher: publish-pypi.yml on JinHo-von-Choi/SooTool

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page