Skip to main content

A small Codex-planned, Cursor-implemented TDD loop with Codex hook guards.

Project description

AiTdd

Codex が計画とレビューを担当し、Cursor が RED / GREEN / REFACTOR の実装を担当する、 小さな TDD オーケストレータです。Hook の入出力と policy は codex-hookkit を使います。 Codex は Python から公式 @openai/codex-sdk を呼びます。 Cursor は既定で Python から公式 @cursor/sdk の Composer を使い、 必要なら cursor-agent CLI に切り替えられます。

役割

  • Codex: 次に書くべき最小テストの計画、GREEN 後と REFACTOR 後のレビュー、完了判定
  • Cursor: テスト追加、最小実装、リファクタリング
  • Hook: RED ではテスト失敗を要求し、GREEN / REFACTOR ではテスト成功を要求する

使い方

uv sync --dev
npm install
uv run aitdd run "FizzBuzz を t-wada 流 TDD で作る" --test-command "pytest" --max-cycles 5

PyPI から使う場合も、公式 Node SDK は作業ディレクトリに入れてください。

pip install aitdd
npm install @openai/codex-sdk @cursor/sdk
aitdd run "FizzBuzz を t-wada 流 TDD で作る" --test-command "pytest"

Cursor 実装担当は既定で SDK + Composer alias を使います。

uv run aitdd run "..." --cursor-backend sdk --cursor-model composer-latest

CLI fallback を使いたい場合:

uv run aitdd run "..." --cursor-backend cli --cursor-model composer-latest

SDK は CURSOR_API_KEY があればそれを使い、無い場合は SDK 側の認証解決に任せます。

実行内容だけ確認する場合:

uv run aitdd run "TODO アプリの最小モデルを作る" --dry-run

複雑なクラスや業務要件では aitdd.yaml を使って、反復する TDD サイクルを固定できます。

uv run aitdd run "ignored when spec exists" \
  --spec examples/aitdd.yaml \
  --test-command "pytest" \
  --max-cycles 5

aitdd.yaml では次を指定できます。

  • goal: 全体ゴール
  • public_api: 育てる public API
  • constraints: 設計・進め方の制約
  • forbidden: 先回り実装や禁止事項
  • acceptance_tests: 外側の受け入れテスト
  • unit_tests: 内側のユニットテスト
  • cycles: 1 サイクル 1 public behavior の反復リスト

各 cycle には expected_red を置けます。RED では「テストが失敗したか」だけでなく、 期待した理由で失敗したか、禁止した壊れ方をしていないかも検証します。 REFACTOR フェーズではテストファイル変更を拒否します。

Codex レビューは JSON schema で機械判定します。各サイクルで次の gate がすべて true の場合だけ 次に進みます。

  • one_behavior_only
  • minimal_green
  • tests_unchanged_in_refactor
  • acceptance_unit_boundary_ok
  • forbidden_respected

CLI には cycle ごとの進捗として red / green / refactor / complete / one_behavior_only / minimal_green / boundary_ok が表示されます。

実行中の状態は最小構成で次に保存されます。

  • .aitdd/progress.json: cycle ごとの behavior, red, green, refactor, review_gate, issues, started_at, finished_at
  • .aitdd/cycles/001-red.diff: phase ごとの git diff snapshot
  • .aitdd/report.md: TDD の進行ログ

途中から再開する場合:

aitdd resume --spec aitdd.yaml --max-cycles 5

Codex hook として使う場合は .codex/hooks.json などに次を登録します。

{
  "hooks": {
    "PostToolUse": [
      {
        "matcher": "*",
        "hooks": [
          {
            "type": "command",
            "command": "uv run python hooks/aitdd_guard.py",
            "timeout": 30
          }
        ]
      }
    ]
  }
}

AITDD_PHASE=red|green|refactorAITDD_TEST_COMMAND を渡すと、そのフェーズの 期待に合わない状態を block します。

ループ

  1. Codex が次の最小ステップを計画する
  2. Cursor が RED として、失敗するテストだけを書く
  3. テストが失敗しなければ RED をやり直す
  4. Cursor が GREEN として、通すための最小実装を書く
  5. テストが通らなければ GREEN をやり直す
  6. Codex がレビューし、Cursor が必要なら REFACTOR する
  7. テストが通ることを確認し、Codex が完了判定する

--max-cycles は安全弁です。完璧を目指しつつ、暴走しないように上限を持たせています。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

aitdd-0.1.1.tar.gz (31.7 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

aitdd-0.1.1-py3-none-any.whl (16.1 kB view details)

Uploaded Python 3

File details

Details for the file aitdd-0.1.1.tar.gz.

File metadata

  • Download URL: aitdd-0.1.1.tar.gz
  • Upload date:
  • Size: 31.7 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.14.2

File hashes

Hashes for aitdd-0.1.1.tar.gz
Algorithm Hash digest
SHA256 80fd6978aaf164c4826e740b626d6edfaa36b86de086642941bd0e2c55a6a91b
MD5 81ec9a3e38271de953cd083d7d8766ef
BLAKE2b-256 04406a7461c89880c855dc81c7f68495efda5ea37cec25aa3628bbf18ff9b5d4

See more details on using hashes here.

File details

Details for the file aitdd-0.1.1-py3-none-any.whl.

File metadata

  • Download URL: aitdd-0.1.1-py3-none-any.whl
  • Upload date:
  • Size: 16.1 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.14.2

File hashes

Hashes for aitdd-0.1.1-py3-none-any.whl
Algorithm Hash digest
SHA256 fe24991b767aff2513c837f304c43041e912cca94f67dbbfffc11ba1f10c71e6
MD5 7c7e7084587448e443f45389c15592c0
BLAKE2b-256 b00490f530653832947fe12fa5443379639b6b93dda819c200ac678f53cdfd32

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page