Skip to main content

Local Windows desktop control for AI agents — Python library and CLI.

Project description

agent-aid

Yerel Windows masaüstünü AI ajanlardan kontrol etmek için küçük bir Python kütüphanesi ve CLI. Open Interpreter, GPT, Claude veya kendi yazdığın bir agent — agent-aid komutuyla ekran okuma, fare/klavye kontrolü, pencere yönetimi yapar. Tek bağımlılık: mss.

pip install agent-aid

uv ile (önerilen — Python yoksa otomatik indirir):

uv tool install agent-aid --python 3.11

Hızlı bakış

agent-aid health
agent-aid state
agent-aid screenshot active_window=true save_path=captures/active.png include_base64=false
agent-aid click x=500 y=300
agent-aid type text="merhaba"
agent-aid press keys=ctrl+s
agent-aid focus_window title_fragment=Chrome
agent-aid open target=https://example.com

Tüm route'lar:

agent-aid --list

AI ajanlar için tam komut referansı (stdout'a markdown):

agent-aid --readme

Yetenekler

  • Ekran görüntüsü: tam masaüstü, tek monitör, aktif pencere, belirli hwnd, dikdörtgen bölge
  • Karşılaştırma için PNG sha256 hash'i (wait_screen_change ile birlikte kullanılır)
  • Fare: tıkla, çift tıkla, sağ tık, sürükle, hareket ettir, kaydır (dikey/yatay), basılı tut
  • Klavye: kısa metin, hotkey (ctrl+shift+a), modifier'ları el ile aç/kapa
  • Pano: clipboard text=... + press keys=ctrl+v ile uzun metin yapıştırma
  • Pencere: bul, odakla, küçült/büyüt/restore/kapat, taşı/yeniden boyutlandır, gizle/göster
  • Sistem: süreç listesi, dosya/URL/shell aç, pixel oku, durum sorgula
  • Verify: wait_screen_change, wait_pixel, wait_window
  • batch ile birden fazla aksiyonu tek çağrıda atomik çalıştırma

Pencere/koordinat hedefleme

Tüm koordinatlar fiziksel ekran pikselidir. Belirli pencerenin içine göre çalışmak için:

agent-aid click x=120 y=80 relative_to=active_window
agent-aid click x=120 y=80 hwnd=123456

Python kütüphanesi olarak kullanım

from agent_aid import core

core.set_dpi_aware()
print(core.active_window())
core.click(800, 500)
core.type_text("merhaba")

CLI ile aynı yetenekler — Python kodunda doğrudan core modülünü çağırırsın.

Komut formatları

# key=value (en kısa)
agent-aid click x=500 y=300 button=left

# JSON (iç içe alanlar için)
agent-aid screenshot '{"region":{"left":0,"top":0,"width":800,"height":600},"save_path":"r.png"}'

# Çıktıyı pretty-print
agent-aid --pretty state

AI agent için pratik akış

  1. agent-aid state — neye baktığını gör
  2. agent-aid screenshot active_window=true save_path=captures/now.png include_base64=false
  3. Görüntüye bak, hedef koordinatı seç
  4. Aksiyon: click / type / press / clipboard
  5. Doğrula: yeni screenshot veya wait_screen_change

Güvenlik notları

  • Gerçek fare ve klavye girdisi gönderir — etkin pencereye yazar.
  • clipboard panoyu üzerine yazar.
  • open Windows hedefini başlatır (kullanıcı çift tıklamış gibi).
  • window/manage close WM_CLOSE postalar — kaydedilmemiş veri varsa uygulama sorabilir.
  • Aksiyon sonrası wait_* veya yeni screenshot ile doğrulama yapmak önerilir.

Lisans

MIT.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

agent_aid-1.3.0.tar.gz (22.6 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

agent_aid-1.3.0-py3-none-any.whl (23.0 kB view details)

Uploaded Python 3

File details

Details for the file agent_aid-1.3.0.tar.gz.

File metadata

  • Download URL: agent_aid-1.3.0.tar.gz
  • Upload date:
  • Size: 22.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.11.8 {"installer":{"name":"uv","version":"0.11.8","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":null,"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}

File hashes

Hashes for agent_aid-1.3.0.tar.gz
Algorithm Hash digest
SHA256 d6eff0fc6f8ba551115a5f211bde9ad8acd0225fa42ed78884bf4fc0207156dc
MD5 36b3ad8c97f574c5de20f003f2b4b97b
BLAKE2b-256 d05aa88e308a647a02871369419a4d5ef77e20959552934a2efbc42a66ecd866

See more details on using hashes here.

File details

Details for the file agent_aid-1.3.0-py3-none-any.whl.

File metadata

  • Download URL: agent_aid-1.3.0-py3-none-any.whl
  • Upload date:
  • Size: 23.0 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.11.8 {"installer":{"name":"uv","version":"0.11.8","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":null,"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}

File hashes

Hashes for agent_aid-1.3.0-py3-none-any.whl
Algorithm Hash digest
SHA256 4d41221c5e762f3511e40a7f24c26b40da4e6f342273139f47077f8f72cc1aa1
MD5 373894d86013796d934ae7003e4d7897
BLAKE2b-256 b5831c6dbab9950892cae489f2e5c1944249c76c9f1132ac8b8d1b046ca293f6

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page