Skip to main content

Local Windows desktop control for AI agents — Python library and CLI.

Project description

agent-aid

Yerel Windows masaüstünü AI ajanlardan kontrol etmek için küçük bir Python kütüphanesi ve CLI. Open Interpreter, GPT, Claude veya kendi yazdığın bir agent — agent-aid komutuyla ekran okuma, fare/klavye kontrolü, pencere yönetimi yapar. Tek bağımlılık: mss.

pip install agent-aid

uv ile (önerilen — Python yoksa otomatik indirir):

uv tool install agent-aid --python 3.11

Hızlı bakış

agent-aid health
agent-aid state
agent-aid screenshot active_window=true save_path=captures/active.png include_base64=false
agent-aid click x=500 y=300
agent-aid type text="merhaba"
agent-aid press keys=ctrl+s
agent-aid focus_window title_fragment=Chrome
agent-aid open target=https://example.com

Tüm route'lar:

agent-aid --list

AI ajanlar için tam komut referansı (stdout'a markdown):

agent-aid --readme

Yetenekler

  • Ekran görüntüsü: tam masaüstü, tek monitör, aktif pencere, belirli hwnd, dikdörtgen bölge
  • Karşılaştırma için PNG sha256 hash'i (wait_screen_change ile birlikte kullanılır)
  • Fare: tıkla, çift tıkla, sağ tık, sürükle, hareket ettir, kaydır (dikey/yatay), basılı tut
  • Klavye: kısa metin, hotkey (ctrl+shift+a), modifier'ları el ile aç/kapa
  • Pano: clipboard text=... + press keys=ctrl+v ile uzun metin yapıştırma
  • Pencere: bul, odakla, küçült/büyüt/restore/kapat, taşı/yeniden boyutlandır, gizle/göster
  • Sistem: süreç listesi, dosya/URL/shell aç, pixel oku, durum sorgula
  • Verify: wait_screen_change, wait_pixel, wait_window
  • batch ile birden fazla aksiyonu tek çağrıda atomik çalıştırma

Pencere/koordinat hedefleme

Tüm koordinatlar fiziksel ekran pikselidir. Belirli pencerenin içine göre çalışmak için:

agent-aid click x=120 y=80 relative_to=active_window
agent-aid click x=120 y=80 hwnd=123456

Python kütüphanesi olarak kullanım

from agent_aid import core

core.set_dpi_aware()
print(core.active_window())
core.click(800, 500)
core.type_text("merhaba")

CLI ile aynı yetenekler — Python kodunda doğrudan core modülünü çağırırsın.

Komut formatları

# key=value (en kısa)
agent-aid click x=500 y=300 button=left

# JSON (iç içe alanlar için)
agent-aid screenshot '{"region":{"left":0,"top":0,"width":800,"height":600},"save_path":"r.png"}'

# Çıktıyı pretty-print
agent-aid --pretty state

AI agent için pratik akış

  1. agent-aid state — neye baktığını gör
  2. agent-aid screenshot active_window=true save_path=captures/now.png include_base64=false
  3. Görüntüye bak, hedef koordinatı seç
  4. Aksiyon: click / type / press / clipboard
  5. Doğrula: yeni screenshot veya wait_screen_change

Güvenlik notları

  • Gerçek fare ve klavye girdisi gönderir — etkin pencereye yazar.
  • clipboard panoyu üzerine yazar.
  • open Windows hedefini başlatır (kullanıcı çift tıklamış gibi).
  • window/manage close WM_CLOSE postalar — kaydedilmemiş veri varsa uygulama sorabilir.
  • Aksiyon sonrası wait_* veya yeni screenshot ile doğrulama yapmak önerilir.

Lisans

MIT.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

agent_aid-1.4.0.tar.gz (22.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

agent_aid-1.4.0-py3-none-any.whl (22.8 kB view details)

Uploaded Python 3

File details

Details for the file agent_aid-1.4.0.tar.gz.

File metadata

  • Download URL: agent_aid-1.4.0.tar.gz
  • Upload date:
  • Size: 22.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.11.8 {"installer":{"name":"uv","version":"0.11.8","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":null,"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}

File hashes

Hashes for agent_aid-1.4.0.tar.gz
Algorithm Hash digest
SHA256 88137c80e60c222e7330f757281d38e91849cc48167aee5dde8e686f226b33f1
MD5 d92d65a6e6853dce910c18519df66f50
BLAKE2b-256 b6c2ebe4eac82355f514b618fd71e48e25b5be2cef90f6a14c7dcc20ad5e482b

See more details on using hashes here.

File details

Details for the file agent_aid-1.4.0-py3-none-any.whl.

File metadata

  • Download URL: agent_aid-1.4.0-py3-none-any.whl
  • Upload date:
  • Size: 22.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.11.8 {"installer":{"name":"uv","version":"0.11.8","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":null,"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":null}

File hashes

Hashes for agent_aid-1.4.0-py3-none-any.whl
Algorithm Hash digest
SHA256 b3a82220f91c75ae5b324338d74ce506ded83d0ae6545a887df06bdd1218f1a7
MD5 78711fe998d8b303f148c8a6dcabef5c
BLAKE2b-256 eb53acaf62666e392000df11f9950abad36460754cc2501626152c26e207063d

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page