Skip to main content

A professional gesture-based screen capture system using MediaPipe and FastAPI

Project description

Gesture Vision Logo

Build Tech License

Branch Version Status
master 0.1.0 passing
Platform Python System Dependencies
Linux (x86_64) 3.12+ libgl1, libglib2.0-0, notify-send
macOS (ARM64) N/A N/A
Windows (x86_64) N/A N/A
  • Docs: [Enlace a documentación]
  • Website: [Enlace a web]

Introducción

Gesture Vision es un sistema de automatización de grado de producción, desarrollado en Python para la captura de pantallas mediante el reconocimiento de gestos en tiempo real.

El sistema funciona mediante un pipeline de visión artificial donde MediaPipe procesa el flujo de la cámara para detectar puntos clave de la mano, coordinado por un backend asíncrono en FastAPI. Esto proporciona un control preciso de eventos con un impacto mínimo en los recursos del sistema.

Arquitectura

Diagrama de Arquitectura

Características Principales

  • Rastreo de Alta Precisión: Implementación de MediaPipe Hand Landmarker para la detección de puntos clave manuales con baja latencia.
  • Control de Disparo Robusto: Sistema de validación basado en tiempo de mantenimiento del gesto y periodos de cooldown para eliminar falsos positivos.
  • Modo Invisible (Background): Operación totalmente en segundo plano sin ventanas de previsualización, optimizando el uso de la GPU/CPU.
  • Notificaciones Nativas: Integración con el sistema de alertas del escritorio para confirmar capturas exitosas instantáneamente.
  • Despliegue Nativo: Instalación simplificada vía pip con comandos CLI dedicados para la gestión del servicio.

Quick Start

1. Dependencias del Sistema

Instale las librerías necesarias para OpenCV y notificaciones:

sudo apt-get update && sudo apt-get install -y libgl1 libglib2.0-0 libnotify-bin

2. Instalación

Se recomienda el uso de un entorno virtual:

# Clonar repositorio
git clone <repo-url>
cd gesture-vision

# Configurar entorno virtual
python3 -m venv venv
source venv/bin/activate

# Instalación en modo editable
pip install -e .

3. Ejecución y Control

El sistema expone comandos directos en la terminal:

# Iniciar el sistema y la API
gesturevision-start

# Detener el sistema
gesturevision-stop

4. Gestión y Configuración

Acceda al panel de control web para editar gestos y tiempos de respuesta: http://localhost:8080

Los ajustes se almacenan localmente en: ~/gesturevision/config.json

Estructura del Proyecto

  • src/gesturevision/main_vision.py: Motor de detección de gestos y captura.
  • src/gesturevision/api/: Backend FastAPI para control y configuración.
  • src/gesturevision/static/: Interfaz de usuario del panel de control.
  • pyproject.toml: Definición de dependencias y entry points del paquete.
  • assets/hand_landmarker.task: Modelo de IA pre-entrenado.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

gesturevision-0.1.3.tar.gz (5.8 MB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

gesturevision-0.1.3-py3-none-any.whl (5.9 MB view details)

Uploaded Python 3

File details

Details for the file gesturevision-0.1.3.tar.gz.

File metadata

  • Download URL: gesturevision-0.1.3.tar.gz
  • Upload date:
  • Size: 5.8 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.3

File hashes

Hashes for gesturevision-0.1.3.tar.gz
Algorithm Hash digest
SHA256 0805db32eb4c4c0b37b684e3777a491803129440170a87ae01d529abd121a497
MD5 b9c262064937a63ae4fea19f2157c2f9
BLAKE2b-256 5c68b2ab990d59694920f9f8c4e5c31ddc066bd25904b67bde61e533db45b332

See more details on using hashes here.

File details

Details for the file gesturevision-0.1.3-py3-none-any.whl.

File metadata

  • Download URL: gesturevision-0.1.3-py3-none-any.whl
  • Upload date:
  • Size: 5.9 MB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.3

File hashes

Hashes for gesturevision-0.1.3-py3-none-any.whl
Algorithm Hash digest
SHA256 28f0dce9a51319d339611225f4d024f9fc0ba5b84ad855f37cb6a1635082e427
MD5 62712b75a4aaedfa37764e530f19e2fd
BLAKE2b-256 1908b0ba88fdc3cfacce20613948c697b8e5ea94b05d258e6308e6940264fe43

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page