Skip to main content

Open source collaborative bank transaction scraper for Chilean banks.

Project description

Fintself Logo

Scraper de movimientos bancarios open source y colaborativo.

PyPI Build Status License Code style: black PyPI - Downloads

Fintself te permite automatizar la extracción de tus movimientos financieros desde diversas entidades bancarias, entregándote los datos en formatos estructurados como XLSX, CSV o JSON. Funciona tanto como una herramienta de línea de comandos (CLI) como una librería de Python para que la integres en tus propios proyectos.

Características principales

  • Múltiples bancos: Soporte para varios bancos, con una arquitectura diseñada para añadir nuevos fácilmente.
  • Formatos flexibles: Exporta tus datos a xlsx, csv o json.
  • Doble interfaz: Úsalo desde tu terminal con su potente CLI o impórtalo como librería en tus scripts de Python.
  • Seguridad primero: Las credenciales se solicitan de forma segura y no se almacenan. Se recomienda el uso de variables de entorno.
  • Modo de depuración: ¿Algo falla? Activa el modo debug para visualizar el proceso del scraper en tiempo real y guardar capturas de pantalla para un análisis fácil.
  • Open source: Revisa, audita y mejora el código. ¡Las contribuciones son bienvenidas!

Bancos soportados

Actualmente, Fintself soporta los siguientes bancos:

  • 🇨🇱 Chile:
    • Banco Santander (cl_santander)
    • Banco de Chile (cl_banco_chile)
    • Tarjeta Cencosud Scotiabank (cl_cencosud)

Para ver la lista actualizada directamente desde la herramienta, ejecuta fintself list.

Instalación

Para instalar Fintself, solo necesitas tener Python 3.9+ y ejecutar el siguiente comando:

pip install fintself

Uso

Línea de comandos (CLI)

  1. Listar bancos disponibles:

    fintself list
    
  2. Ejecutar un scraper:

    fintself scrape <bank_id> --output-file movimientos.xlsx
    
    • <bank_id>: El identificador del banco (ej: cl_santander).
    • --output-file: El archivo donde se guardarán los resultados. El formato (xlsx, csv, json) se infiere de la extensión.

    El programa buscará las credenciales (<BANK_ID>_USER y <BANK_ID>_PASSWORD) en las variables de entorno. Si no las encuentra, las pedirá de forma interactiva.

    Ejemplo:

    # Usando prompts interactivos
    fintself scrape cl_santander --output-file santander.xlsx
    
    # Usando variables de entorno
    export CL_SANTANDER_USER="tu-rut"
    export CL_SANTANDER_PASSWORD="tu-clave"
    fintself scrape cl_santander --output-file santander.csv
    

Uso como librería en Python

from fintself import get_scraper, MovementModel
from fintself.core.exceptions import FintselfException
import pandas as pd

# Las credenciales se pueden pasar directamente o se leerán desde
# las variables de entorno si no se proveen.
USER = "tu-usuario"
PASSWORD = "tu-clave"
BANK_ID = "cl_santander"

try:
    # Obtener el scraper usando la factory
    scraper = get_scraper(BANK_ID)

    # Ejecutar el scraper
    movements: list[MovementModel] = scraper.scrape(user=USER, password=PASSWORD)

    # Convertir a DataFrame de Pandas
    if movements:
        df = pd.DataFrame([m.model_dump() for m in movements])
        print(df.head())
    else:
        print("No se encontraron movimientos.")

except FintselfException as e:
    print(f"Ocurrió un error controlado: {e.message}")
except Exception as e:
    print(f"Ocurrió un error inesperado: {e}")

Depuración (Debugging)

Si un scraper falla o necesitas ver qué está pasando, puedes activar el modo de depuración. Esto ejecutará el navegador en modo visible (no headless) y guardará capturas de pantalla y el contenido HTML de los pasos clave del proceso.

Los archivos de depuración se guardan en el directorio debug_output/<bank_id>/.

Desde la CLI

Añade el flag --debug:

fintself scrape cl_santander --output-file out.xlsx --debug

Desde Python

Pasa el argumento debug_mode=True a la factory get_scraper:

scraper = get_scraper("cl_santander", debug_mode=True)
movements = scraper.scrape(user=USER, password=PASSWORD)

Modo de ejecución del navegador

Por defecto, Fintself ejecuta el navegador en modo visible (no headless), ya que algunos bancos tienen protecciones anti-bot que detectan navegadores sin interfaz gráfica. Esto garantiza la mejor compatibilidad con todos los bancos soportados.

Modo headless (no recomendado)

Si necesitas ejecutar el navegador en modo headless (sin interfaz gráfica), puedes usar la opción --headless, pero ten en cuenta que algunos bancos pueden no funcionar correctamente.

fintself scrape cl_santander --output-file out.xlsx --headless

⚠️ Advertencia: Al usar --headless, verás un mensaje de advertencia indicando que algunos bancos pueden fallar. Si encuentras problemas, ejecuta el scraper sin esta opción (modo visible por defecto).

Desde Python

# Modo visible (por defecto, recomendado)
scraper = get_scraper("cl_santander")

# Modo headless (puede no funcionar con algunos bancos)
scraper = get_scraper("cl_santander", headless=True)

# Forzar modo visible explícitamente
scraper = get_scraper("cl_santander", headless=False)

Variables de entorno

También puedes configurar el modo headless mediante la variable de entorno SCRAPER_HEADLESS_MODE:

# En tu archivo .env o terminal
export SCRAPER_HEADLESS_MODE=true  # Habilitar headless (no recomendado)
export SCRAPER_HEADLESS_MODE=false # Modo visible (por defecto)

⚠️ Descargo de responsabilidad

Este software se proporciona "tal cual", sin garantía de ningún tipo. Al utilizar Fintself, estás interactuando con sitios bancarios y manejando credenciales sensibles.

  • Usa Fintself bajo tu propio riesgo. Los desarrolladores no se hacen responsables de ningún problema, pérdida de datos, bloqueo de cuentas o cualquier otro daño que pueda surgir de su uso.
  • La seguridad de tus credenciales es tu responsabilidad. Recomendamos encarecidamente utilizar variables de entorno en lugar de escribir tus credenciales en scripts.
  • Los scrapers pueden dejar de funcionar en cualquier momento si el banco actualiza el diseño de su sitio web.

¿Cómo contribuir?

¡Las contribuciones son el corazón de Fintself! Si quieres añadir un nuevo banco, corregir un bug o proponer una mejora, eres bienvenido. Por favor, lee nuestra Guía de Contribución para empezar.

Licencia

Este proyecto está bajo la Licencia MIT. Consulta el archivo LICENSE para más detalles.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

fintself-1.2.0.tar.gz (34.1 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

fintself-1.2.0-py3-none-any.whl (35.8 kB view details)

Uploaded Python 3

File details

Details for the file fintself-1.2.0.tar.gz.

File metadata

  • Download URL: fintself-1.2.0.tar.gz
  • Upload date:
  • Size: 34.1 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for fintself-1.2.0.tar.gz
Algorithm Hash digest
SHA256 01fe668f920680ce25ed88a5edc42adccc0b4793b0b51947024378324cda05e8
MD5 2499c01e28eb8954c999f7182ba1a468
BLAKE2b-256 d5928d08c2275de8c4f9e693510f4911e909a83de367c2dd200fc1c3d84fc4ab

See more details on using hashes here.

Provenance

The following attestation bundles were made for fintself-1.2.0.tar.gz:

Publisher: release.yml on fintself/fintself

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

File details

Details for the file fintself-1.2.0-py3-none-any.whl.

File metadata

  • Download URL: fintself-1.2.0-py3-none-any.whl
  • Upload date:
  • Size: 35.8 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? Yes
  • Uploaded via: twine/6.1.0 CPython/3.13.7

File hashes

Hashes for fintself-1.2.0-py3-none-any.whl
Algorithm Hash digest
SHA256 938584c630b81ae2af52c9cd512da0f27ebd6b3b85b79587ed6b3eff811e7bbc
MD5 0f2e74905cf25e6340682fbaed02a3c2
BLAKE2b-256 5e7cf55edb27aa11fad53e6dd46cdfaf63219f16f5a4963fe33cdd11e8092221

See more details on using hashes here.

Provenance

The following attestation bundles were made for fintself-1.2.0-py3-none-any.whl:

Publisher: release.yml on fintself/fintself

Attestations: Values shown here reflect the state when the release was signed and may no longer be current.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page