Inteligentny Framework do Orkiestracji Zadań

These details have not been verified by PyPI

Project links

Project description

Taskinity - Intelligent Task Orchestration Framework

Taskinity is a modern framework for defining, managing, and monitoring task flows using an intuitive DSL and Python decorators. Designed with simplicity and efficiency in mind, Taskinity offers significantly less overhead than Prefect, Airflow, or Luigi, working instantly without complicated configuration.

Taskinity Logo

Mission

Our mission is to provide a simple yet powerful task orchestration tool that allows teams to focus on business logic rather than infrastructure management. We believe workflow automation should be accessible to everyone, regardless of team size or budget.

Strategy

Taskinity achieves its mission through:

Ease of use - intuitive interface and minimal configuration
Scalability - from simple scripts to complex production workflows
Flexibility - easy integration with existing systems and tools
Transparency - full visibility of task status and execution history
Reliability - fault tolerance and automatic recovery mechanisms

Advantages of Taskinity

Simplicity - minimal feature set, easy to understand and extend
Decorators - intuitive way to define tasks and flows
DSL - readable language for defining connections between tasks
Zero-config - works immediately without complicated setup
Advanced monitoring - automatic logging and execution tracking with metrics
Visualization - interactive tools for flow visualization
Data validation - built-in mechanisms for input and output data validation
Parallel execution - automatic flow optimization for better performance
Reproducibility - full execution history and ability to recreate flows
Modularity - core functionality with optional extensions
Data processing - built-in tools for various data sources
API integration - easy connection to external services

Quick Start

Installation

Taskinity can be installed using pip or poetry:

# Installation with pip
pip install taskinity

# OR installation with poetry
poetry add taskinity

# Clone repository (optional for the latest development version)
git clone https://github.com/taskinity/taskinity.git
cd taskinity

# Run example
python -m examples.basic_flow

Basic Usage

from taskinity import task, run_flow_from_dsl

# 1. Define tasks
@task(name="Fetch Data")
def fetch_data(url: str):
    # Implementation
    return data

@task(name="Process Data")
def process_data(data):
    # Implementation
    return processed_data

# 2. Define flow using DSL
flow_dsl = """
flow DataProcessing:
    description: "Data Processing Flow"
    fetch_data -> process_data
"""

# 3. Run the flow
results = run_flow_from_dsl(flow_dsl, {"url": "https://example.com/data"})

Specyfikacja DSL

Taskinity używa czytelnego języka do definiowania przepływów:

Core

The core functionality includes task and flow definitions, execution engine, and DSL parser.

Extensions

Optional extensions enhance Taskinity with additional features:

Visualization - Convert flows to Mermaid diagrams and export to SVG/PNG
Code Converter - Convert existing Python code to Taskinity flows
Data Processors - Tools for working with CSV, JSON, and databases
API Clients - Clients for REST, GraphQL, and WebSocket APIs

Examples

Taskinity includes a variety of examples in the examples directory:

Email Processing - Process emails from IMAP servers with Docker configuration
Data Processing - Process data from various sources with PostgreSQL integration
API Integration - Connect to external APIs with a mock server for testing
Visualization - Visualize flows with Mermaid and interactive diagrams
Parallel Tasks - Optimize performance with parallel task execution

DSL Specification

Syntax Elements:

flow [FlowName]: - Flow definition with name
description: - Optional flow description
[source_task] -> [target_task] - Definition of connection between tasks
[zadanie_źródłowe] -> [zadanie1, zadanie2] - Połączenie jednego zadania z wieloma zadaniami

Przykład:

flow EmailProcessing:
    description: "Przetwarzanie e-maili"
    fetch_emails -> classify_emails
    classify_emails -> process_urgent_emails
    classify_emails -> process_regular_emails
    process_urgent_emails -> send_responses
    process_regular_emails -> send_responses

Examples

Taskinity includes a variety of examples in the examples directory. Each example is self-contained with its own README, configuration files, and Docker setup where applicable.

Email Processing

from taskinity import task, run_flow_from_dsl

@task(name="Fetch Emails")
def fetch_emails(server, username, password):
    # Implementation
    return ["Email 1", "Email 2"]

@task(name="Classify Emails")
def classify_emails(emails):
    # Implementation
    urgent = [e for e in emails if "URGENT" in e]
    regular = [e for e in emails if "URGENT" not in e]
    return {"urgent_emails": urgent, "regular_emails": regular}

@task(name="Process Urgent Emails")
def process_urgent_emails(urgent_emails):
    # Implementation
    return ["Response to urgent email" for _ in urgent_emails]

@task(name="Process Regular Emails")
def process_regular_emails(regular_emails):
    # Implementation
    return ["Response to regular email" for _ in regular_emails]

# Flow definition using DSL
email_dsl = """
flow EmailProcessing:
    description: "Email Processing Flow"
    fetch_emails -> classify_emails
    classify_emails -> process_urgent_emails
    classify_emails -> process_regular_emails
"""

# Run the flow
results = run_flow_from_dsl(email_dsl, {
    "server": "imap.example.com",
    "username": "user@example.com",
    "password": "password123"
})

Data Analysis with Validation

from taskinity import task, run_flow_from_dsl

def validate_input_data(data):
    if not isinstance(data, list):
        raise ValueError("Input data must be a list")
    if len(data) == 0:
        raise ValueError("Data list cannot be empty")

def validate_output_data(result):
    if not isinstance(result, dict):
        raise ValueError("Result must be a dictionary")
    if "summary" not in result or "average" not in result:
        raise ValueError("Result must contain 'summary' and 'average' keys")

@task(name="Fetch Data")
def fetch_data():
    # Implementation
    return [1, 2, 3, 4, 5]

@task(name="Analyze Data", validate_input=validate_input_data, validate_output=validate_output_data)
def analyze_data(data):
    # Implementation
    return {"summary": sum(data), "average": sum(data) / len(data)}

# Flow definition using DSL
data_dsl = """
flow DataAnalysis:
    description: "Data Analysis with Validation"
    fetch_data -> analyze_data
"""

# Run the flow
results = run_flow_from_dsl(data_dsl, {})

Wizualizacja przepływów

Taskinity zawiera proste narzędzia do wizualizacji przepływów:

# Wizualizacja definicji DSL
python visualize_flow.py dsl --file email_processing.dsl --output flow_diagram.png

# Wizualizacja historii wykonania przepływu
python visualize_flow.py flow [flow_id] --output execution_diagram.png

# Wyświetlenie listy dostępnych przepływów
python visualize_flow.py list --flows

Monitoring and Logs

Taskinity automatycznie zapisuje logi wykonania przepływów w katalogu logs/. Można je łatwo przeglądać za pomocą standardowych narzędzi:

# Wyświetlenie logów dla konkretnego przepływu
import json
from pathlib import Path

def view_flow_logs(flow_id):
    flow_file = Path("flows") / f"{flow_id}.json"
    if not flow_file.exists():
        print(f"Nie znaleziono przepływu o ID: {flow_id}")
        return
    
    with open(flow_file, "r") as f:
        flow_data = json.load(f)
    
    print(f"Przepływ: {flow_data['name']} (Status: {flow_data['status']})")
    print(f"Czas rozpoczęcia: {flow_data['start_time']}")
    print(f"Czas zakończenia: {flow_data.get('end_time', 'N/A')}")
    print(f"Czas trwania: {flow_data.get('duration', 'N/A')} sekund")
    
    if 'error' in flow_data:
        print(f"Błąd: {flow_data['error']}")
    
    print("\nZadania:")
    for task_id in flow_data.get('tasks', []):
        task_file = Path("flows") / f"{task_id}.json"
        if task_file.exists():
            with open(task_file, "r") as f:
                task_data = json.load(f)
            print(f"  - {task_data['name']} (Status: {task_data['status']}, Czas: {task_data.get('duration', 'N/A')} sekund)")

Comparison with Other Frameworks

Tabela Porównawcza Frameworków

Kryterium	taskinity	Prefect	Airflow	Luigi	Bonobo	Kedro	Mara
Typ Projektu	Lekkie przepływy	Złożone orchestracje	Złożone ETL	Proste ETL	ETL strumieniowe	Pipeline'y danych	Proste ETL
Składnia	DSL + dekoratory	Dekoratory `@flow/@task`	Klasy z `DAG`	Klasy z `run()`	Funkcje + graf	Węzły i pipeline'y	Funkcje + dekoratory
Zależności	Brak	`prefect>=2.0`	`apache-airflow`	`luigi`	`bonobo`	`kedro`	`mara`
Obserwowalność	Podstawowe logi + UI	Grafana/Prometheus	Wbudowany UI	Logi tekstowe	Konsola	Wbudowany dashboard	Prosty interfejs webowy
Walidacja Danych	Własne funkcje	Typy Pydantic	Brak	Brak	Brak	Schematy datasetów	Brak
Równoległość	Wątki (przyszłe)	Wątki/Procesy	Executor	Sekwencyjne	Wątki	Równoległe wykonanie	Sekwencyjne
Integracje	Brak (rozszerzalne)	100+ konektorów	200+ konektorów	Ograniczone	CSV/JSON/SQL	Wsparcie MLflow	PostgreSQL/Redshift
UI/Dashboard	Prosty, lekki dashboard	Prefect Cloud/UI	Airflow UI	Brak	Brak	Kedro-Viz	Mara UI
Skalowalność	Lokalna	Klastry Dask/Kubernetes	Celery/Kubernetes	Apache Hadoop	Lokalna	Lokalna	Lokalna
Czas Konfiguracji	< 1 minuta	15-30 minut	30-60 minut	5-10 minut	2-5 minut	10-20 minut	5-10 minut
Rozmiar kodu	< 1000 linii	> 100,000 linii	> 500,000 linii	> 50,000 linii	~15,000 linii	> 30,000 linii	~10,000 linii
Krzywa uczenia	Bardzo płaska	Umiarkowana	Stroma	Umiarkowana	Płaska	Umiarkowana	Płaska

Implementacje Przykładowe

1. taskinity: Automatyzacja Klasyfikacji Emaili

from flow_dsl import task, run_flow_from_dsl

@task(name="Pobierz maile")
def fetch_emails(server: str) -> list:
    # Implementacja pobierania
    return emails

@task(name="Klasyfikuj")
def classify(emails: list) -> dict:
    # Klasyfikacja maili
    return {"urgent": [...], "regular": [...]}

flow = """
flow EmailFlow:
    fetch_emails -> classify
"""

run_flow_from_dsl(flow, {"server": "imap.example.com"})

2. Bonobo: Przetwarzanie Strumieniowe

import bonobo

def fetch_emails():
    # Generator zwracający maile jeden po drugim
    yield from imap_fetch()

def classify(email):
    # Przetwarzanie każdego rekordu
    return {**email, "label": model(email['body'])}

graph = bonobo.Graph()
graph.add_chain(fetch_emails, classify, bonobo.JsonWriter('output.json'))

bonobo.run(graph)

3. Kedro: Strukturyzowany Pipeline Danych

# nodes.py
def preprocess_emails(emails: pd.DataFrame) -> pd.DataFrame:
    emails['label'] = emails['body'].apply(lambda x: classify(x))
    return emails

# pipeline.py
from kedro.pipeline import node, Pipeline

pipeline = Pipeline([
    node(
        func=preprocess_emails,
        inputs="raw_emails",
        outputs="classified_emails",
        name="classification_node"
    )
])

# uruchomienie
kedro run

Kiedy używać taskinity?

Małe i średnie projekty: Gdy potrzebujesz szybko zaimplementować przepływ pracy bez nadmiernej złożoności
Prototypowanie: Gdy chcesz szybko przetestować koncepcję przepływu bez konfiguracji infrastruktury
Czytelność: Gdy zależy Ci na czytelnym DSL, który mogą zrozumieć również osoby nietechniczne
Minimalizm: Gdy nie potrzebujesz zaawansowanych funkcji jak planowanie czy rozproszone wykonanie
Natychmiastowe użycie: Gdy chcesz zacząć bez instalacji i konfiguracji dodatkowych komponentów

Kiedy używać innych frameworków?

Prefect: Gdy potrzebujesz zaawansowanego monitorowania, skalowania i integracji z chmurą
Airflow: Gdy potrzebujesz zaawansowanego planowania, wielu integracji i masz duży zespół DevOps
Luigi: Gdy potrzebujesz prostszego frameworka niż Airflow, ale bardziej rozbudowanego niż taskinity
Bonobo: Gdy potrzebujesz przetwarzania strumieniowego i prostych transformacji ETL
Kedro: Gdy pracujesz nad projektami data science i potrzebujesz struktury projektu
Mara: Gdy potrzebujesz prostego ETL z interfejsem webowym

Rekomendowany Stack Technologiczny

Dla Małych Zespołów (do 10 użytkowników):

Orchestracja: taskinity (prostota) lub Mara (ETL + UI)
Przetwarzanie: Pandas/NumPy
ML: Scikit-learn/Hugging Face Transformers
Dashboard: Streamlit (szybki prototyp)

Dla Średnich Projektów (10-100 użytkowników):

Orchestracja: Prefect (monitoring) lub Kedro (struktura projektu)
Przetwarzanie: Dask dla równoległości
ML: MLflow/Kubeflow
Dashboard: Plotly Dash/Grafana

Dashboardy i Wizualizacja

taskinity oferuje dwa rodzaje dashboardów do monitorowania przepływów:

1. Mini Dashboard

Prosty, lekki dashboard z widokiem historii logów i możliwością szybkiego podglądu diagramów:

python mini_dashboard.py

Funkcje Mini Dashboardu:

Historia przepływów z filtrowaniem (Wszystkie/Ukończone/Błędy/Uruchomione)
Pomniejszone diagramy SVG (90% oryginalnej wielkości)
Możliwość edycji diagramu bezpośrednio w interfejsie z kolorowaniem składni
Domyślnie otwarte logi dla każdego przepływu z kolorowaniem składni
Szczegóły zadań w przepływie
Powiadomienia o statusie przepływów (email/Slack)
Równoległe wykonanie niezależnych zadań
Planowanie wykonania przepływów

Mini Dashboard

2. Pełny Dashboard

Rozbudowany dashboard z pełną funkcjonalnością:

python simple_dashboard.py

Funkcje Pełnego Dashboardu:

Przeglądanie definicji DSL
Zaawansowana wizualizacja przepływów
Historia wykonania przepływów
Przeglądanie logów
Uruchamianie przepływów
Eksport diagramów do SVG

3. Wizualizacja w Linii Komend

Możliwość generowania diagramów bez uruchamiania dashboardu:

# Wizualizacja definicji DSL
python flow_visualizer.py dsl --file dsl_definitions/email_processing.dsl --output diagram.html

# Wizualizacja historii przepływu
python flow_visualizer.py flow [flow_id] --output flow_diagram.html

# Generowanie diagramu ASCII
python flow_visualizer.py dsl --file dsl_definitions/email_processing.dsl --ascii

Przykład diagramu ASCII:

=== EmailProcessing ===

[fetch_emails]
[classify_emails]
[process_urgent_emails]
[process_regular_emails]
[send_responses]

Połączenia:
fetch_emails --> classify_emails
classify_emails --> process_urgent_emails
classify_emails --> process_regular_emails
process_urgent_emails --> send_responses
process_regular_emails --> send_responses

Powiadomienia

taskinity oferuje system powiadomień o statusie przepływów przez email i Slack:

Konfiguracja Powiadomień

# Edycja konfiguracji powiadomień
python -c "from notification_service import load_config, save_config; config = load_config(); config['enabled'] = True; save_config(config)"

Lub poprzez API w mini dashboardzie:

POST /api/notifications/config

Funkcje Powiadomień:

Powiadomienia o rozpoczęciu przepływu
Powiadomienia o zakończeniu przepływu
Powiadomienia o błędach w przepływie
Szczegółowe informacje o zadaniach
Wsparcie dla email (SMTP) i Slack (Webhook)

Równoległe Wykonanie

taskinity umożliwia równoległe wykonanie niezależnych zadań w przepływie:

# Uruchomienie przepływu z równoległym wykonaniem
from parallel_executor import run_parallel_flow_from_dsl

result = run_parallel_flow_from_dsl(dsl_content, input_data)

Lub poprzez API w mini dashboardzie:

POST /api/run
{
  "dsl": "...",
  "use_parallel": true
}

Zalety Równoległego Wykonania:

Szybsze wykonanie przepływów z niezależnymi zadaniami
Automatyczne wykrywanie zależności między zadaniami
Optymalne wykorzystanie dostępnych zasobów (CPU)
Pełna kompatybilność z istniejącymi definicjami DSL

Planowanie Przepływów

taskinity pozwala na planowanie automatycznego wykonania przepływów:

# Uruchomienie planera
python flow_scheduler.py start

# Utworzenie harmonogramu (co 60 minut)
python flow_scheduler.py create dsl_definitions/email_processing.dsl 60

# Lista harmonogramów
python flow_scheduler.py list

# Ręczne uruchomienie harmonogramu
python flow_scheduler.py run [schedule_id]

# Usunięcie harmonogramu
python flow_scheduler.py delete [schedule_id]

Lub poprzez API w mini dashboardzie:

GET /api/schedules
POST /api/schedules
PUT /api/schedules/{schedule_id}
DELETE /api/schedules/{schedule_id}
POST /api/schedules/{schedule_id}/run
POST /api/scheduler/start
POST /api/scheduler/stop

Typy Harmonogramów:

Interwałowy (co X minut)
Dzienny (o określonej godzinie)
Tygodniowy (w określony dzień tygodnia)
Miesięczny (w określony dzień miesiąca)

API Reference

Dekoratory

`@task`

@task(name=None, description=None, validate_input=None, validate_output=None)
def my_task():
    pass

name: Opcjonalna nazwa zadania (domyślnie: nazwa funkcji)
description: Opcjonalny opis zadania
validate_input: Opcjonalna funkcja do walidacji danych wejściowych
validate_output: Opcjonalna funkcja do walidacji danych wyjściowych

`@flow`

@flow(name=None, description=None)
def my_flow():
    pass

name: Opcjonalna nazwa przepływu (domyślnie: nazwa funkcji)
description: Opcjonalny opis przepływu

Funkcje

`run_flow_from_dsl`

run_flow_from_dsl(dsl_text, input_data=None)

dsl_text: Tekst DSL definiujący przepływ
input_data: Opcjonalne dane wejściowe dla przepływu

`parse_dsl`

parse_dsl(dsl_text)

dsl_text: Tekst DSL do sparsowania

`save_dsl`

save_dsl(dsl_text, filename)

dsl_text: Tekst DSL do zapisania
filename: Nazwa pliku

`load_dsl`

load_dsl(filename)

filename: Nazwa pliku DSL do wczytania

`list_flows`

list_flows()

Zwraca listę wszystkich wykonanych przepływów.

Extensions and Plugins

Taskinity follows a modular architecture where core functionality can be extended with plugins. The following extensions are available:

Visualization Extensions

from taskinity.extensions.mermaid_converter import convert_to_mermaid, export_as_svg

# Convert flow to Mermaid diagram
mermaid_code = convert_to_mermaid(flow_dsl)

# Export to SVG
svg_file = export_as_svg(mermaid_code, "flow_diagram.svg")

Code Converter

from taskinity.extensions.code_converter import convert_code_to_taskinity

# Convert existing Python code to Taskinity flow
dsl_text = convert_code_to_taskinity("path/to/script.py", "output_flow.dsl")

Data Processors

from taskinity.data_processors import CSVProcessor, JSONProcessor, DatabaseProcessor

# Process CSV data
csv_processor = CSVProcessor()
data = csv_processor.read("data.csv")
transformed_data = csv_processor.transform(data, lambda x: x * 2)
csv_processor.write(transformed_data, "output.csv")

API Clients

from taskinity.api_client import RESTClient, GraphQLClient

# Use REST client
rest_client = RESTClient("https://api.example.com")
response = rest_client.get("users")

# Use GraphQL client
graphql_client = GraphQLClient("https://api.example.com/graphql")
response = graphql_client.query("""
    query {
        users {
            id
            name
        }
    }
""")

Future Extensions

Web Dashboard - interactive visualization of flows and their status
Type Validation - automatic validation of input/output data types
Error Handling - retry mechanisms and exception handling
Persistence - saving flow state in a database
REST API - API for managing flows

License

Apache License

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.1.5

May 24, 2025

0.1.4

May 24, 2025

0.1.3

May 24, 2025

0.1.2

May 24, 2025

0.1.1

May 24, 2025

This version

0.1.0

May 24, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

taskinity-0.1.0.tar.gz (80.4 kB view details)

Uploaded May 24, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

taskinity-0.1.0-py3-none-any.whl (84.6 kB view details)

Uploaded May 24, 2025 Python 3

File details

Details for the file taskinity-0.1.0.tar.gz.

File metadata

Download URL: taskinity-0.1.0.tar.gz
Upload date: May 24, 2025
Size: 80.4 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: poetry/2.1.3 CPython/3.11.12 Linux/6.14.6-300.fc42.x86_64

File hashes

Hashes for taskinity-0.1.0.tar.gz
Algorithm	Hash digest
SHA256	`3abeba720657ae48fdc02fab76127c0f36b860785e7c770e884729fd4f766301`
MD5	`34ddbfbd87575113a675ef0aefbc42e6`
BLAKE2b-256	`e37e5cc6e551e50047bb8de5b603c236d09aaf40679f63c270b3f9d224b9c902`

See more details on using hashes here.

File details

Details for the file taskinity-0.1.0-py3-none-any.whl.

File metadata

Download URL: taskinity-0.1.0-py3-none-any.whl
Upload date: May 24, 2025
Size: 84.6 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: poetry/2.1.3 CPython/3.11.12 Linux/6.14.6-300.fc42.x86_64

File hashes

Hashes for taskinity-0.1.0-py3-none-any.whl
Algorithm	Hash digest
SHA256	`1c6f3c22215c0bcd4d1893f0ee27a5b6094f1804f175d9146d66ff1729782a73`
MD5	`c50fc6d5985309d5e10ffcc984497b1f`
BLAKE2b-256	`468a9b7a4622755ee7944cc3084dad6aec620ad58675f016d6de7f3dc68a963f`

See more details on using hashes here.

taskinity 0.1.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Taskinity - Intelligent Task Orchestration Framework

Mission

Strategy

Navigation Menu

Table of Contents

Advantages of Taskinity

Quick Start

Installation

Basic Usage

Specyfikacja DSL

Core

Extensions

Examples

DSL Specification

Syntax Elements:

Przykład:

Examples

Email Processing

Data Analysis with Validation

Wizualizacja przepływów

Monitoring and Logs

Comparison with Other Frameworks

Tabela Porównawcza Frameworków

Implementacje Przykładowe

1. taskinity: Automatyzacja Klasyfikacji Emaili

2. Bonobo: Przetwarzanie Strumieniowe

3. Kedro: Strukturyzowany Pipeline Danych

Kiedy używać taskinity?

Kiedy używać innych frameworków?

Rekomendowany Stack Technologiczny

Dla Małych Zespołów (do 10 użytkowników):

Dla Średnich Projektów (10-100 użytkowników):

Dashboardy i Wizualizacja

1. Mini Dashboard

2. Pełny Dashboard

3. Wizualizacja w Linii Komend

Powiadomienia

Konfiguracja Powiadomień

Równoległe Wykonanie

Planowanie Przepływów

API Reference

Dekoratory

@task

@flow

Funkcje

run_flow_from_dsl

parse_dsl

save_dsl

load_dsl

list_flows

Extensions and Plugins

Visualization Extensions

Code Converter

Data Processors

API Clients

Future Extensions

License

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

`@task`

`@flow`

`run_flow_from_dsl`

`parse_dsl`

`save_dsl`

`load_dsl`

`list_flows`