Inteligentny Framework do Orkiestracji Zadań
Project description
Taskinity - Intelligent Task Orchestration Framework
Taskinity is a modern framework for defining, managing, and monitoring task flows using an intuitive DSL and Python decorators. Designed with simplicity and efficiency in mind, Taskinity offers significantly less overhead than Prefect, Airflow, or Luigi, working instantly without complicated configuration.
Mission
Our mission is to provide a simple yet powerful task orchestration tool that allows teams to focus on business logic rather than infrastructure management. We believe workflow automation should be accessible to everyone, regardless of team size or budget.
Strategy
Taskinity achieves its mission through:
- Ease of use - intuitive interface and minimal configuration
- Scalability - from simple scripts to complex production workflows
- Flexibility - easy integration with existing systems and tools
- Transparency - full visibility of task status and execution history
- Reliability - fault tolerance and automatic recovery mechanisms
Navigation Menu
- Documentation - Complete technical documentation
- Tutorial - Step-by-step introduction to Taskinity
- Examples - Ready-to-use flow examples
- FAQ - Frequently asked questions
- Troubleshooting - Help with solving problems
Table of Contents
- Advantages of Taskinity
- Quick Start
- Project Structure
- DSL Specification
- Examples
- Flow Visualization
- Monitoring and Logs
- Comparison with Other Frameworks
- Dashboard
- Notifications
- Parallel Execution
- Flow Scheduling
- Email Processing
- API Reference
- Extensions and Plugins
Advantages of Taskinity
- Simplicity - minimal feature set, easy to understand and extend
- Decorators - intuitive way to define tasks and flows
- DSL - readable language for defining connections between tasks
- Zero-config - works immediately without complicated setup
- Advanced monitoring - automatic logging and execution tracking with metrics
- Visualization - interactive tools for flow visualization
- Data validation - built-in mechanisms for input and output data validation
- Parallel execution - automatic flow optimization for better performance
- Reproducibility - full execution history and ability to recreate flows
- Modularity - core functionality with optional extensions
- Data processing - built-in tools for various data sources
- API integration - easy connection to external services
Quick Start
Installation
Taskinity can be installed using pip or poetry:
# Installation with pip
pip install taskinity
# OR installation with poetry
poetry add taskinity
# Clone repository (optional for the latest development version)
git clone https://github.com/taskinity/taskinity.git
cd taskinity
# Run example
python -m examples.basic_flow
Basic Usage
from taskinity import task, run_flow_from_dsl
# 1. Define tasks
@task(name="Fetch Data")
def fetch_data(url: str):
# Implementation
return data
@task(name="Process Data")
def process_data(data):
# Implementation
return processed_data
# 2. Define flow using DSL
flow_dsl = """
flow DataProcessing:
description: "Data Processing Flow"
fetch_data -> process_data
"""
# 3. Run the flow
results = run_flow_from_dsl(flow_dsl, {"url": "https://example.com/data"})
Specyfikacja DSL
Taskinity używa czytelnego języka do definiowania przepływów:
Core
The core functionality includes task and flow definitions, execution engine, and DSL parser.
Extensions
Optional extensions enhance Taskinity with additional features:
- Visualization - Convert flows to Mermaid diagrams and export to SVG/PNG
- Code Converter - Convert existing Python code to Taskinity flows
- Data Processors - Tools for working with CSV, JSON, and databases
- API Clients - Clients for REST, GraphQL, and WebSocket APIs
Examples
Taskinity includes a variety of examples in the examples directory:
- Email Processing - Process emails from IMAP servers with Docker configuration
- Data Processing - Process data from various sources with PostgreSQL integration
- API Integration - Connect to external APIs with a mock server for testing
- Visualization - Visualize flows with Mermaid and interactive diagrams
- Parallel Tasks - Optimize performance with parallel task execution
DSL Specification
Syntax Elements:
- flow [FlowName]: - Flow definition with name
- description: - Optional flow description
- [source_task] -> [target_task] - Definition of connection between tasks
- [zadanie_źródłowe] -> [zadanie1, zadanie2] - Połączenie jednego zadania z wieloma zadaniami
Przykład:
flow EmailProcessing:
description: "Przetwarzanie e-maili"
fetch_emails -> classify_emails
classify_emails -> process_urgent_emails
classify_emails -> process_regular_emails
process_urgent_emails -> send_responses
process_regular_emails -> send_responses
Examples
Taskinity includes a variety of examples in the examples directory. Each example is self-contained with its own README, configuration files, and Docker setup where applicable.
Email Processing
from taskinity import task, run_flow_from_dsl
@task(name="Fetch Emails")
def fetch_emails(server, username, password):
# Implementation
return ["Email 1", "Email 2"]
@task(name="Classify Emails")
def classify_emails(emails):
# Implementation
urgent = [e for e in emails if "URGENT" in e]
regular = [e for e in emails if "URGENT" not in e]
return {"urgent_emails": urgent, "regular_emails": regular}
@task(name="Process Urgent Emails")
def process_urgent_emails(urgent_emails):
# Implementation
return ["Response to urgent email" for _ in urgent_emails]
@task(name="Process Regular Emails")
def process_regular_emails(regular_emails):
# Implementation
return ["Response to regular email" for _ in regular_emails]
# Flow definition using DSL
email_dsl = """
flow EmailProcessing:
description: "Email Processing Flow"
fetch_emails -> classify_emails
classify_emails -> process_urgent_emails
classify_emails -> process_regular_emails
"""
# Run the flow
results = run_flow_from_dsl(email_dsl, {
"server": "imap.example.com",
"username": "user@example.com",
"password": "password123"
})
Data Analysis with Validation
from taskinity import task, run_flow_from_dsl
def validate_input_data(data):
if not isinstance(data, list):
raise ValueError("Input data must be a list")
if len(data) == 0:
raise ValueError("Data list cannot be empty")
def validate_output_data(result):
if not isinstance(result, dict):
raise ValueError("Result must be a dictionary")
if "summary" not in result or "average" not in result:
raise ValueError("Result must contain 'summary' and 'average' keys")
@task(name="Fetch Data")
def fetch_data():
# Implementation
return [1, 2, 3, 4, 5]
@task(name="Analyze Data", validate_input=validate_input_data, validate_output=validate_output_data)
def analyze_data(data):
# Implementation
return {"summary": sum(data), "average": sum(data) / len(data)}
# Flow definition using DSL
data_dsl = """
flow DataAnalysis:
description: "Data Analysis with Validation"
fetch_data -> analyze_data
"""
# Run the flow
results = run_flow_from_dsl(data_dsl, {})
Wizualizacja przepływów
Taskinity zawiera proste narzędzia do wizualizacji przepływów:
# Wizualizacja definicji DSL
python visualize_flow.py dsl --file email_processing.dsl --output flow_diagram.png
# Wizualizacja historii wykonania przepływu
python visualize_flow.py flow [flow_id] --output execution_diagram.png
# Wyświetlenie listy dostępnych przepływów
python visualize_flow.py list --flows
Monitoring and Logs
Taskinity automatycznie zapisuje logi wykonania przepływów w katalogu logs/. Można je łatwo przeglądać za pomocą standardowych narzędzi:
# Wyświetlenie logów dla konkretnego przepływu
import json
from pathlib import Path
def view_flow_logs(flow_id):
flow_file = Path("flows") / f"{flow_id}.json"
if not flow_file.exists():
print(f"Nie znaleziono przepływu o ID: {flow_id}")
return
with open(flow_file, "r") as f:
flow_data = json.load(f)
print(f"Przepływ: {flow_data['name']} (Status: {flow_data['status']})")
print(f"Czas rozpoczęcia: {flow_data['start_time']}")
print(f"Czas zakończenia: {flow_data.get('end_time', 'N/A')}")
print(f"Czas trwania: {flow_data.get('duration', 'N/A')} sekund")
if 'error' in flow_data:
print(f"Błąd: {flow_data['error']}")
print("\nZadania:")
for task_id in flow_data.get('tasks', []):
task_file = Path("flows") / f"{task_id}.json"
if task_file.exists():
with open(task_file, "r") as f:
task_data = json.load(f)
print(f" - {task_data['name']} (Status: {task_data['status']}, Czas: {task_data.get('duration', 'N/A')} sekund)")
Comparison with Other Frameworks
Tabela Porównawcza Frameworków
| Kryterium | taskinity | Prefect | Airflow | Luigi | Bonobo | Kedro | Mara |
|---|---|---|---|---|---|---|---|
| Typ Projektu | Lekkie przepływy | Złożone orchestracje | Złożone ETL | Proste ETL | ETL strumieniowe | Pipeline'y danych | Proste ETL |
| Składnia | DSL + dekoratory | Dekoratory @flow/@task |
Klasy z DAG |
Klasy z run() |
Funkcje + graf | Węzły i pipeline'y | Funkcje + dekoratory |
| Zależności | Brak | prefect>=2.0 |
apache-airflow |
luigi |
bonobo |
kedro |
mara |
| Obserwowalność | Podstawowe logi + UI | Grafana/Prometheus | Wbudowany UI | Logi tekstowe | Konsola | Wbudowany dashboard | Prosty interfejs webowy |
| Walidacja Danych | Własne funkcje | Typy Pydantic | Brak | Brak | Brak | Schematy datasetów | Brak |
| Równoległość | Wątki (przyszłe) | Wątki/Procesy | Executor | Sekwencyjne | Wątki | Równoległe wykonanie | Sekwencyjne |
| Integracje | Brak (rozszerzalne) | 100+ konektorów | 200+ konektorów | Ograniczone | CSV/JSON/SQL | Wsparcie MLflow | PostgreSQL/Redshift |
| UI/Dashboard | Prosty, lekki dashboard | Prefect Cloud/UI | Airflow UI | Brak | Brak | Kedro-Viz | Mara UI |
| Skalowalność | Lokalna | Klastry Dask/Kubernetes | Celery/Kubernetes | Apache Hadoop | Lokalna | Lokalna | Lokalna |
| Czas Konfiguracji | < 1 minuta | 15-30 minut | 30-60 minut | 5-10 minut | 2-5 minut | 10-20 minut | 5-10 minut |
| Rozmiar kodu | < 1000 linii | > 100,000 linii | > 500,000 linii | > 50,000 linii | ~15,000 linii | > 30,000 linii | ~10,000 linii |
| Krzywa uczenia | Bardzo płaska | Umiarkowana | Stroma | Umiarkowana | Płaska | Umiarkowana | Płaska |
Implementacje Przykładowe
1. taskinity: Automatyzacja Klasyfikacji Emaili
from flow_dsl import task, run_flow_from_dsl
@task(name="Pobierz maile")
def fetch_emails(server: str) -> list:
# Implementacja pobierania
return emails
@task(name="Klasyfikuj")
def classify(emails: list) -> dict:
# Klasyfikacja maili
return {"urgent": [...], "regular": [...]}
flow = """
flow EmailFlow:
fetch_emails -> classify
"""
run_flow_from_dsl(flow, {"server": "imap.example.com"})
2. Bonobo: Przetwarzanie Strumieniowe
import bonobo
def fetch_emails():
# Generator zwracający maile jeden po drugim
yield from imap_fetch()
def classify(email):
# Przetwarzanie każdego rekordu
return {**email, "label": model(email['body'])}
graph = bonobo.Graph()
graph.add_chain(fetch_emails, classify, bonobo.JsonWriter('output.json'))
bonobo.run(graph)
3. Kedro: Strukturyzowany Pipeline Danych
# nodes.py
def preprocess_emails(emails: pd.DataFrame) -> pd.DataFrame:
emails['label'] = emails['body'].apply(lambda x: classify(x))
return emails
# pipeline.py
from kedro.pipeline import node, Pipeline
pipeline = Pipeline([
node(
func=preprocess_emails,
inputs="raw_emails",
outputs="classified_emails",
name="classification_node"
)
])
# uruchomienie
kedro run
Kiedy używać taskinity?
- Małe i średnie projekty: Gdy potrzebujesz szybko zaimplementować przepływ pracy bez nadmiernej złożoności
- Prototypowanie: Gdy chcesz szybko przetestować koncepcję przepływu bez konfiguracji infrastruktury
- Czytelność: Gdy zależy Ci na czytelnym DSL, który mogą zrozumieć również osoby nietechniczne
- Minimalizm: Gdy nie potrzebujesz zaawansowanych funkcji jak planowanie czy rozproszone wykonanie
- Natychmiastowe użycie: Gdy chcesz zacząć bez instalacji i konfiguracji dodatkowych komponentów
Kiedy używać innych frameworków?
- Prefect: Gdy potrzebujesz zaawansowanego monitorowania, skalowania i integracji z chmurą
- Airflow: Gdy potrzebujesz zaawansowanego planowania, wielu integracji i masz duży zespół DevOps
- Luigi: Gdy potrzebujesz prostszego frameworka niż Airflow, ale bardziej rozbudowanego niż taskinity
- Bonobo: Gdy potrzebujesz przetwarzania strumieniowego i prostych transformacji ETL
- Kedro: Gdy pracujesz nad projektami data science i potrzebujesz struktury projektu
- Mara: Gdy potrzebujesz prostego ETL z interfejsem webowym
Rekomendowany Stack Technologiczny
Dla Małych Zespołów (do 10 użytkowników):
- Orchestracja: taskinity (prostota) lub Mara (ETL + UI)
- Przetwarzanie: Pandas/NumPy
- ML: Scikit-learn/Hugging Face Transformers
- Dashboard: Streamlit (szybki prototyp)
Dla Średnich Projektów (10-100 użytkowników):
- Orchestracja: Prefect (monitoring) lub Kedro (struktura projektu)
- Przetwarzanie: Dask dla równoległości
- ML: MLflow/Kubeflow
- Dashboard: Plotly Dash/Grafana
Dashboardy i Wizualizacja
taskinity oferuje dwa rodzaje dashboardów do monitorowania przepływów:
1. Mini Dashboard
Prosty, lekki dashboard z widokiem historii logów i możliwością szybkiego podglądu diagramów:
python mini_dashboard.py
Funkcje Mini Dashboardu:
- Historia przepływów z filtrowaniem (Wszystkie/Ukończone/Błędy/Uruchomione)
- Pomniejszone diagramy SVG (90% oryginalnej wielkości)
- Możliwość edycji diagramu bezpośrednio w interfejsie z kolorowaniem składni
- Domyślnie otwarte logi dla każdego przepływu z kolorowaniem składni
- Szczegóły zadań w przepływie
- Powiadomienia o statusie przepływów (email/Slack)
- Równoległe wykonanie niezależnych zadań
- Planowanie wykonania przepływów
2. Pełny Dashboard
Rozbudowany dashboard z pełną funkcjonalnością:
python simple_dashboard.py
Funkcje Pełnego Dashboardu:
- Przeglądanie definicji DSL
- Zaawansowana wizualizacja przepływów
- Historia wykonania przepływów
- Przeglądanie logów
- Uruchamianie przepływów
- Eksport diagramów do SVG
3. Wizualizacja w Linii Komend
Możliwość generowania diagramów bez uruchamiania dashboardu:
# Wizualizacja definicji DSL
python flow_visualizer.py dsl --file dsl_definitions/email_processing.dsl --output diagram.html
# Wizualizacja historii przepływu
python flow_visualizer.py flow [flow_id] --output flow_diagram.html
# Generowanie diagramu ASCII
python flow_visualizer.py dsl --file dsl_definitions/email_processing.dsl --ascii
Przykład diagramu ASCII:
=== EmailProcessing ===
[fetch_emails]
[classify_emails]
[process_urgent_emails]
[process_regular_emails]
[send_responses]
Połączenia:
fetch_emails --> classify_emails
classify_emails --> process_urgent_emails
classify_emails --> process_regular_emails
process_urgent_emails --> send_responses
process_regular_emails --> send_responses
Powiadomienia
taskinity oferuje system powiadomień o statusie przepływów przez email i Slack:
Konfiguracja Powiadomień
# Edycja konfiguracji powiadomień
python -c "from notification_service import load_config, save_config; config = load_config(); config['enabled'] = True; save_config(config)"
Lub poprzez API w mini dashboardzie:
POST /api/notifications/config
Funkcje Powiadomień:
- Powiadomienia o rozpoczęciu przepływu
- Powiadomienia o zakończeniu przepływu
- Powiadomienia o błędach w przepływie
- Szczegółowe informacje o zadaniach
- Wsparcie dla email (SMTP) i Slack (Webhook)
Równoległe Wykonanie
taskinity umożliwia równoległe wykonanie niezależnych zadań w przepływie:
# Uruchomienie przepływu z równoległym wykonaniem
from parallel_executor import run_parallel_flow_from_dsl
result = run_parallel_flow_from_dsl(dsl_content, input_data)
Lub poprzez API w mini dashboardzie:
POST /api/run
{
"dsl": "...",
"use_parallel": true
}
Zalety Równoległego Wykonania:
- Szybsze wykonanie przepływów z niezależnymi zadaniami
- Automatyczne wykrywanie zależności między zadaniami
- Optymalne wykorzystanie dostępnych zasobów (CPU)
- Pełna kompatybilność z istniejącymi definicjami DSL
Planowanie Przepływów
taskinity pozwala na planowanie automatycznego wykonania przepływów:
# Uruchomienie planera
python flow_scheduler.py start
# Utworzenie harmonogramu (co 60 minut)
python flow_scheduler.py create dsl_definitions/email_processing.dsl 60
# Lista harmonogramów
python flow_scheduler.py list
# Ręczne uruchomienie harmonogramu
python flow_scheduler.py run [schedule_id]
# Usunięcie harmonogramu
python flow_scheduler.py delete [schedule_id]
Lub poprzez API w mini dashboardzie:
GET /api/schedules
POST /api/schedules
PUT /api/schedules/{schedule_id}
DELETE /api/schedules/{schedule_id}
POST /api/schedules/{schedule_id}/run
POST /api/scheduler/start
POST /api/scheduler/stop
Typy Harmonogramów:
- Interwałowy (co X minut)
- Dzienny (o określonej godzinie)
- Tygodniowy (w określony dzień tygodnia)
- Miesięczny (w określony dzień miesiąca)
API Reference
Dekoratory
@task
@task(name=None, description=None, validate_input=None, validate_output=None)
def my_task():
pass
- name: Opcjonalna nazwa zadania (domyślnie: nazwa funkcji)
- description: Opcjonalny opis zadania
- validate_input: Opcjonalna funkcja do walidacji danych wejściowych
- validate_output: Opcjonalna funkcja do walidacji danych wyjściowych
@flow
@flow(name=None, description=None)
def my_flow():
pass
- name: Opcjonalna nazwa przepływu (domyślnie: nazwa funkcji)
- description: Opcjonalny opis przepływu
Funkcje
run_flow_from_dsl
run_flow_from_dsl(dsl_text, input_data=None)
- dsl_text: Tekst DSL definiujący przepływ
- input_data: Opcjonalne dane wejściowe dla przepływu
parse_dsl
parse_dsl(dsl_text)
- dsl_text: Tekst DSL do sparsowania
save_dsl
save_dsl(dsl_text, filename)
- dsl_text: Tekst DSL do zapisania
- filename: Nazwa pliku
load_dsl
load_dsl(filename)
- filename: Nazwa pliku DSL do wczytania
list_flows
list_flows()
Zwraca listę wszystkich wykonanych przepływów.
Extensions and Plugins
Taskinity follows a modular architecture where core functionality can be extended with plugins. The following extensions are available:
Visualization Extensions
from taskinity.extensions.mermaid_converter import convert_to_mermaid, export_as_svg
# Convert flow to Mermaid diagram
mermaid_code = convert_to_mermaid(flow_dsl)
# Export to SVG
svg_file = export_as_svg(mermaid_code, "flow_diagram.svg")
Code Converter
from taskinity.extensions.code_converter import convert_code_to_taskinity
# Convert existing Python code to Taskinity flow
dsl_text = convert_code_to_taskinity("path/to/script.py", "output_flow.dsl")
Data Processors
from taskinity.data_processors import CSVProcessor, JSONProcessor, DatabaseProcessor
# Process CSV data
csv_processor = CSVProcessor()
data = csv_processor.read("data.csv")
transformed_data = csv_processor.transform(data, lambda x: x * 2)
csv_processor.write(transformed_data, "output.csv")
API Clients
from taskinity.api_client import RESTClient, GraphQLClient
# Use REST client
rest_client = RESTClient("https://api.example.com")
response = rest_client.get("users")
# Use GraphQL client
graphql_client = GraphQLClient("https://api.example.com/graphql")
response = graphql_client.query("""
query {
users {
id
name
}
}
""")
Future Extensions
- Web Dashboard - interactive visualization of flows and their status
- Type Validation - automatic validation of input/output data types
- Error Handling - retry mechanisms and exception handling
- Persistence - saving flow state in a database
- REST API - API for managing flows
License
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file taskinity-0.1.0.tar.gz.
File metadata
- Download URL: taskinity-0.1.0.tar.gz
- Upload date:
- Size: 80.4 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/2.1.3 CPython/3.11.12 Linux/6.14.6-300.fc42.x86_64
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
3abeba720657ae48fdc02fab76127c0f36b860785e7c770e884729fd4f766301
|
|
| MD5 |
34ddbfbd87575113a675ef0aefbc42e6
|
|
| BLAKE2b-256 |
e37e5cc6e551e50047bb8de5b603c236d09aaf40679f63c270b3f9d224b9c902
|
File details
Details for the file taskinity-0.1.0-py3-none-any.whl.
File metadata
- Download URL: taskinity-0.1.0-py3-none-any.whl
- Upload date:
- Size: 84.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/2.1.3 CPython/3.11.12 Linux/6.14.6-300.fc42.x86_64
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
1c6f3c22215c0bcd4d1893f0ee27a5b6094f1804f175d9146d66ff1729782a73
|
|
| MD5 |
c50fc6d5985309d5e10ffcc984497b1f
|
|
| BLAKE2b-256 |
468a9b7a4622755ee7944cc3084dad6aec620ad58675f016d6de7f3dc68a963f
|