A simple and powerful task scheduler.
Project description
TaskBrain
L'utilisation de taskbrain est fortement conseillée lorsque votre application nécessite l'exécution de multiples tâches, en parallèle, dans des processus différents. Ce module s'appuie largement sur la bibliothèque Asyncio de Python, ce qui permet de gérer l'exécution de code asynchrone ainsi que le multiprocessing.
Avantages :
- Gestion des erreurs
- Isolation des exécutions
- Journaux détaillés des exécutions des tâches
- Toutes les méthodes partagent les attributs de la classe via le self, assurant ainsi une intercommunication transparente
Task
Pour transformer une méthode du Brain en tâche et ainsi pouvoir contrôler son exécution comme on veut, il suffit d’utiliser le décorateur Brain.task().
@Brain.task(...)
async def ma_methode(self):
pass
Ce décorateur comprend 2 paramètres obligatoires à compléter : process et run_on_start. Ils ont été rendus obligatoires afin d’améliorer la clarté du code ; cela permet de bien voir quelle méthode s’exécute dans un processus secondaire et quelles méthodes démarrent au lancement du Brain.
Nous allons à présent voir toutes les configurations possibles de ce décorateur et les possibilités qu’il offre.
One-Shot
Pour toutes les tâches qui n’ont besoin d’être exécutées qu’une seule fois, on va décorer la méthode de sorte à créer ce qu’on appelle une “one_shot_task”.
@Brain.task(process=[True / False], run_on_start=[True / False])
async def methode_one_shot(self):
pass
Routine
Pour toutes les tâches qui s’exécutent à l’infini, il est possible de préciser à notre tâche, via le décorateur, un refresh_rate. Ce paramètre correspond à la fréquence d’exécution de la méthode. Elle sera alors appelée à l’infini (même si elle plante) avec une pause de la durée du refresh_rate renseigné.
@Brain.task(process=[True / False], run_on_start=[True / False], refresh_rate=0.5)
async def methode_routine(self):
pass
Ici, cette méthode sera donc exécutée à l’infini avec une pause de 0.5s entre chaque exécution.
Timeout et Task
Il est possible d’ajouter à notre task (routine ou one_shot) un timeout au bout duquel la tâche sera interrompue. Cela est utile notamment lorsqu’on définit des phases précises d'exécution.
Cette fonctionnalité est applicable aux routines et aux one_shot !
# Routine timée
@Brain.task(process=[True / False], run_on_start=[True / False], refresh_rate=[durée en seconde], timeout=10)
async def methode_timed_routine(self):
pass
# One_shot timée
@Brain.task(process=[True / False], run_on_start=[True / False], timeout=10)
async def methode_timed_one_shot(self):
pass
Ici, ces deux méthodes s’interrompront quoi qu’il arrive au bout de 10 secondes.
Gestion des outputs
Les méthodes, une fois exécutées, retournent un code d’exécution afin d’indiquer comment la tâche s’est terminée. Voici les états possibles :
class ExecutionStates(IntEnum):
CORRECTLY = 0 # Exécution normale: pas de timeout ni de crash
TIMEOUT = 1 # La task s'est interrompue car elle a dépassé le timeout
ERROR_OCCURRED = 2 # La task s'est interrompue car une erreur est survenue (crash de la fonction)
Multiprocessing
Il est possible d'exécuter une task (routine ou one_shot) dans un autre processus afin de mieux répartir la charge CPU. Cette fonctionnalité est particulièrement utile pour les tâches gourmandes en ressources, qui pourraient autrement bloquer excessivement le temps CPU du processus principal. La principale difficulté du multiprocessing réside dans la communication d'objets Python entre processus. Dans le cadre du Brain, cette communication est entièrement transparente. Lorsqu'un processus est lancé, une copie des attributs du Brain est créée et partagée entre tous les processus. Lorsque l'un de ses attributs est modifié (que ce soit main_process → second_process ou second_process → main_process), le Brain se charge automatiquement de synchroniser cette modification de la copie vers l'instance initiale. Cette copie partagée est un dictionnaire proxy, un type issu de la classe Manager de la librairie multiprocessing.
Limitation de la communication inter-process
La principale restriction quant à l’utilisation de cette fonctionnalité est le type des attributs de la classe pouvant être partagés au travers du dictionnaire proxy. En effet, il faut que l’attribut soit sérialisable ! Les types sérialisables supportés pour le moment sont :
serialized_types = (
Logger, # Logger from loggerplusplus library is serialized since V0.1.2
int,
float,
str,
list,
set,
dict,
tuple,
type(None),
)
Il est donc compliqué de passer en attribut partagé un objet complexe à utiliser dans un autre processus. Pour contourner ce problème, il est possible d’instancier directement dans le processus l’objet en question. Prenons l’exemple de l’utilisation d’une caméra. Son utilisation est gourmande en ressources, donc idéale pour du multiprocessing. Le problème est que l’objet caméra n’est pas sérialisable ! On va donc récupérer les éléments de configuration de celle-ci via un attribut, puis l’instancier directement dans le processus.
@Brain.task(process=True, run_on_start=[True / False])
def camera_in_other_process(self):
camera = Camera(
res_w=self.config.CAMERA_RESOLUTION[0],
res_h=self.config.CAMERA_RESOLUTION[1],
captures_path=self.config.CAMERA_SAVE_PATH,
undistorted_coefficients_path=self.config.CAMERA_COEFFICIENTS_PATH,
)
Attention un process sera synchrone ! Pensez à mettre
defet nonasync def!
On remarque que la configuration est directement accessible via self (qui accède en réalité à la copie partagée du Brain). Une fois instanciée, nous utiliserons notre caméra pour capturer des images et y appliquer un traitement. Cependant, cela pose un nouveau problème : le traitement doit s'exécuter en continu, nécessitant donc la création d'une routine. Or, il n'est pas possible de créer une routine à l'intérieur d'une tâche, surtout si celle-ci est exécutée dans un processus séparé. Pour répondre à ce besoin, une option appelée define_loop_later est disponible. Elle permet de définir une tâche en tant que routine, tout en ayant une partie qui s'exécute une seule fois (comme la création de l'objet caméra).
@Brain.task(process=True, run_on_start=[True / False], refresh_rate=0.1, define_loop_later=True)
def camera_in_other_process(self):
camera = Camera(
res_w=self.config.CAMERA_RESOLUTION[0],
res_h=self.config.CAMERA_RESOLUTION[1],
captures_path=self.config.CAMERA_SAVE_PATH,
undistorted_coefficients_path=self.config.CAMERA_COEFFICIENTS_PATH,
)
# ---Loop--- #
camera.capture()
# ... traitement d'image ... #
Il faut penser à préciser notre
refresh_ratecar notre task est ici une routine ! (bien qu’elle ait une partie qui ne s’exécute qu’une seule fois) → On peut évidemment profiter de l’exécution hors du process principal pour diminuer fortement lerefresh_rateafin d’avoir une routine qui s’exécute à haute fréquence.
Ici, on instancie notre caméra, puis on l’utilise pour prendre des photos et leur appliquer un traitement. Ce qui sépare la partie one_shot de la routine est le commentaire # ---Loop--- #. En réalité, ce code très simple et léger d’utilisation revient à faire ceci :
@Brain.task(process=False, run_on_start=False)
async def one_shot_part(self):
return Camera(
res_w=self.config.CAMERA_RESOLUTION[0],
res_h=self.config.CAMERA_RESOLUTION[1],
captures_path=self.config.CAMERA_SAVE_PATH,
undistorted_coefficients_path=self.config.CAMERA_COEFFICIENTS_PATH,
)
@Brain.task(process=False, run_on_start=False, refresh_rate=0.1)
async def routine_part(self, camera):
camera.capture()
# ... traitement d'image ... #
@Brain.task(process=True, run_on_start=[True / False])
def camera_in_other_process(self):
camera = asyncio.run(self.one_shot_part())
asyncio.run(self.routine_part())
Il est également possible de définir le marker de la routine soit même :
@Brain.task(process=True, run_on_start=[True / False], refresh_rate=0.1, define_loop_later=True, start_loop_marker="#- My Custom Loop Marker -#")
def camera_in_other_process(self):
camera = Camera(
res_w=self.config.CAMERA_RESOLUTION[0],
res_h=self.config.CAMERA_RESOLUTION[1],
captures_path=self.config.CAMERA_SAVE_PATH,
undistorted_coefficients_path=self.config.CAMERA_COEFFICIENTS_PATH,
)
#- My Custom Loop Marker -#
camera.capture()
# ... traitement d'image ... #
Points de vigilances, limitations et précisions
Bien que l’utilisation du Brain soit pratique, certains points sont à surveiller pour en tirer son plein potentiel.
Dynamic init
Création automatique des attributs
Afin d’alléger le code de l’__init__qui consiste essentiellement à faire ça:
def __init__(
self,
logger: Logger,
obj1: type_obj1,
obj2: type_obj2,
obj3: type_obj3,
) -> None:
self.logger = logger
self.obj1 = obj1
self.obj2 = obj2
self.obj3 = obj3
...
L’__init__ est rendu dynamique: il le fait automatiquement, il suffit donc d’écrire:
def __init__(
self,
logger: Logger,
obj1: type_obj1,
obj2: type_obj2,
obj3: type_obj3,
) -> None:
super().__init__(logger, self)
Création d’attributs de classe
Si l’on veut créer des attributs de classe dans l’__init__ et que l’on souhaite qu’ils soient partagés entre les process, il faut les définir AVANT super().__init__(logger, self) . Dans le cas contraire ils seront disponibles uniquement dans le main-process.
def __init__(
self,
logger: Logger,
obj1: type_obj1,
obj2: type_obj2,
obj3: type_obj3,
) -> None:
# Attributs disponibles dans tous les process
self.attr_multi_process = 0
super().__init__(logger, self)
# Attributs disponibles uniquement dans le main-process
self.attr_main_process = 0
Sérialisation des attributs
Lors de l’appel de l’__init__, le Brain se charge également de sérialiser automatiquement tous les attributs de classe. Cependant, la majorité des objets que nous manipulons ne sont pas sérialisables. Un warning sera alors affiché par le logger pour tout attribut non sérialisable. Ce n’est pas une erreur, juste un avertissement. Tout attribut non sérialisé sera évidemment indisponible dans d’autres processus. Exemple de warning :
14:49:30 -> [ brain ] WARNING | [dynamic_init] cannot serialize attribute [ws_cmd].
14:49:30 -> [ brain ] WARNING | [dynamic_init] cannot serialize attribute [ws_pami].
14:49:30 -> [ brain ] WARNING | [dynamic_init] cannot serialize attribute [ws_lidar].
14:49:30 -> [ brain ] WARNING | [dynamic_init] cannot serialize attribute [ws_odometer].
14:49:30 -> [ brain ] WARNING | [dynamic_init] cannot serialize attribute [ws_camera].
Refresh_Rate limitations
L'exécution des tâches repose sur de l'exécution asynchrone, ce qui signifie qu'il s'agit de pseudo-parallélisme. Il est crucial de garder à l'esprit qu'une routine avec un refresh_rate très faible va monopoliser le temps CPU disponible et, dans certains cas, ralentir l'exécution globale du Brain. Il est donc interdit de mettre un refresh_rate à 0 ! Ce paramètre doit être réglé avec attention.
Communication inter-process limitations
Comme expliqué précédemment, la synchronisation entre le Brain partagé et son instance s'effectue via une routine qui s'exécute à très haute fréquence afin de minimiser la latence de communication. Par défaut, son refresh_rate est fixé à 0,01 seconde. Bien que la méthode soit optimisée pour réduire au maximum sa durée d'exécution, ce n'est pas instantané ! Il est donc important de prendre en compte ce facteur lorsqu'on décide de passer un traitement dans un autre processus.
Exemple complet d’utilisation
Voici un exemple complet d'utilisation de votre module Brain avec une explication de son utilisation dans un script principal.
import asyncio
from taskbrain import Brain
from loggerplusplus import Logger
class MainBrain(Brain):
def __init__(self, logger: Logger, share_attr1: int, share_attr2: int) -> None:
super().__init__(logger, self)
self.local_attr1: int = 0
self.local_attr2: int = 0
"""
MainProcess (mp) Tasks
"""
""" One-Shot Tasks """
@Brain.task(process=False, run_on_start=True)
async def mp_start(self):
self.logger.info("[MP] MainBrain started")
public_attributes = {k: v for k, v in self.__dict__.items() if not k.startswith('_')}
self.logger.info(f"[MP] Public attributes: {public_attributes}")
""" Routine Tasks """
@Brain.task(process=False, run_on_start=True, refresh_rate=1)
async def mp_states_display(self):
attributes_public = {k: v for k, v in self.__dict__.items() if
not k.startswith('_') and k.__str__() != "logger"}
self.logger.info(f"[MP] Attributes states: {attributes_public}")
@Brain.task(process=False, run_on_start=True, refresh_rate=1)
async def mp_incrementer(self):
self.share_attr1 += 1
self.local_attr1 += 1
@Brain.task(process=False, run_on_start=True, refresh_rate=1, timeout=5)
async def mp_incrementer_with_timeout(self):
self.share_attr1 += 10
self.local_attr1 += 10
"""
SubProcess (sb) Tasks
"""
""" One-Shot Tasks """
@Brain.task(process=True, run_on_start=True)
def sb_start(self):
self.logger.info("[SP] MainBrain started in another process")
shared_attributes = {
"share_attr1": self.share_attr1,
"share_attr2": self.share_attr2
}
self.logger.info(f"[SP] Public attributes available in this subprocess: {shared_attributes}")
""" Routine Tasks """
@Brain.task(process=True, run_on_start=True, refresh_rate=1)
def sp_states_display(self):
shared_attributes = {
"share_attr1": self.share_attr1,
"share_attr2": self.share_attr2
}
self.logger.info(f"[SP] Attributes states: {shared_attributes}")
@Brain.task(process=True, run_on_start=True, refresh_rate=1)
def sb_incrementer(self):
self.share_attr2 += 1
@Brain.task(process=True, run_on_start=True, refresh_rate=1, timeout=5)
def sb_incrementer_with_timeout(self):
self.share_attr2 += 10
@Brain.task(process=True, run_on_start=True, refresh_rate=1, define_loop_later=True,
start_loop_marker="# ---Loop--- #")
def sb_routine_with_setup(self):
sb_non_serializable_attribute = "I'm not serializable attribute"
# ---Loop--- #
self.logger.info(f"[SP] Non-serializable attribute: {sb_non_serializable_attribute}")
""" Call others tasks """
@Brain.task(process=False, run_on_start=False)
async def callable_function_1(self):
self.logger.info("[MP] Callable function 1")
return 1
@Brain.task(process=True, run_on_start=False)
def callable_function_2(self):
self.logger.info("[SP] Callable function 2")
return 2
@Brain.task(process=False, run_on_start=True)
async def call_tasks(self):
await asyncio.sleep(10) # Wait timed task to finish
self.logger.info("[MP] Call tasks")
f1_result = await self.callable_function_1()
f2_result = await self.callable_function_2()
self.logger.info(f"[MP] Callable function 1 result: {f1_result.result}")
self.logger.info(f"[MP] Callable function 2 result: {f2_result.result}")
Utilisation dans un Main
Voici comment vous pouvez intégrer et démarrer votre Brain dans un script principal :
import asyncio
from exemple.mainbrain import MainBrain
from loggerplusplus import Logger
if __name__ == "__main__":
brain_logger = Logger(
identifier="Brain",
print_log=True,
write_to_file=False,
display_monitoring=False,
files_monitoring=False,
)
brain = MainBrain(
logger=brain_logger,
share_attr1=0,
share_attr2=0
)
# Start tasks
async def run_tasks():
tasks = [task() for task in brain.get_tasks()]
return await asyncio.gather(*tasks)
asyncio.run(run_tasks())
Explication du Main
- Initialisation du Logger : On crée un logger avec un niveau de débogage qui affiche les logs dans la console (
print_log=True). - Initialisation du Brain : On initialise le
MainBrainavec deux attributs partagés (share_attr1etshare_attr2) et le logger. - Exécution des Tâches : On récupère toutes les tâches du Brain via
brain.get_tasks()et on les exécute en les regroupant avecasyncio.gather(). Ce script illustre la manière dont vous pouvez initialiser et exécuter les différentes tâches de votre Brain, y compris les tâches asynchrones, les routines, et le multiprocessing.
Voici une suggestion pour une signature élégante à la fin de votre README :
Auteur
Projet créé et maintenu par Florian BARRE.
Pour toute question ou contribution, n'hésitez pas à me contacter.
Mon Site | Mon LinkedIn | Mon GitHub
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file taskbrain-0.1.0.tar.gz.
File metadata
- Download URL: taskbrain-0.1.0.tar.gz
- Upload date:
- Size: 29.0 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.4
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
c590180ff938e10577c842a2d95326df804326f9223e85a20794795a643a7a23
|
|
| MD5 |
49fd851d2f32e14620ce109ecb64acb9
|
|
| BLAKE2b-256 |
f8e111c9d1c0bfa396a6eb782e6fa881b9df4cebd511d01f6713d7ca3d1ef372
|
File details
Details for the file taskbrain-0.1.0-py3-none-any.whl.
File metadata
- Download URL: taskbrain-0.1.0-py3-none-any.whl
- Upload date:
- Size: 25.9 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.4
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
30a1105fb85ebd08f2adcdeaf066a52ecfb85349c3176531ffb5bf203caa052c
|
|
| MD5 |
db772ba9e0b01955869c950dd8e5e583
|
|
| BLAKE2b-256 |
a41b19277095f19063ab99b7bb46cc69a9699c3f82d1afa0a403f71ae92f1419
|