Prediction of the comestibility of a micro-organism from its DNA sequence
Project description
NutriCheck
Description
NutriCheck est un pipeline conçu pour évaluer la comestibilité d'une bactérie à partir de son génome annoté. Il s'appuie sur des analyses de toxicité potentielle, de valeur nutritionnelle et de digestibilité. Le pipeline compare les résultats obtenus à un ensemble de données d'entraînement comprenant :
- 11 témoins positifs (bactéries présentes dans notre alimentation).
- 9 témoins négatifs (bactéries pathogènes).
Le pipeline utilise Snakemake et nécessite en entrée une séquence d'ADN au format FASTA.
Fonctionnement
Étapes principales
-
Annotation génomique avec PGAP
- L'utilisateur fournit une séquence d'ADN au format FASTA et le nom de l'organisme.
- Le pipeline génère une annotation génomique complète via le NCBI Prokaryotic Genome Annotation Pipeline (PGAP).
- Le fichier résultant,
annot_cds_from_genomic.fna, contient les régions codantes annotées nécessaires pour les analyses suivantes.
-
Analyse de la toxicité avec GeNomad
- Le script traite le fichier FASTA annoté pour en simplifier les en-têtes et générer un fichier FASTA formaté.
- GeNomad est ensuite exécuté pour détecter les éléments génétiques mobiles (plasmides, virus).
- Résultats principaux :
- Si des éléments génétiques mobiles sont détectés, l'organisme est considéré comme potentiellement non comestible.
- Si aucun élément mobile n'est détecté, l'organisme est potentiellement comestible.
-
Recherche de gènes de résistance avec AMRFinder
- AMRFinder identifie les gènes de résistance aux antibiotiques.
- Les résultats sont enregistrés dans
output_amrfinder.txtet interprétés pour déterminer la présence de gènes toxiques.
-
Analyse phagique avec VirSorter
- VirSorter analyse le fichier FASTA pour identifier des séquences phagiques ou des prophages potentiellement présents.
- La présence de phages indique que la bactérie n'est pas comestible, ce qui constitue un critère crucial dans l'évaluation de la sécurité alimentaire.
-
Analyse de la nutritivité par calcul du CAI
-
Analyse de la digestibilité par calcul du taux de GC
Utilisation
Prérequis
Installez Snakemake via la documentation : https://snakemake.readthedocs.io/en/stable/getting_started/installation.html
Commandes
-
Lancer le pipeline Positionnez-vous dans le répertoire contenant le fichier
Snakefileet exécutez :snakemake
-
Entrées nécessaires
- Un fichier FASTA contenant la séquence d'ADN.
- Le nom de l'organisme associé à la séquence.
-
Résultats principaux Les résultats finaux incluent :
- Un tableau synthétisant les informations obtenues pour chaque génome analysé. Ce tableau inclut les colonnes suivantes :
ID : Identifiant du génome analysé.
Nombre de plasmides : Nombre de plasmides détectés dans le génome.
Nombre de virus : Nombre de virus/phages identifiés.
AMR : Indication de la présence ou absence de gènes de résistance aux antibiotiques (Antimicrobial Resistance, AMR).
Taux purine : Proportion des bases purines (A et G) dans le génome.
Distance par rapport à l'oeuf : Une métrique de distance calculée par rapport à un génome de référence spécifique, celui de l'œuf.
- Évaluation de la comestibilité.
- Sorties détaillées des outils (fichiers d'analyse et rapports).
Auteurs
- Développé par : Thomas GAGNIEU, Mathieu GUIGARD, Thibaud GUIRAMAND, Kessen POITOU
- Contact : thomas.gagnieu@etu.univ-lyon1.fr, mathieu.guigard@etu.univ-lyon1.fr, thibaud.guiramand@etu.univ-lyon1.fr, kessen.poitou@etu.univ-lyon1.fr
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file nutricheck-0.1.5.tar.gz.
File metadata
- Download URL: nutricheck-0.1.5.tar.gz
- Upload date:
- Size: 99.3 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.5.4
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
5bc217037a201433998ab74acd1fd9eab20fab9b9a28c9ed270898af242fe2c5
|
|
| MD5 |
2f4858c237aec9072b79d3823ff09031
|
|
| BLAKE2b-256 |
7fa8a1b79e73fc0aff351e1f82d0ea3d6fe50f48e195ac4a68256fcb7e72e0b2
|
File details
Details for the file nutricheck-0.1.5-py2.py3-none-any.whl.
File metadata
- Download URL: nutricheck-0.1.5-py2.py3-none-any.whl
- Upload date:
- Size: 15.0 kB
- Tags: Python 2, Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: uv/0.5.4
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
0d5e2b912a5f4940e51a5cb09f2a14f68c9d5cf759e769e0a43404ef8491dcf3
|
|
| MD5 |
35ac29a55bb0331dc66fb2bbc26739f5
|
|
| BLAKE2b-256 |
e8465a2583e8c317241d391be666f529535d44e65f14b688adf256f19ede0b68
|