Skip to main content

Prediction of the comestibility of a micro-organism from its DNA sequence

Project description

NutriCheck

Description

NutriCheck est un pipeline conçu pour évaluer la comestibilité d'une bactérie à partir de son génome annoté. Il s'appuie sur des analyses de toxicité potentielle, de valeur nutritionnelle et de digestibilité. Le pipeline compare les résultats obtenus à un ensemble de données d'entraînement comprenant :

  • 11 témoins positifs (bactéries présentes dans notre alimentation).
  • 9 témoins négatifs (bactéries pathogènes).

Le pipeline utilise Snakemake et nécessite en entrée une séquence d'ADN au format FASTA.


Fonctionnement

Étapes principales

  1. Annotation génomique avec PGAP

    • L'utilisateur fournit une séquence d'ADN au format FASTA et le nom de l'organisme.
    • Le pipeline génère une annotation génomique complète via le NCBI Prokaryotic Genome Annotation Pipeline (PGAP).
    • Le fichier résultant, annot_cds_from_genomic.fna, contient les régions codantes annotées nécessaires pour les analyses suivantes.
  2. Analyse de la toxicité avec GeNomad

    • Le script traite le fichier FASTA annoté pour en simplifier les en-têtes et générer un fichier FASTA formaté.
    • GeNomad est ensuite exécuté pour détecter les éléments génétiques mobiles (plasmides, virus).
    • Résultats principaux :
      • Si des éléments génétiques mobiles sont détectés, l'organisme est considéré comme potentiellement non comestible.
      • Si aucun élément mobile n'est détecté, l'organisme est potentiellement comestible.
  3. Recherche de gènes de résistance avec AMRFinder

    • AMRFinder identifie les gènes de résistance aux antibiotiques.
    • Les résultats sont enregistrés dans output_amrfinder.txt et interprétés pour déterminer la présence de gènes toxiques.
  4. Analyse phagique avec VirSorter

    • VirSorter analyse le fichier FASTA pour identifier des séquences phagiques ou des prophages potentiellement présents.
    • La présence de phages indique que la bactérie n'est pas comestible, ce qui constitue un critère crucial dans l'évaluation de la sécurité alimentaire.
  5. Analyse de la nutritivité par calcul du CAI

  6. Analyse de la digestibilité par calcul du taux de GC


Utilisation

Prérequis

Installez Snakemake via la documentation : https://snakemake.readthedocs.io/en/stable/getting_started/installation.html

Commandes

  1. Lancer le pipeline Positionnez-vous dans le répertoire contenant le fichier Snakefile et exécutez :

    snakemake
    
  2. Entrées nécessaires

    • Un fichier FASTA contenant la séquence d'ADN.
    • Le nom de l'organisme associé à la séquence.
  3. Résultats principaux Les résultats finaux incluent :

    • Un tableau synthétisant les informations obtenues pour chaque génome analysé. Ce tableau inclut les colonnes suivantes :

ID : Identifiant du génome analysé.

Nombre de plasmides : Nombre de plasmides détectés dans le génome.

Nombre de virus : Nombre de virus/phages identifiés.

AMR : Indication de la présence ou absence de gènes de résistance aux antibiotiques (Antimicrobial Resistance, AMR).

Taux purine : Proportion des bases purines (A et G) dans le génome.

Distance par rapport à l'oeuf : Une métrique de distance calculée par rapport à un génome de référence spécifique, celui de l'œuf.

  • Évaluation de la comestibilité.
  • Sorties détaillées des outils (fichiers d'analyse et rapports).

Auteurs

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

nutricheck-0.1.5.tar.gz (99.3 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

nutricheck-0.1.5-py2.py3-none-any.whl (15.0 kB view details)

Uploaded Python 2Python 3

File details

Details for the file nutricheck-0.1.5.tar.gz.

File metadata

  • Download URL: nutricheck-0.1.5.tar.gz
  • Upload date:
  • Size: 99.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: uv/0.5.4

File hashes

Hashes for nutricheck-0.1.5.tar.gz
Algorithm Hash digest
SHA256 5bc217037a201433998ab74acd1fd9eab20fab9b9a28c9ed270898af242fe2c5
MD5 2f4858c237aec9072b79d3823ff09031
BLAKE2b-256 7fa8a1b79e73fc0aff351e1f82d0ea3d6fe50f48e195ac4a68256fcb7e72e0b2

See more details on using hashes here.

File details

Details for the file nutricheck-0.1.5-py2.py3-none-any.whl.

File metadata

File hashes

Hashes for nutricheck-0.1.5-py2.py3-none-any.whl
Algorithm Hash digest
SHA256 0d5e2b912a5f4940e51a5cb09f2a14f68c9d5cf759e769e0a43404ef8491dcf3
MD5 35ac29a55bb0331dc66fb2bbc26739f5
BLAKE2b-256 e8465a2583e8c317241d391be666f529535d44e65f14b688adf256f19ede0b68

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page