Ce projet a pour but la manipulation et l'analyse de données de protéines issues de la base de données Uniprot via l'implémentation de classes Python.

These details have not been verified by PyPI

Project links

Project description

Mini projet protéomique

Ce projet a pour but la manipulation et l'analyse de données de protéines issues de la base de données Uniprot via l'implémentation de classes Python.

Classe Uniprot

La classe Uniprot est destinée à représenter une protéine unique avec ses données principales extraites d'un fichier Uniprot au format texte.

Constructeur

init(contenu_fichier: str) Parse le contenu textuel d'une fiche Uniprot. Extrait et stocke les informations suivantes sous forme d'attributs :

id (str) : Identifiant Uniprot de la protéine.
ac (str) : Numéro AC de la protéine.
org (str) : Organisme associé à la protéine.
gene (str) : Nom du gène de la protéine.
seq (str) : Séquence peptidique de la protéine.
go (list) : Liste d'identifiants GO associés à la protéine.

Méthodes

fasta_dump() Exporte la séquence de la protéine au format FASTA dans un fichier nommé [AC].fasta. La ligne de commentaires commence par > et inclut : l'identification, l'organisme et le nom du gène.

molecular_weight() -> float Calcule et retourne le poids moléculaire de la protéine en Daltons.

average_hydrophobicity() -> float Calcule et retourne l'hydrophobicité moyenne de la séquence de la protéine en utilisant une échelle standardisée.

occurence_prot() -> dict Calcule la fréquence relative des acides aminés dans la séquence de la protéine. Retourne un dictionnaire où chaque clé est un acide aminé et la valeur associée est la fréquence relative de cet acide aminé.

Classe Collection

La classe Collection représente un ensemble d'objets Uniprot et fournit des outils pour manipuler, trier et analyser ces objets.

Constructeur

init() Initialise une collection vide.

Méthodes

load_collection(fichier_in: str) Charge une collection à partir d'un fichier contenant plusieurs fiches Uniprot séparées par //.

add(contenu_uniprot: str) Crée un objet Uniprot à partir du contenu textuel fourni et l'ajoute à la collection. Lève une exception si la protéine est déjà présente.

remove(uniprot_id: str) Supprime l'objet Uniprot correspondant à l'identifiant donné. Lève une exception si l'identifiant est introuvable.

sort_by_length(reverse=False) Trie les objets Uniprot dans la collection par la longueur de leur séquence.

filter_for_hydrophobic(min_hydro: float) Retourne une liste des protéines ayant une hydrophobicité moyenne supérieure à min_hydro. Ces protéines sont retournées dans un dictionnaire qui permet de pallier aux capacités limitées d'une liste.

Le filtrage expert n'a pas été codé.

add(other: Collection) -> Collection Fusionne deux collections en créant une nouvelle instance sans doublons.

go_view() -> dict Retourne un dictionnaire comptant les occurrences des mots-clés GO dans la collection.

collX() -> dict Calcule et retourne les occurrences globales de chaque acide aminé dans la collection.

draw_ABRL(uniprot_id: str) Génère et sauvegarde un histogramme représentant le log-ratio des occurrences d'acides aminés pour une protéine spécifique par rapport à leur occurrence moyenne dans la collection. Sauvegarde le fichier sous le nom <uniprot_id>.png.

Exemples d'utilisation

1. Manipulation d'une protéine individuelle avec la classe `Uniprot`

Charger une protéine à partir d'une fiche Uniprot

Voici un exemple d'utilisation des principales méthodes de la classe Uniprot :

# Charger une fiche Uniprot à partir d'un fichier
protein = Uniprot(open("data/P05067.txt", 'r').read())

# Affichage des informations principales
print("ID:", protein.id)                   # Affiche l'identifiant Uniprot
print("AC:", protein.ac)                   # Affiche le numéro AC
print("Organisme:", protein.org)           # Affiche l'organisme associé
print("Gene:", protein.gene)               # Affiche le gène correspondant
print("Séquence:", protein.seq)            # Affiche la séquence peptidique complète
print("GO:", protein.go)                   # Affiche les identifiants GO associés

# Exporter au format FASTA
protein.fasta_dump()
print("La séquence a été exportée au format FASTA.")

# Calcul du poids moléculaire
molecular_weight = protein.molecular_weight()
print(f"Le poids moléculaire de la protéine est de : {molecular_weight:.2f} Da")

# Calcul de l'hydrophobicité moyenne
average_hydrophobicity = protein.average_hydrophobicity()
print(f"L'hydrophobicité moyenne de la protéine est de : {average_hydrophobicity:.2f}")

# Fréquence relative des acides aminés
occurrences = protein.occurence_prot()
print("Occurrences des acides aminés :")
for aa, freq in occurrences.items():
    print(f"  {aa}: {freq:.4f}")

2. Manipulation d'une collection de protéines avec la classe `Collection`

Charger, ajouter, afficher et supprimer des protéines

from uniprot_collection import Collection 

# Charger la collection à partir d'un fichier
collection = Collection.load_collection("data/five_proteins.txt")

# Exemple de texte Uniprot pour ajouter une nouvelle protéine
uniprot_text = """ID   NEW_PROTEIN_HUMAN           Reviewed;        500 AA.
AC   P12345; Q67890;
DE   RecName: Full=New Protein; Short=NewP;
GN   Name=NewGene;
OS   Homo sapiens (Human).
SQ   SEQUENCE: 500 AA.
   MSKVEALQKSS..."""  # Exemple de texte Uniprot

# Créer une collection et ajouter des fiches Uniprots
collection = Collection()

# Ajouter l'objet Uniprot à la collection
collection.add(uniprot_text)

# Afficher le contenu de la collection
collection.display()

# Supprimer un Uniprot par son ID
collection.remove("NEW_PROTEIN_HUMAN")

# Afficher à nouveau après suppression
collection.display()

# Afficher le contenu initial de la collection
print("=== Contenu initial de la collection ===")
collection.display()

# Tester la méthode sort_by_length
print("\n=== Test de la méthode sort_by_length ===")
sorted_uniprots = collection.sort_by_length()
print("Proteines triées par longueur (croissante) :")
for uniprot in sorted_uniprots:
    print(f"ID: {uniprot.id}, Longueur: {len(uniprot.seq)} AA")

# Tester la méthode filter_for_hydrophobic avec min_hydro=0.4
print("\n=== Test de filter_for_hydrophobic avec retour en dictionnaire ===")
filtered_dict = collection.filter_for_hydrophobic_dict(0.4)
print(f"Protéines filtrées (dictionnaire) : {len(filtered_dict)} trouvées")
for uniprot_id, uniprot in filtered_dict.items():
    print(f"ID: {uniprot_id}, Hydrophobicité moyenne: {uniprot.average_hydrophobicity()}")

# Créer deux collections
collection_1 = Collection()
collection_2 = Collection()

# Ajouter des objets Uniprot fictifs
uniprot_1 = """ID   PROTEIN1_HUMAN           Reviewed;        300 AA.
AC   P12345;
OS   Homo sapiens (Human).
SQ   SEQUENCE: 300 AA.
   MSKVEALQKSS..."""
uniprot_2 = """ID   PROTEIN2_HUMAN           Reviewed;        400 AA.
AC   P67890;
OS   Homo sapiens (Human).
SQ   SEQUENCE: 400 AA.
   MSKVEALQKSS..."""
uniprot_3 = """ID   PROTEIN3_HUMAN           Reviewed;        500 AA.
AC   Q12345;
OS   Homo sapiens (Human).
SQ   SEQUENCE: 500 AA.
   MSKVEALQKSS..."""

# Ajouter les objets à leurs collections respectives
collection_1.add(uniprot_1)
collection_1.add(uniprot_2)

collection_2.add(uniprot_2)  # Doublon
collection_2.add(uniprot_3)

# Fusionner les collections
merged_collection = collection_1 + collection_2

# Afficher la collection fusionnée
print("=== Collection Fusionnée ===")
merged_collection.display()

# Analyser les termes GO dans la collection
print(collection.go_view())

# Calculer les occurrences globales des acides aminés
print(collection.collX())

# Tracer un histogramme des log-ratios pour une protéine spécifique
log_ratios = collection.draw_ABRL("SPRC_BOVIN")
print(log_ratios)

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.1.7

Nov 29, 2024

This version

0.1.6

Nov 29, 2024

0.1.5

Nov 28, 2024

0.1.4

Nov 28, 2024

0.1.3

Nov 27, 2024

0.1.2

Nov 27, 2024

0.1.1

Nov 27, 2024

0.1.0

Nov 26, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

uniproj_2024-0.1.6.tar.gz (10.6 kB view details)

Uploaded Nov 29, 2024 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

uniproj_2024-0.1.6-py3-none-any.whl (9.4 kB view details)

Uploaded Nov 29, 2024 Python 3

File details

Details for the file uniproj_2024-0.1.6.tar.gz.

File metadata

Download URL: uniproj_2024-0.1.6.tar.gz
Upload date: Nov 29, 2024
Size: 10.6 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: uv/0.5.4

File hashes

Hashes for uniproj_2024-0.1.6.tar.gz
Algorithm	Hash digest
SHA256	`c18254bf6fcd5d22e9453d1241644ab044e74fb71e14aae847c28e2baca1e2ea`
MD5	`72cbfbe58ebcad4170db03d538910ad4`
BLAKE2b-256	`d01450f54348a3a68576320c96850625c09513a5624eec4a59c9e05d8ff79220`

See more details on using hashes here.

File details

Details for the file uniproj_2024-0.1.6-py3-none-any.whl.

File metadata

Download URL: uniproj_2024-0.1.6-py3-none-any.whl
Upload date: Nov 29, 2024
Size: 9.4 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: uv/0.5.4

File hashes

Hashes for uniproj_2024-0.1.6-py3-none-any.whl
Algorithm	Hash digest
SHA256	`905a3417a7a8d3278201eb2245b1207e4cce62d4e9681a617b81a9a341394e3d`
MD5	`71693381abf01a600afe9e85d1bef786`
BLAKE2b-256	`ae5ffe5d3a143808c5f1dd4848bc0d1f05bdc1e089fb5d0a44a2cc50577a246d`

See more details on using hashes here.

uniproj_2024 0.1.6

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Project description

Mini projet protéomique

Classe Uniprot

Constructeur

Méthodes

Classe Collection

Constructeur

Méthodes

Exemples d'utilisation

1. Manipulation d'une protéine individuelle avec la classe `Uniprot`

Charger une protéine à partir d'une fiche Uniprot

2. Manipulation d'une collection de protéines avec la classe `Collection`

Charger, ajouter, afficher et supprimer des protéines

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

uniproj_2024 0.1.6

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Project description

Mini projet protéomique

Classe Uniprot

Constructeur

Méthodes

Classe Collection

Constructeur

Méthodes

Exemples d'utilisation

1. Manipulation d'une protéine individuelle avec la classe Uniprot

Charger une protéine à partir d'une fiche Uniprot

2. Manipulation d'une collection de protéines avec la classe Collection

Charger, ajouter, afficher et supprimer des protéines

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

1. Manipulation d'une protéine individuelle avec la classe `Uniprot`

2. Manipulation d'une collection de protéines avec la classe `Collection`