Skip to main content

Clustal Omega Multiple Sequence Alignment - Biyoinformatik Final Projesi

Project description

KadirMSA

Clustal Omega Multiple Sequence Alignment (MSA) — Python Implementasyonu

Biyoinformatik dersi (BLG483) final projesi.
İstanbul Rumeli Üniversitesi, Bilgisayar Mühendisliği.


Kurulum

pip install KadirMSA

Hızlı Kullanım

from kadirmsa import ClustalOmega

# Dizileri tanımla
sequences = ["ATCGATCG", "ATCGTTCG", "TTCGATCG"]
names     = ["Alpha", "Beta", "Gamma"]

# Hizala
co = ClustalOmega(sequences, names)
result = co.align(verbose=True)

# Sonucu yazdır
co.print_result()

# FASTA formatında kaydet
co.save_fasta("output.fasta")

# Guide tree (Newick formatı)
print(co.get_newick())

# Özet istatistikler
print(co.summary())

Algoritma

Clustal Omega üç ana adımdan oluşur:

Adım 1 — Pairwise Distance (İkili Uzaklık)

Her dizi çifti arasındaki uzaklık Needleman-Wunsch algoritmasıyla hesaplanır.

     Alpha  Beta   Gamma
Alpha 0.000  0.125  0.250
Beta  0.125  0.000  0.250
Gamma 0.250  0.250  0.000

Adım 2 — Guide Tree (Rehber Ağaç)

Uzaklık matrisinden UPGMA algoritmasıyla filogenetik ağaç oluşturulur.
Bu ağaç, hangi dizilerin önce hizalanacağını belirler.

((Alpha:0.0625,Beta:0.0625):0.125,Gamma:0.25)

Adım 3 — Progressive Alignment (Aşamalı Hizalama)

Guide tree'ye göre diziler sırayla hizalanır:

  1. En benzer iki dizi önce hizalanır
  2. Oluşan "profil" bir sonraki dizi ile hizalanır
  3. Tüm diziler dahil olana kadar tekrar edilir
Alpha : A T C G A T C G
Beta  : A T C G T T C G
Gamma : T T C G A T C G

API Referansı

ClustalOmega(sequences, names=None)

Parametre Tip Açıklama
sequences list[str] Hizalanacak dizi listesi
names list[str] Dizi isimleri (isteğe bağlı)

Metodlar

Metod Açıklama
align(verbose=False) Hizalamayı çalıştırır, {isim: dizi} döndürür
print_result() Sonucu ekrana yazdırır
print_tree() Guide tree'yi ASCII olarak gösterir
get_newick() Guide tree'yi Newick formatında döndürür
get_distance_matrix() Pairwise uzaklık matrisini döndürür
save_fasta(filepath) FASTA formatında kaydeder
get_alignment_score() Sum-of-Pairs (SP) skoru döndürür
summary() Özet istatistik sözlüğü döndürür

Örnek Çıktı

==================================================
ÇOKLU DİZİ HİZALAMASI (MSA) SONUCU
==================================================
Alpha  : A T C G A T C G
Beta   : A T C G T T C G
Gamma  : T T C G A T C G

Hizalama uzunluğu : 8 sütun
Dizi sayısı       : 3
Konserve sütunlar : 5 / 8
==================================================

Desteklenen Dizi Tipleri

  • ✅ DNA dizileri (A, T, C, G)
  • ✅ RNA dizileri (A, U, C, G)
  • ✅ Protein dizileri (20 amino asit)
  • ✅ Farklı uzunluktaki diziler
  • ✅ 2 veya daha fazla dizi

Lisans

MIT License

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

kadirmsa-1.0.0.tar.gz (11.6 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

kadirmsa-1.0.0-py3-none-any.whl (12.2 kB view details)

Uploaded Python 3

File details

Details for the file kadirmsa-1.0.0.tar.gz.

File metadata

  • Download URL: kadirmsa-1.0.0.tar.gz
  • Upload date:
  • Size: 11.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.13.13

File hashes

Hashes for kadirmsa-1.0.0.tar.gz
Algorithm Hash digest
SHA256 15d1dcba4e95fff3c433da66e9b4b4b5f53ae6197bf42d3aa32dd0031eda189c
MD5 39b72de99666a49680140a966315011b
BLAKE2b-256 94d2ce8c8397c07c2055b2a667b7da4100dd735b7254b52c0eb5988c9ecc0838

See more details on using hashes here.

File details

Details for the file kadirmsa-1.0.0-py3-none-any.whl.

File metadata

  • Download URL: kadirmsa-1.0.0-py3-none-any.whl
  • Upload date:
  • Size: 12.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.13.13

File hashes

Hashes for kadirmsa-1.0.0-py3-none-any.whl
Algorithm Hash digest
SHA256 fe7b9d152195097c00ea3ac17a759f03eeb2a7ed832aeb1e31d8e61ef5fc6c75
MD5 fdbc5004ca94dcf72af96ed8adf73e02
BLAKE2b-256 0af3c9d102b5bff5176738f4e0b0c230775b0800b94bd0b529d22b781bcd4fe7

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page