Clustal Omega Multiple Sequence Alignment - Biyoinformatik Final Projesi
Project description
KadirMSA
Clustal Omega Multiple Sequence Alignment (MSA) — Python Implementasyonu
Biyoinformatik dersi (BLG483) final projesi.
İstanbul Rumeli Üniversitesi, Bilgisayar Mühendisliği.
Kurulum
pip install KadirMSA
Hızlı Kullanım
from kadirmsa import ClustalOmega
# Dizileri tanımla
sequences = ["ATCGATCG", "ATCGTTCG", "TTCGATCG"]
names = ["Alpha", "Beta", "Gamma"]
# Hizala
co = ClustalOmega(sequences, names)
result = co.align(verbose=True)
# Sonucu yazdır
co.print_result()
# FASTA formatında kaydet
co.save_fasta("output.fasta")
# Guide tree (Newick formatı)
print(co.get_newick())
# Özet istatistikler
print(co.summary())
Algoritma
Clustal Omega üç ana adımdan oluşur:
Adım 1 — Pairwise Distance (İkili Uzaklık)
Her dizi çifti arasındaki uzaklık Needleman-Wunsch algoritmasıyla hesaplanır.
Alpha Beta Gamma
Alpha 0.000 0.125 0.250
Beta 0.125 0.000 0.250
Gamma 0.250 0.250 0.000
Adım 2 — Guide Tree (Rehber Ağaç)
Uzaklık matrisinden UPGMA algoritmasıyla filogenetik ağaç oluşturulur.
Bu ağaç, hangi dizilerin önce hizalanacağını belirler.
((Alpha:0.0625,Beta:0.0625):0.125,Gamma:0.25)
Adım 3 — Progressive Alignment (Aşamalı Hizalama)
Guide tree'ye göre diziler sırayla hizalanır:
- En benzer iki dizi önce hizalanır
- Oluşan "profil" bir sonraki dizi ile hizalanır
- Tüm diziler dahil olana kadar tekrar edilir
Alpha : A T C G A T C G
Beta : A T C G T T C G
Gamma : T T C G A T C G
API Referansı
ClustalOmega(sequences, names=None)
| Parametre | Tip | Açıklama |
|---|---|---|
sequences |
list[str] |
Hizalanacak dizi listesi |
names |
list[str] |
Dizi isimleri (isteğe bağlı) |
Metodlar
| Metod | Açıklama |
|---|---|
align(verbose=False) |
Hizalamayı çalıştırır, {isim: dizi} döndürür |
print_result() |
Sonucu ekrana yazdırır |
print_tree() |
Guide tree'yi ASCII olarak gösterir |
get_newick() |
Guide tree'yi Newick formatında döndürür |
get_distance_matrix() |
Pairwise uzaklık matrisini döndürür |
save_fasta(filepath) |
FASTA formatında kaydeder |
get_alignment_score() |
Sum-of-Pairs (SP) skoru döndürür |
summary() |
Özet istatistik sözlüğü döndürür |
Örnek Çıktı
==================================================
ÇOKLU DİZİ HİZALAMASI (MSA) SONUCU
==================================================
Alpha : A T C G A T C G
Beta : A T C G T T C G
Gamma : T T C G A T C G
Hizalama uzunluğu : 8 sütun
Dizi sayısı : 3
Konserve sütunlar : 5 / 8
==================================================
Desteklenen Dizi Tipleri
- ✅ DNA dizileri (A, T, C, G)
- ✅ RNA dizileri (A, U, C, G)
- ✅ Protein dizileri (20 amino asit)
- ✅ Farklı uzunluktaki diziler
- ✅ 2 veya daha fazla dizi
Lisans
MIT License
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file kadirmsa-1.0.0.tar.gz.
File metadata
- Download URL: kadirmsa-1.0.0.tar.gz
- Upload date:
- Size: 11.6 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.13.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
15d1dcba4e95fff3c433da66e9b4b4b5f53ae6197bf42d3aa32dd0031eda189c
|
|
| MD5 |
39b72de99666a49680140a966315011b
|
|
| BLAKE2b-256 |
94d2ce8c8397c07c2055b2a667b7da4100dd735b7254b52c0eb5988c9ecc0838
|
File details
Details for the file kadirmsa-1.0.0-py3-none-any.whl.
File metadata
- Download URL: kadirmsa-1.0.0-py3-none-any.whl
- Upload date:
- Size: 12.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.13.13
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
fe7b9d152195097c00ea3ac17a759f03eeb2a7ed832aeb1e31d8e61ef5fc6c75
|
|
| MD5 |
fdbc5004ca94dcf72af96ed8adf73e02
|
|
| BLAKE2b-256 |
0af3c9d102b5bff5176738f4e0b0c230775b0800b94bd0b529d22b781bcd4fe7
|