Skip to main content

A simple MAFFT-based Multiple Sequence Alignment (MSA) library

Project description

ataserinyelMSA

Python ile yazılmış, MAFFT'tan ilham alan bir Çoklu Dizi Hizalama (MSA) aracı.

Algoritma

Bu araç, MAFFT FFT-NS-1 pipeline'ının basitleştirilmiş bir versiyonunu uygular:

  1. FASTA Okuma/Yazma — Standart FASTA formatında dosya okuma ve yazma
  2. FFT Tabanlı Mesafe Matrisi — Nükleotid vektörlerinin (4 kanallı, tek sıcak kodlama) çapraz korelasyonu ile ikili dizi benzerlik tahmini
  3. Rehber Ağaç — Mesafe matrisine UPGMA kümeleme uygulaması
  4. Aşamalı Hizalama — Rehber ağaç sırasına göre uygulanan Needleman-Wunsch global hizalaması; birleştirilen gruplar her adımda konsensüs dizi ile temsil edilir

Puanlama

Çift Puan
Eşleşme (A=A, T=T, G=G, C=C, U=U) +1
T / U (biyolojik olarak eşdeğer) +1
Uyuşmazlık -1
Boşluk (Gap) -1

Orijinal MAFFT'tan Farklar

  • Gelişmiş yer değiştirme matrisleri yerine basit +1/−1 nükleotid puanlaması kullanır
  • Afin boşluk cezası yok (açma ve uzatma ayrımı yok)
  • Yinelemeli iyileştirme yok (FFT-NS-2 / FFT-NS-i)
  • Küçük DNA/RNA veri setleri için uygundur

Proje Yapısı

ataserinyelMSA/
├── main.py                   # Komut satırı giriş noktası
├── src/ataserinyelMSA/
│   ├── fasta.py              # FASTA okuma/yazma
│   ├── scoring.py            # Nükleotid puanlama matrisi
│   ├── fft_utils.py          # FFT tabanlı mesafe hesabı
│   ├── alignment.py          # Needleman-Wunsch, aşamalı hizalama
│   └── tree.py               # UPGMA rehber ağaç
└── test/
    ├── test.fasta             # Örnek girdi
    ├── test_scoring.py
    ├── test_alignment.py
    ├── test_fasta.py
    ├── test_distance.py
    ├── test_tree.py
    ├── test_progressive_alignment.py
    └── test_pipline.py

Kullanım

python main.py girdi.fasta cikti.fasta

Örnek

Girdi (test/test.fasta):

>seq1
GATTACA
>seq2
GCATGCU
>seq3
AGCTAGC

Çıktı (test/output.fasta):

>seq1
-GAT-TACA
>seq2
-GC-ATGCU
>seq3
AGCTA-GC-

Kurulum

pip install ataserinyelMSA

Testleri Çalıştırma

python -m pytest test/ -v

Yazar

Ata Serinyel

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ataserinyelmsa-0.4.0.tar.gz (13.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

ataserinyelmsa-0.4.0-py3-none-any.whl (12.2 kB view details)

Uploaded Python 3

File details

Details for the file ataserinyelmsa-0.4.0.tar.gz.

File metadata

  • Download URL: ataserinyelmsa-0.4.0.tar.gz
  • Upload date:
  • Size: 13.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.2

File hashes

Hashes for ataserinyelmsa-0.4.0.tar.gz
Algorithm Hash digest
SHA256 61fafe5c4b028a70c92a7036165d066de1404b6f5b58390c7b265d0f860a288e
MD5 8f48f0228f28b925d0fc4444265e5362
BLAKE2b-256 9cd94d2fdce11cfa2a1365b6c0253cba1d98c6e9c3f6ef4698c6c84d069eb48f

See more details on using hashes here.

File details

Details for the file ataserinyelmsa-0.4.0-py3-none-any.whl.

File metadata

  • Download URL: ataserinyelmsa-0.4.0-py3-none-any.whl
  • Upload date:
  • Size: 12.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.2

File hashes

Hashes for ataserinyelmsa-0.4.0-py3-none-any.whl
Algorithm Hash digest
SHA256 f861cb9f65b9064c990fda0df215fd55c0eb5dfef2a998c691b449ab03e4ad38
MD5 0cc2957aa65aaa502bad48d05890b170
BLAKE2b-256 8186b9313ae0b5aeb414e3c4d1e156e07b0e44c84e815c000819e313cfce7a4e

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page