Skip to main content

The Last Mile Publication Aggregator CLI

Project description

🕊️ Biopygeon

The Last Mile Publication Aggregator & Intelligent Bioinformatics Assistant

Biopygeon adalah antarmuka baris perintah (CLI) inovatif yang mengintegrasikan instrumen bioinformatika (NCBI BLAST, ExPASy ProtParam, Enrichr, PDB) langsung dengan agen kecerdasan buatan (LLM - Groq). Alat ini dirancang untuk menjadi jembatan antara output mentah data biologis dan pembuatan visualisasi serta laporan berstandar jurnal Q1 (Nature, Science, Elsevier).

Berbeda dengan skrip statis konvensional, Biopygeon dibekali dengan AI Router yang secara dinamis dan otonom dapat memanggil hingga 18 alat cerdas (Tools) berdasarkan percakapan (bahasa natural) dengan pengguna.


🚀 Fitur Utama

  • 🤖 Agen Asisten Cerdas Otonom (biopygeon chat): AI secara dinamis merutekan obrolan Anda ke 18 fungsi bioinformatika tanpa perlu Anda menghafal command.
  • 🔬 Katalog Lengkap Analisis Biologi: Dari kalkulasi ProtParam, pencarian struktur 3D, Multiple Sequence Alignment, hingga desain primer kloning!
  • 📊 Visualisasi Q1 (Omics & Jaringan): Membuat Bubble Plot, merender jaringan interaktif (SSN), dan mengharmonisasi data CSV secara algoritmik.
  • 📚 Pencarian Literatur Tiga Mesin: Akses simultan ke Semantic Scholar, OpenAlex, dan PubMed dengan manajemen API Polite Pool (bebas banned).
  • 📑 Penyusunan Metodologi & PDF Otomatis: Menyusun narasi draf penelitian dan laporan eksekutif PDF secara instan dari hasil komputasi.

🛠️ Panduan Instalasi (Onboarding)

Pastikan Anda menggunakan Python 3.9 atau yang lebih baru.

pip install biopygeon

Untuk kebutuhan pengembang (Developer) agar dapat menjalankan Unit Tests:

pip install pytest pytest-mock responses

🔐 Autentikasi & Konfigurasi API

Sistem memerlukan autentikasi minimum untuk beroperasi optimal. Data kunci (Keys) dan Email akan disimpan aman secara lokal di ~/.bio_pipeline/config.json.

1. Mengatur API Keys dan Email Untuk mematuhi kebijakan Polite Pool (NCBI E-utilities & OpenAlex) dan mencegah pembatasan kecepatan (rate limit):

biopygeon auth set-key --groq-key "gsk_xxxx..." --s2-key "xxxx..." --email "anda@email.com"

2. Verifikasi Status

biopygeon auth status

🧠 Katalog Lengkap Alat AI (18 Smart Tools Blueprint)

Melalui perintah biopygeon chat, agen AI memiliki akses langsung ke blueprint alat berikut. Anda cukup meminta dalam bahasa manusia, dan AI akan merangkai parameter fungsinya!

A. Modul Literatur & Pencarian (Literature Engine)

  1. lit_search: Ekstraksi artikel dan metadata dari PubMed dan Semantic Scholar untuk menjawab pertanyaan (Q&A).
  2. lit_search_bibliometrics: Ekstraksi jurnal berskala masif melalui OpenAlex untuk pemetaan jaringan publikasi (SSN).
  3. export_results: Menyimpan dan mengonversi data hasil pencarian literatur ke format PDF, CSV, XML, JSON, TSV, atau FASTA.

B. Modul Komputasi Biologi (Bio Engine)

  1. find_protein: Melakukan kueri langsung ke RCSB PDB untuk menemukan struktur kristal 3D / NMR.
  2. download_protein_data: Mengunduh dan mengekstrak berkas .pdb (struktur) atau .fasta (sekuens) dari RCSB PDB.
  3. analyze_protparam: Mengkalkulasi sifat fisikokimia seperti titik isoelektrik (pI), berat molekul, dan indeks kestabilan (mengandalkan BioPython).
  4. calculate_protein_params: Ekstensi kalkulasi massa untuk protein rekombinan (misalnya ditambahkan dengan tag purifikasi seperti His-tag).
  5. run_blast: Eksekusi remote NCBI BLAST (blastp/blastn) dengan parsing data HSP secara real-time.
  6. run_msa: Memicu Multiple Sequence Alignment secara asinkron menggunakan server EBI Clustal Omega.
  7. extract_domain: Mengekstrak domain/nukleotida spesifik dari genom lengkap berdasarkan pencocokan motif (RegEx).
  8. design_primer: Mendesain dan memvalidasi pasangan oligonukleotida (primer) untuk reaksi PCR dan perakitan kloning (Primer3 wrapper).
  9. prepare_docking: Melakukan pra-pemrosesan model PDB dengan membersihkan molekul pelarut (H2O) dan membuang rantai heteroatom.

C. Modul Data Omics & Visualisasi (Pipeline Engine)

  1. harmonize_data: Pra-pemrosesan Data CSV (Baseline correction ALS, imputasi missing value dengan mean/median).
  2. plot_enrichment: Menggenerasi grafik Bubble Plot berkualitas publikasi dari dataset Enrichment.
  3. render_network: Mengomputasi kolom target & sumber (edges) menjadi diagram SSN format HTML interaktif.
  4. plot_q1_figure: Pembuatan gambar beresolusi 300 DPI dengan palet warna ala Nature atau Elsevier (tersedia Boxplot, Violin, Scatter).
  5. generate_methodology: Asisten merumuskan dan menulis ulang parameter data ke dalam draf paragraf "Metode Penelitian".
  6. format_manuscript: Menyesuaikan file draft naskah docx dengan template jurnal docx menggunakan MS Word Native COM Automation.

💬 Contoh Interaksi Pengguna (AI Chat Mode)

Daripada menghafal 18 format perintah CLI (meski opsi ini tetap ada), metode interaksi utama dan yang direkomendasikan adalah Obrolan AI.

Mulai sesi interaktif:

biopygeon chat

Anda dapat mengetikkan perintah natural seperti:

  • "Cari 10 jurnal terbaru tentang terapi sel punca." (Memicu lit_search)
  • "Berapa bobot molekul dan pI dari sekuens protein MLRYAIL?" (Memicu analyze_protparam)
  • "Jalankan BLAST untuk 1SLT_A dan tolong unduhkan data strukturnya." (Memicu run_blast dan download_protein_data)
  • "Buat plot jaringan SSN interaktif dari file interaksi.csv" (Memicu render_network)
  • "Bersihkan molekul air pada protein_saya.pdb agar siap didocking" (Memicu prepare_docking)

AI akan secara pintar menangani parameter (routing), menanyakan jika ada data masukan yang kurang, dan menyajikan hasil beserta opsi pembuatan laporan eksekutif berformat PDF.


🧪 Validasi Perangkat Lunak (QA & Testing)

Sebagai perangkat lunak kelas penelitian (Research-Grade Software), Biopygeon menggunakan Unit Testing ketat dengan isolasi API (API Mocking) agar test suite dapat dijalankan tanpa menghabiskan kuota jaringan.

Untuk memvalidasi integritas 18 fungsi sebelum pembaruan (diperlukan pytest):

$env:PYTHONPATH="."  # Untuk pengguna Windows
# atau export PYTHONPATH="." untuk Mac/Linux

python -m pytest tests/

Uji coba otomatis mengeksekusi Dummy Responses (XML dari PubMed, JSON dari OpenAlex, RCSB, dsb) untuk memastikan seluruh pipa data (pipeline) stabil 100%.


Dikembangkan untuk mentransformasi analisis bioinformatika yang kompleks menjadi dialog sederhana — dari data mentah menuju publikasi Q1 secara instan.

Project details


Release history Release notifications | RSS feed

This version

1.0.6

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

biopygeon-1.0.6.tar.gz (79.2 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

biopygeon-1.0.6-py3-none-any.whl (79.4 kB view details)

Uploaded Python 3

File details

Details for the file biopygeon-1.0.6.tar.gz.

File metadata

  • Download URL: biopygeon-1.0.6.tar.gz
  • Upload date:
  • Size: 79.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.14.2

File hashes

Hashes for biopygeon-1.0.6.tar.gz
Algorithm Hash digest
SHA256 7900553139febeeb9cf7f040fb0e8809df6aa8a5e18e02d1647310d2cc9c14c4
MD5 912e12662de1ba80216d30df21ef8c83
BLAKE2b-256 93e41b1b016cdd22691bd169c9c6f48fb7c5e7538e732ac3d8abe362d319ad3b

See more details on using hashes here.

File details

Details for the file biopygeon-1.0.6-py3-none-any.whl.

File metadata

  • Download URL: biopygeon-1.0.6-py3-none-any.whl
  • Upload date:
  • Size: 79.4 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.14.2

File hashes

Hashes for biopygeon-1.0.6-py3-none-any.whl
Algorithm Hash digest
SHA256 38e251d2255c7da182640aa7f660de9c0adce9fa49cbb51bfc87fc7c776a6891
MD5 83a40fbc4297be603ba3a821afc78da6
BLAKE2b-256 5e7ade83656c2d1ac66eeb8d4f955b04a9e4129107aae6f2c558c2c3e6445412

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page