Skip to main content

A package for unsupervised and fully automatic processing of single-cell sequencing data throughout the entire workflow.

Project description

MLAflow

MLAutoFlow Logo

🚀 项目简介

MLAflow 是一款基于人工智能架构开发的、无监督的单细胞 RNA 测序全流程自动处理系统。
通过集成 贝叶斯优化(Bayesian Optimization)Optuna-TPECMA-ES 等高效超参数优化算法,
实现从数据导入到聚类结果输出的全流程自动化与智能化。

该系统面向科研人员和数据分析师,致力于简化繁杂的分析流程,提高分析效率与结果稳定性。


🔧 系统模块功能一览

1️⃣ 自动化数据预处理模块

  • 细胞质控(Quality Control)
    自动调节 min_genespercent_mitomin_cells 等过滤参数,识别低质量细胞;
  • 归一化与对数转换
    自适应设置 target_sum,确保细胞间表达量一致性;
  • 高变基因筛选(HVGs)
    在 1000–3000 范围内自动确定最佳高变基因数量,提高信噪比和降维效果;

2️⃣ 降维与特征压缩模块

  • 使用 PCA 主成分分析 对表达矩阵进行降维;
  • 自动优化 n_pcs 参数,兼顾保留信息量与计算效率;
  • 引入 CMA-ES 自适应算法,评估 PCA 在不同细胞类型(如神经元、免疫细胞)中的鲁棒性;

3️⃣ 聚类分析与图结构构建模块

  • 构建 KNN 邻接图,采用 Leiden 算法进行聚类;
  • 自动优化 resolution 参数,提升聚类精度;
  • 通过 silhouette scoreCalinski-Harabasz 指数 等指标,指导参数调节并增强聚类一致性;

📈 全流程优化引擎

  • 利用 Optuna + TPE 策略 搜索参数组合,自动探索全局最优;
  • CMA-ES 专用于 PCA 模块,确保主成分数 n_pcs 的自适应调整;
  • 通过 聚类效果反向反馈机制(如 silhouette score),实现各阶段参数联动调节,打破传统分析“阶段割裂”的局限性;

🧠 技术亮点

  • 🧩 模块解耦 + 并行调参:不同阶段独立运行,自动跳过无需重复的步骤;
  • 🧠 全流程无监督设计:自动学习最优配置,无需人工干预;
  • 🧠 数据格式广泛支持:兼容 .h5, .h5ad, .mtx, .csv, .txt, .xlsx 等常见格式;
  • 💾 内存友好型实现:支持 AnnData 的 backed 模式,适应大规模数据集;
  • 🛠️ 极简安装,开箱即用

📦 安装方式

请确保使用 Python 3.8+ 环境,并安装以下依赖:

pip install scanpy optuna cma umap-learn

🔍 未来展望

  • ✅ 拓展对空间转录组(Spatial Transcriptomics)的支持;
  • ✅ 引入 Transformer 模型进行表达数据的深层次表示学习;
  • ✅ 增强可视化界面交互能力,打造无代码图形化分析平台;

🤝 合作者

贡献者 GitHub 主页
guxiao2005 @guxiao2005
like-lkr @like-lkr

"""

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

mlaflow-1.0.2.1.tar.gz (4.6 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

mlaflow-1.0.2.1-py3-none-any.whl (4.2 kB view details)

Uploaded Python 3

File details

Details for the file mlaflow-1.0.2.1.tar.gz.

File metadata

  • Download URL: mlaflow-1.0.2.1.tar.gz
  • Upload date:
  • Size: 4.6 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.12.8

File hashes

Hashes for mlaflow-1.0.2.1.tar.gz
Algorithm Hash digest
SHA256 d16ecefcb99678a1ec82e1e34e8a0360de4a87d73fc7ccd600f03d1481af7b72
MD5 488af0f243d14294c7b38548a4ecedd8
BLAKE2b-256 4790b5b0eb9b4c1044ad9d69b729b88d86d2cd5a51a43fbf4386888387ebcb74

See more details on using hashes here.

File details

Details for the file mlaflow-1.0.2.1-py3-none-any.whl.

File metadata

  • Download URL: mlaflow-1.0.2.1-py3-none-any.whl
  • Upload date:
  • Size: 4.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.12.8

File hashes

Hashes for mlaflow-1.0.2.1-py3-none-any.whl
Algorithm Hash digest
SHA256 d3bc29423cedcd945d415e402eb1fae335d2b3343fb0a6735c2aac4a73030a94
MD5 0426667021f155a5f0993da894f09a0b
BLAKE2b-256 cff2675ec204add5c006eae08905b6c139b41b1aa1bbbdc4aa1d57ae6faa99d8

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page