A family of highly efficient, lightweight yet powerful optimizers.

These details have not been verified by PyPI

Project links

Homepage

Project description

Advanced Optimizers (AIO)

A comprehensive, all-in-one collection of optimization algorithms for deep learning, designed for maximum efficiency, minimal memory footprint, and superior performance across diverse model architectures and training scenarios.

📦 Installation

pip install adv_optm

🧠 Core Innovations

This library integrates multiple state-of-the-art optimization techniques validated through extensive research and practical training, with 1-bit compression for optimizer states:

Memory-Efficient Optimization (SMMF-inspired)

Paper: SMMF: Square-Matricized Momentum Factorization
Approach: Uses rank-1 non-negative matrix factorization with reconstruction cycle (factor → reconstruct → update → factor)
Innovation:
- First moment split into 1-bit sign + absolute value
- Final storage: four factored vectors + one 1-bit sign state
- Preserves Adam-like update quality with drastically reduced memory

⚡ Performance Characteristics

Memory Efficiency (SDXL Model - 6.5GB)

Optimizer	Memory Usage	Description
`Adopt_Factored`	328 MB	4 small vectors + 1-bit state
`Adopt_Factored + AdEMAMix`	625 MB	6 small vectors + two 1-bit states
`Simplified_AdEMAMix`	328 MB	Same as standard factored (no extra state)

Speed Comparison (SDXL, Batch Size 4)

Optimizer	Speed	Notes
`Adafactor`	~8.5s/it	Baseline
`Adopt_Factored`	~10s/it	+18% overhead from compression
`Adopt_Factored + AdEMAMix`	~12s/it	+41% overhead (3 factored states)

🧪 Available Optimizers

Standard Optimizers (All support `factored=True/False`)

Optimizer	Description	Best For
`Adam_Adv`	Advanced Adam implementation	General purpose
`Adopt_Adv`	Adam-variant with independent beta2	Stable training for small batch size regimes
`Prodigy_Adv`	Prodigy with D-Adaptation	Adam with automatic LR tuning
`Simplified_AdEMAMix`	Adam variant with accumulator momentum	Small/large batch training when tuned correctly
`Lion_Adv`	Advanced Lion implementation	Memory-constrained environments
`Prodigy_Lion_Adv`	Prodigy + Lion combination	Lion with automatic LR tuning

Feature Matrix

Feature	Adam_Adv	Adopt_Adv	Prodigy_Adv	Simplified_AdEMAMix	Lion_Adv
Factored	✓	✓	✓	✓	✓
AdEMAMix	✓	✓	✓	✗	✗
Simplified_AdEMAMix	✗	✗	✓	✓	✗
OrthoGrad	✓	✓	✓	✓	✓
Grams	✓	✓	✓	✗	✗
Cautious	✓	✓	✓	✗	✓
atan2	✓	✓	✓	✗	✗
Stochastic Rounding	✓	✓	✓	✓	✓
Fused Backward Pass	✓	✓	✓	✓	✓

⚙️ Key Features & Parameters

Comprehensive Feature Guide

Feature	Description	Recommended Usage	Performance Impact	Theoretical Basis	Compatibility
Factored	Memory-efficient optimization using rank-1 factorization	Enable for large models (>1B params) or limited VRAM	+12-41% time overhead, 1-bit memory usage	SMMF	All optimizers
AdEMAMix	Dual EMA system for momentum	Use for long training runs (10k+ steps)	+1 state memory.	AdEMAMix	Adam/Adopt/Prodigy
Simplified_AdEMAMix	Accumulator-based momentum	Small batch training (≤32)	Same memory as standard, no extra overhead	Schedule-Free Connections	Adam/Prodigy
OrthoGrad	Removes gradient component parallel to weights	Full finetuning without weight decay	+33% time overhead, no memory impact	Grokking at Edge	All optimizers
Stochastic Rounding	Improves precision for BF16 training	BF16 training	Minimal overhead (<5%)	Revisiting BFloat16 Training	All optimizers
atan2	Robust eps replacement + built-in clipping	Use with Adopt or unstable training	No overhead	Adam-atan2	Adam/Adopt/prodigy
Cautious	Update only when the direction align with the gradients	should faster the convergence	No overhead	C-Optim	Adam/Adopt/prodigy
Grams	Update direction from the gradients	should have a stronger effect than cautious	No overhead	Grams	Adam/Adopt/prodigy

Simplified_AdEMAMix Parameters

Simplified_AdEMAMix replaces standard momentum with an accumulator for better small-large batch performance.

Parameter	Recommended Values	Description
`beta1`	0.9 (large BS), 0.99-0.9999 (small BS)	Determines memory length of accumulator
`alpha`	100-10 (small BS), 1-0 (large BS)	Gradient smoothing factor

Alpha Tuning Guide:

Batch Size	Recommended α	Rationale
Small (≤32)	100, 50, 20, 10	Emphasizes recent gradients for quick adaptation
Medium (32-512)	10, 5, 2, 1	Balanced approach
Large (≥512)	1, 0.5, 0	Emphasizes historical gradients for stability

⚠️ Important: Use ~100x smaller learning rate with Simplified_AdEMAMix compared to AdamW (e.g., 1e-6 instead of 1e-4)

📊 Performance Validation

Small Batch Training (SDXL, BS=2, 1.8K steps) Training Comparison

🟢 Prodigy_adv (beta1=0.9, d0=1e-5): Final LR=2.9e-4
🔵 Prodigy_adv + Simplified_AdEMAMix (beta1=0.99, α=100, d0=1e-7): Final LR=5.8e-6

Results:

Simplified_AdEMAMix shows faster convergence and better final performance
D-Adaptation automatically handles aggressive updates (50x smaller LR)
Generated samples show significantly better quality with Simplified_AdEMAMix

⚠️ Known Limitations

1. Prodigy_Adv Sensitivity

Highly sensitive to gradient modifications (Adopt normalization, low-rank factorization)
May fail to increase learning rate in some LoRA scenarios
Fix: Disable factorization or set beta1=0

2. Aggressive Learning Rates

Can destabilize factored first moment
Recommendation: Check Prodigy learning rate as reference for safe LR threshold

📚 References

Project details

These details have not been verified by PyPI

Project links

Homepage

Release history Release notifications | RSS feed

2.4.dev13 pre-release

Apr 29, 2026

2.4.dev12 pre-release

Apr 28, 2026

2.4.dev11 pre-release

Apr 11, 2026

2.4.dev10 pre-release

Apr 11, 2026

2.4.dev9 pre-release

Apr 11, 2026

2.4.dev8 pre-release

Apr 11, 2026

2.4.dev7 pre-release

Apr 11, 2026

2.4.dev6 pre-release

Mar 17, 2026

2.4.dev5 pre-release

Mar 16, 2026

2.4.dev4 pre-release

Mar 1, 2026

2.4.dev2 pre-release

Feb 26, 2026

2.4.dev1 pre-release

Feb 25, 2026

2.3.dev3 pre-release

Feb 20, 2026

2.3.dev2 pre-release

Feb 19, 2026

2.3.dev1 pre-release

Feb 19, 2026

2.2.3

Feb 14, 2026

2.2.2

Feb 14, 2026

2.2.1

Feb 7, 2026

2.2.1.dev2 pre-release

Feb 7, 2026

2.2.1.dev1 pre-release

Feb 7, 2026

2.2.0

Jan 31, 2026

2.2.dev5 pre-release

Jan 20, 2026

2.2.dev4 pre-release

Jan 20, 2026

2.2.dev3 pre-release

Jan 20, 2026

2.2.dev2 pre-release

Jan 19, 2026

2.2.dev1 pre-release

Jan 18, 2026

2.1.0

Jan 5, 2026

2.1.dev5 pre-release

Dec 29, 2025

2.1.dev3 pre-release

Dec 28, 2025

2.1.dev2 pre-release

Dec 27, 2025

2.1.dev1 pre-release

Dec 24, 2025

2.0.1

Jan 5, 2026

2.0.0

Jan 5, 2026

1.4.1

Dec 27, 2025

1.4.0

Dec 11, 2025

1.3.4

Dec 10, 2025

1.3.3

Dec 8, 2025

1.3.2

Dec 8, 2025

1.3.1

Dec 7, 2025

1.3.0

Dec 7, 2025

1.3.dev1 pre-release

Dec 5, 2025

1.2.13

Dec 5, 2025

1.2.12

Dec 2, 2025

1.2.11

Dec 1, 2025

1.2.10

Nov 29, 2025

1.2.9

Nov 29, 2025

1.2.8

Nov 28, 2025

1.2.7

Nov 28, 2025

1.2.6

Nov 28, 2025

1.2.5

Nov 25, 2025

1.2.4

Nov 21, 2025

1.2.3

Nov 8, 2025

1.2.2

Nov 7, 2025

1.2.1

Nov 7, 2025

1.2.0

Nov 7, 2025

1.2.dev20 pre-release

Nov 7, 2025

1.2.dev19 pre-release

Nov 5, 2025

1.2.dev18 pre-release

Nov 4, 2025

1.2.dev17 pre-release

Nov 2, 2025

1.2.dev16 pre-release

Nov 2, 2025

1.2.dev15 pre-release

Nov 2, 2025

1.2.dev14 pre-release

Oct 28, 2025

1.2.dev13 pre-release

Oct 28, 2025

1.2.dev12 pre-release

Oct 25, 2025

1.2.dev11 pre-release

Oct 25, 2025

1.2.dev10 pre-release

Oct 24, 2025

1.2.dev9 pre-release

Oct 21, 2025

1.2.dev8 pre-release

Oct 21, 2025

1.2.dev7 pre-release

Oct 21, 2025

1.2.dev6 pre-release

Oct 21, 2025

1.2.dev5 pre-release

Oct 21, 2025

1.2.dev4 pre-release

Oct 20, 2025

1.2.dev3 pre-release

Oct 20, 2025

1.2.dev2 pre-release

Oct 18, 2025

1.2.dev1 pre-release

Oct 17, 2025

1.1.4

Nov 5, 2025

1.1.3

Oct 16, 2025

1.1.2

Oct 11, 2025

1.1.1

Oct 10, 2025

1.1.0

Oct 8, 2025

1.1.0.dev5 pre-release

Oct 8, 2025

1.1.0.dev4 pre-release

Oct 6, 2025

1.1.0.dev3 pre-release

Oct 6, 2025

1.1.0.dev2 pre-release

Oct 5, 2025

1.1.0.dev1 pre-release

Oct 5, 2025

1.0.6

Oct 3, 2025

1.0.5

Sep 30, 2025

This version

1.0.4

Sep 30, 2025

1.0.3

Sep 21, 2025

1.0.1

Sep 21, 2025

1.0.0

Sep 19, 2025

0.1.9

Sep 19, 2025

0.1.8

Sep 18, 2025

0.1.7

Sep 17, 2025

0.1.6

Sep 16, 2025

0.1.5

Sep 16, 2025

0.1.4

Sep 16, 2025

0.1.3

Sep 15, 2025

0.1.2

Sep 15, 2025

0.1.1

Sep 10, 2025

0.1.0

Sep 10, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

adv_optm-1.0.4.tar.gz (27.9 kB view details)

Uploaded Sep 30, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

adv_optm-1.0.4-py3-none-any.whl (36.1 kB view details)

Uploaded Sep 30, 2025 Python 3

File details

Details for the file adv_optm-1.0.4.tar.gz.

File metadata

Download URL: adv_optm-1.0.4.tar.gz
Upload date: Sep 30, 2025
Size: 27.9 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.12.10

File hashes

Hashes for adv_optm-1.0.4.tar.gz
Algorithm	Hash digest
SHA256	`176f6eaa05b19321cee8d255a764f8f3e2edf3489e01dacf934838ba8706e552`
MD5	`c2c949513af281ccf7c9c7d6795ac668`
BLAKE2b-256	`9f7c4544f34329d8ca45bf0574fdb5650040915756c7b4047a90cad9476fd1de`

See more details on using hashes here.

File details

Details for the file adv_optm-1.0.4-py3-none-any.whl.

File metadata

Download URL: adv_optm-1.0.4-py3-none-any.whl
Upload date: Sep 30, 2025
Size: 36.1 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.12.10

File hashes

Hashes for adv_optm-1.0.4-py3-none-any.whl
Algorithm	Hash digest
SHA256	`f716198752a6fe8efe16d28c424bca326093bd39a7addc34985a0a668dd2dc30`
MD5	`e4b4937a0aabfa699d20dddc8e44084a`
BLAKE2b-256	`3bb4b9c0e9686469fed6bfad8b2874f4459cbaccc72bfbcb8cde11b4c3beac13`

See more details on using hashes here.

adv-optm 1.0.4

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Advanced Optimizers (AIO)

📦 Installation

🧠 Core Innovations

Memory-Efficient Optimization (SMMF-inspired)

⚡ Performance Characteristics

Memory Efficiency (SDXL Model - 6.5GB)

Speed Comparison (SDXL, Batch Size 4)

🧪 Available Optimizers

Standard Optimizers (All support factored=True/False)

Feature Matrix

⚙️ Key Features & Parameters

Comprehensive Feature Guide

Simplified_AdEMAMix Parameters

📊 Performance Validation

⚠️ Known Limitations

1. Prodigy_Adv Sensitivity

2. Aggressive Learning Rates

📚 References

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

Standard Optimizers (All support `factored=True/False`)