Pytorch version of Stable Baselines, implementations of reinforcement learning algorithms.

These details have been verified by PyPI

Maintainers

AdamGleave araffin ernestum hill-a Miffyli

These details have not been verified by PyPI

Project links

Project description

Stable Baselines3

Stable Baselines3 is a set of reliable implementations of reinforcement learning algorithms in PyTorch. It is the next major version of Stable Baselines.

These algorithms will make it easier for the research community and industry to replicate, refine, and identify new ideas, and will create good baselines to build projects on top of. We expect these tools will be used as a base around which new ideas can be added, and as a tool for comparing a new approach against existing ones. We also hope that the simplicity of these tools will allow beginners to experiment with a more advanced toolset, without being buried in implementation details.

Links

Repository: https://github.com/DLR-RM/stable-baselines3

Blog post: https://araffin.github.io/post/sb3/

Documentation: https://stable-baselines3.readthedocs.io/en/master/

RL Baselines3 Zoo: https://github.com/DLR-RM/rl-baselines3-zoo

SB3 Contrib: https://github.com/Stable-Baselines-Team/stable-baselines3-contrib

Quick example

Most of the library tries to follow a sklearn-like syntax for the Reinforcement Learning algorithms using Gym.

Here is a quick example of how to train and run PPO on a cartpole environment:

import gymnasium

from stable_baselines3 import PPO

env = gymnasium.make("CartPole-v1", render_mode="human")

model = PPO("MlpPolicy", env, verbose=1)
model.learn(total_timesteps=10_000)

vec_env = model.get_env()
obs = vec_env.reset()
for i in range(1000):
    action, _states = model.predict(obs, deterministic=True)
    obs, reward, done, info = vec_env.step(action)
    vec_env.render()
    # VecEnv resets automatically
    # if done:
    #   obs = vec_env.reset()

Or just train a model with a one liner if the environment is registered in Gymnasium and if the policy is registered:

from stable_baselines3 import PPO

model = PPO("MlpPolicy", "CartPole-v1").learn(10_000)

Project details

These details have been verified by PyPI

Maintainers

AdamGleave araffin ernestum hill-a Miffyli

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

2.7.0a1 pre-release

Jul 4, 2025

2.7.0a0 pre-release

Jun 16, 2025

2.6.1a1 pre-release

May 14, 2025

2.6.0

Mar 24, 2025

2.6.0a2 pre-release

Mar 4, 2025

2.6.0a1 pre-release

Feb 14, 2025

2.6.0a0 pre-release

Feb 3, 2025

2.5.0

Jan 27, 2025

2.5.0a1 pre-release

Jan 7, 2025

2.5.0a0 pre-release

Nov 18, 2024

2.4.1

Jan 7, 2025

2.4.0

Nov 18, 2024

2.4.0a11 pre-release

Nov 4, 2024

2.4.0a10 pre-release

Oct 24, 2024

2.4.0a7 pre-release

Jul 26, 2024

2.4.0a6 pre-release

Jul 22, 2024

2.4.0a4 pre-release

Jun 29, 2024

2.4.0a1 pre-release

May 15, 2024

This version

2.3.2

Apr 27, 2024

2.3.1 yanked

Apr 22, 2024

Reason this release was yanked:

Loading broken with PyTorch 1.13

2.3.0 yanked

Mar 31, 2024

Reason this release was yanked:

Loading broken with PyTorch 1.13

2.3.0a5 pre-release

Mar 31, 2024

2.3.0a4 pre-release

Mar 11, 2024

2.3.0a2 pre-release

Feb 13, 2024

2.3.0a1 pre-release

Jan 12, 2024

2.2.1

Nov 17, 2023

2.2.0 yanked

Nov 16, 2023

Reason this release was yanked:

breaking change while saving/loading files

2.2.0a11 pre-release

Nov 8, 2023

2.2.0a9 pre-release

Oct 27, 2023

2.2.0a8 pre-release

Oct 25, 2023

2.1.0

Aug 17, 2023

2.0.0

Jun 23, 2023

2.0.0a13 pre-release

Jun 7, 2023

2.0.0a10 pre-release

May 24, 2023

2.0.0a9 pre-release

May 20, 2023

2.0.0a5 pre-release

Apr 14, 2023

2.0.0a4 pre-release

Apr 13, 2023

2.0.0a2 pre-release

Apr 5, 2023

2.0.0a1 pre-release

Mar 29, 2023

1.8.0

Apr 8, 2023

1.8.0a14 pre-release

Apr 5, 2023

1.8.0a13 pre-release

Mar 30, 2023

1.8.0a10 pre-release

Mar 20, 2023

1.8.0a9 pre-release

Mar 12, 2023

1.8.0a8 pre-release

Mar 11, 2023

1.8.0a2 pre-release

Jan 23, 2023

1.7.0

Jan 10, 2023

1.7.0a12 pre-release

Jan 5, 2023

1.7.0a11 pre-release

Jan 2, 2023

1.7.0a10 pre-release

Dec 22, 2022

1.7.0a9 pre-release

Dec 22, 2022

1.7.0a8 pre-release

Dec 20, 2022

1.7.0a4 pre-release

Nov 29, 2022

1.7.0a0 pre-release

Oct 11, 2022

1.6.2

Oct 10, 2022

1.6.1

Sep 29, 2022

1.6.1a2 pre-release

Aug 23, 2022

1.6.0

Jul 12, 2022

1.5.1a8 pre-release

Jun 14, 2022

1.5.1a7 pre-release

May 29, 2022

1.5.1a5 pre-release

Apr 25, 2022

1.5.1a1 pre-release

Apr 8, 2022

1.5.0

Mar 25, 2022

1.4.1a1 pre-release

Feb 22, 2022

1.4.0

Jan 19, 2022

1.3.1a9 pre-release

Jan 7, 2022

1.3.1a8 pre-release

Dec 29, 2021

1.3.1a7 pre-release

Dec 29, 2021

1.3.1a4 pre-release

Dec 2, 2021

1.3.1a3 pre-release

Dec 1, 2021

1.3.0

Oct 23, 2021

1.2.1a2 pre-release

Sep 28, 2021

1.2.1a1 pre-release

Sep 15, 2021

1.2.1a0 pre-release

Sep 13, 2021

1.2.0

Sep 8, 2021

1.1.0

Jul 2, 2021

1.1.0a11 pre-release

Jun 14, 2021

1.1.0a7 pre-release

May 12, 2021

1.1.0a6 pre-release

May 11, 2021

1.1.0a3 pre-release

Apr 15, 2021

1.0

Mar 17, 2021

1.0rc2 pre-release

Mar 6, 2021

1.0rc1 pre-release

Mar 6, 2021

1.0rc0 pre-release

Mar 1, 2021

0.11.1

Feb 27, 2021

0.11.0

Feb 27, 2021

0.11.0a4 pre-release

Dec 21, 2020

0.11.0a2 pre-release

Dec 8, 2020

0.11.0a1 pre-release

Dec 1, 2020

0.10.0

Oct 28, 2020

0.10.0a1 pre-release

Oct 22, 2020

0.9.0

Oct 4, 2020

0.9.0a2 pre-release

Sep 25, 2020

0.8.0

Aug 3, 2020

0.8.0a4 pre-release

Jul 16, 2020

0.8.0a2 pre-release

Jun 29, 2020

0.8.0a1 pre-release

Jun 29, 2020

0.7.0

Jun 10, 2020

0.7.0a1 pre-release

Jun 8, 2020

0.7.0a0 pre-release

Jun 4, 2020

0.6.0

Jun 1, 2020

0.6.0a10 pre-release

May 24, 2020

0.6.0a8 pre-release

May 15, 2020

0.6.0a5 pre-release

May 7, 2020

0.6.0a1 pre-release

May 7, 2020

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

stable_baselines3-2.3.2.tar.gz (209.8 kB view details)

Uploaded Apr 27, 2024 Source

Built Distribution

stable_baselines3-2.3.2-py3-none-any.whl (182.3 kB view details)

Uploaded Apr 27, 2024 Python 3

File details

Details for the file stable_baselines3-2.3.2.tar.gz.

File metadata

Download URL: stable_baselines3-2.3.2.tar.gz
Upload date: Apr 27, 2024
Size: 209.8 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/5.0.0 CPython/3.10.9

File hashes

Hashes for stable_baselines3-2.3.2.tar.gz
Algorithm	Hash digest
SHA256	`2f8188916e607571c4c24f88a9ff6f84edafb2cf22d5d24f9c199563c12ff168`
MD5	`e7d8ea2da32036dc04b36ad5b61c474b`
BLAKE2b-256	`eabd8b6fd663cca67793c7a651b7929f987cee021e72a8d910e8851ea0b4d9c2`

See more details on using hashes here.

File details

Details for the file stable_baselines3-2.3.2-py3-none-any.whl.

File metadata

Download URL: stable_baselines3-2.3.2-py3-none-any.whl
Upload date: Apr 27, 2024
Size: 182.3 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/5.0.0 CPython/3.10.9

File hashes

Hashes for stable_baselines3-2.3.2-py3-none-any.whl
Algorithm	Hash digest
SHA256	`a1cafff6ec23bd4e8f4f20dd829008dc1af58ec2d5d8fc0cd0929b4b4544c9b2`
MD5	`116eb07fa7b17abd2140f4d0c7917804`
BLAKE2b-256	`066ac3098a78a63b5a48e18c11d80b8c532f8b7785d6abb1329cfe3034572161`

See more details on using hashes here.

stable-baselines3 2.3.2

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Stable Baselines3

Links

Quick example

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes