Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

39,879

Full-text search

Active filters: deep-reinforcement-learning

MarioBarbeque/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated 4 days ago • 44 • 1

paipaixiaobaobei/ppo-LunarLander-v2

Reinforcement Learning • Updated 4 days ago • 10 • 1

CBratz/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated 1 day ago • 13 • 1

devdharpatel/SAC-Pendulum-V1

Reinforcement Learning • Updated 1 day ago • 1

devdharpatel/SAC-Hopper-v2

Reinforcement Learning • Updated about 22 hours ago • 1

devdharpatel/SAC-Walker2d-v2

Reinforcement Learning • Updated about 21 hours ago • 1

devdharpatel/SAC-Ant-v2

Reinforcement Learning • Updated about 21 hours ago • 1

devdharpatel/SAC-HalfCheetah-v2

Reinforcement Learning • Updated about 21 hours ago • 1

devdharpatel/SAC-Humanoid-v2

Reinforcement Learning • Updated about 21 hours ago • 1

devdharpatel/SAC-LunarLanderContinuous-v2

Reinforcement Learning • Updated about 21 hours ago • 1

devdharpatel/SAC-InvertedPendulum-v2

Reinforcement Learning • Updated about 21 hours ago • 1

devdharpatel/SAC-InvertedDoublePendulum-v2

Reinforcement Learning • Updated about 21 hours ago • 1

devdharpatel/SAC-Reacher-v2

Reinforcement Learning • Updated about 20 hours ago • 1

devdharpatel/SAC-Swimmer-v2

Reinforcement Learning • Updated about 20 hours ago • 1

ThomasSimonini/ML-Agents-SnowballFight-1vs1

Reinforcement Learning • Updated Nov 30, 2021 • 15 • 10

ThomasSimonini/demo-hf-CartPole-v1

Reinforcement Learning • Updated May 3, 2023 • 11

ThomasSimonini/mlagents-snowballfight-1vs1-ppo

Reinforcement Learning • Updated Nov 22, 2021

ThomasSimonini/ppo-AntBulletEnv-v0

Reinforcement Learning • Updated Apr 7, 2022 • 39 • 1

ThomasSimonini/ppo-BreakoutNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 24 • 3

ThomasSimonini/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 28, 2023 • 19 • 14

ThomasSimonini/ppo-PongNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 25 • 1

ThomasSimonini/ppo-QbertNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 8

ThomasSimonini/ppo-SeaquestNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 8

ThomasSimonini/ppo-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 13 • 3

ThomasSimonini/ppo-Walker2DBulletEnv-v0

Reinforcement Learning • Updated Jul 15, 2022 • 8

ThomasSimonini/stable-baselines3-ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 7, 2022

carlosaguayo/Simonini-ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 22, 2022 • 4 • 1

edbeeching/decision_transformer_atari

Reinforcement Learning • Updated Feb 21, 2022 • 4

mrm8488/a2c-Pong-v0

Reinforcement Learning • Updated Feb 11, 2022 • 7 • 1

mrm8488/a2c-PongNoFrameskip-v0

Reinforcement Learning • Updated Feb 12, 2022 • 7