Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

40,976

Full-text search

Active filters: deep-reinforcement-learning

justinwilloughby/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 6, 2022 • 2

Varnez/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 6, 2022 • 4

go2k/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 6, 2022 • 2

messham/ppo-LunarLander-v2_1pt5m

Reinforcement Learning • Updated Jul 6, 2022 • 2

messham/PPO-LunarLander-v2-Optuna

Reinforcement Learning • Updated Jul 6, 2022 • 2

AntiSquid/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 12, 2022 • 2

osanseviero/ppo-LunarLander-v7

Reinforcement Learning • Updated Jul 7, 2022 • 2

osanseviero/ppo-LunarLander-v5

Reinforcement Learning • Updated Jul 7, 2022 • 2

osanseviero/ppo-LunarLander-v6

Reinforcement Learning • Updated Jul 7, 2022 • 2

osanseviero/ppo-LunarLander-v9

Reinforcement Learning • Updated Jul 7, 2022 • 2

osanseviero/ppo-LunarLander-v10

Reinforcement Learning • Updated Jul 7, 2022 • 2

osanseviero/ppo-LunarLander-v11

Reinforcement Learning • Updated Jul 7, 2022 • 2

bothrajat/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 7, 2022 • 5

bothrajat/dqn-BreakoutNoFrameskip-v4

Reinforcement Learning • Updated Jul 7, 2022 • 7

quanxi/TESTppo-LunarLander-v2

Reinforcement Learning • Updated Jul 7, 2022 • 2

epsil/testpyramidsrnd

Reinforcement Learning • Updated Jul 8, 2022 • 46

Lakshya/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 8, 2022 • 4

ramonzaca/testpyramidsrnd

Reinforcement Learning • Updated Jul 8, 2022 • 75

sigalaz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 7 • 4

infinitejoy/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 8, 2022 • 5

infinitejoy/ppo-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 8, 2022 • 6

pm390/pyramids

Reinforcement Learning • Updated Jul 8, 2022 • 103

pligor/TEST1-PPO-LunarLander-v2

Reinforcement Learning • Updated Jul 9, 2022 • 2

ryanblak/testpyramidsrnd

Reinforcement Learning • Updated Jul 9, 2022 • 87

croumegous/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 10, 2022 • 2

meln1k/MLAgents-Pyramids

Reinforcement Learning • Updated Jul 9, 2022 • 103

richx86/ppoLunarLanderv2

Reinforcement Learning • Updated Jul 9, 2022 • 2

Varnez/username-model_architecture-end_id

Reinforcement Learning • Updated Jul 10, 2022 • 2

meln1k/MLAgents-Worm

Reinforcement Learning • Updated Jul 9, 2022 • 85

meln1k/MLAgents-PushBlock

Reinforcement Learning • Updated Jul 9, 2022 • 76