Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

41,084

Full-text search

Active filters: deep-reinforcement-learning

f8left/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 11, 2022 • 1

shuojiang/PPO-LunarLander-v2-Tuned

Reinforcement Learning • Updated Oct 11, 2022 • 2

shoaibazam/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Oct 12, 2022 • 4

format37/DQN-MountainCar-v0

Reinforcement Learning • Updated Oct 12, 2022 • 2

format37/PPO-MountainCar-v0

Reinforcement Learning • Updated Oct 13, 2022 • 2

knutselmiddag123/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 13, 2022 • 2

knutselmiddag123/ppo-CarRacing-v0

Reinforcement Learning • Updated Oct 13, 2022 • 2

tolgadev/ppo-LunarLander-v3

Reinforcement Learning • Updated Oct 13, 2022 • 2

shuojiang/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Oct 13, 2022 • 3

cleanrl/ppo

Reinforcement Learning • Updated Oct 13, 2022

vwxyzjn/ppo2

Reinforcement Learning • Updated Oct 13, 2022

Mariamegina/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 13, 2022 • 2

Bakuraza/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Oct 13, 2022 • 4

harveymannering/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 14, 2022 • 2

michael20at/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Oct 14, 2022 • 2

justinlangseth/dqn-Sailing-v1c

Reinforcement Learning • Updated Oct 14, 2022 • 4

sistelca/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 15, 2022 • 2

xaeroq/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 15, 2022 • 3

NikitaBaramiia/PPO-LunarLander-v2

Reinforcement Learning • Updated Jan 15, 2023 • 4

Dikkenek/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 16, 2022 • 2

nonsm/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 16, 2022 • 3

wladimir/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 1, 2024 • 2

khynnah94/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 17, 2022 • 3

wladimir/PPO-LunarLander-v2-2

Reinforcement Learning • Updated Oct 17, 2022 • 2

damilare-akin/testpyramidsrnd

Reinforcement Learning • Updated Oct 17, 2022 • 27

heriosousa/ppo-CartPole-v1

Reinforcement Learning • Updated Oct 17, 2022

heriosousa/LunarLander-v2

Reinforcement Learning • Updated Oct 17, 2022

damilare-akin/test_worm

Reinforcement Learning • Updated Oct 17, 2022 • 46

sujit27/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 18, 2022 • 2

NikitaBaramiia/PPO-FrozenLake-v1

Reinforcement Learning • Updated Oct 18, 2022 • 2