Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

41,026

Full-text search

Active filters: deep-reinforcement-learning

Ricardmc99/testpyramidsrnd

Reinforcement Learning • Updated Sep 27, 2022 • 24

erich-hf/ml-agents-pyramids

Reinforcement Learning • Updated Sep 28, 2022 • 24

lanpouthakoun/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 28, 2022 • 2

RamAnanth1/decision-transformers-hopper-expert

Reinforcement Learning • Updated Sep 29, 2022 • 9

RamAnanth1/decision-transformers-walker2d-expert

Reinforcement Learning • Updated Sep 29, 2022 • 7

n2ziaei/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 29, 2022 • 1

FIT17/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 30, 2022 • 5

viveksahukar/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 1, 2023 • 2

JJRohan/LunarLander-v2

Reinforcement Learning • Updated Oct 1, 2022 • 2

farisk263/PPO

Reinforcement Learning • Updated Oct 2, 2022 • 2

FIT17/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Oct 2, 2022 • 2

Bakuraza/FirstLunarLanding

Reinforcement Learning • Updated Oct 3, 2022 • 2

Aitor/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 7, 2022 • 1

SimingSiming/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Nov 15, 2022 • 2

farzeen/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 4, 2022 • 2

shoaibazam/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 5, 2022 • 2

summary71/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 5, 2022 • 2

joelearn22/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 5, 2022 • 2

danluo96/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 5, 2022 • 2

LorenzoPacchiardi/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 10, 2022 • 2

kaiolae/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 9, 2023 • 2

RamAnanth1/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 9, 2022 • 6

hezzze/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 9, 2022 • 2

Alt41r/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 10, 2022 • 2

Hitchiker/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 11, 2022 • 2

Alt41r/SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Oct 10, 2022 • 4

Alt41r/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Oct 11, 2022 • 1

Michael02/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 11, 2022 • 2

hezzze/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Oct 11, 2022 • 4

hezzze/testpyramidsrnd

Reinforcement Learning • Updated Oct 11, 2022 • 43