Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

40,983

Full-text search

Active filters: deep-reinforcement-learning

rajistics/testpyramidsrnd

Reinforcement Learning • Updated Jul 13, 2022 • 67

andrewzhang505/quad-swarm-rl-sf2

Reinforcement Learning • Updated Jul 14, 2022 • 4

Kuro96/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 14, 2022 • 2

spacestar1705/ppo-LunaLander-v2

Reinforcement Learning • Updated Jul 14, 2022 • 2

stokic/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 14, 2022 • 2

workRL/ppo-CarRacing-v0

Reinforcement Learning • Updated Jul 14, 2022 • 2

dbarbedillo/testpyramidsrnd

Reinforcement Learning • Updated Jul 14, 2022 • 40

benji2264/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 14, 2022 • 2

epsil/ppo-Walker2DBulletEnv-v0

Reinforcement Learning • Updated Jul 15, 2022 • 2

infinitejoy/MLAgents-3DBall

Reinforcement Learning • Updated Jul 15, 2022 • 20 • 1

ab93/ppo-LunarLanderv2

Reinforcement Learning • Updated Jul 15, 2022 • 2

RaphaelReinauer/testpyramidsrnd

Reinforcement Learning • Updated Jul 15, 2022 • 36

trtd56/ppo-Walker2DBulletEnv-v0

Reinforcement Learning • Updated Jul 16, 2022 • 2

infinitejoy/MLAgents-Crawler

Reinforcement Learning • Updated Jul 16, 2022 • 49

infinitejoy/MLAgents-GridFoodCollector

Reinforcement Learning • Updated Jul 16, 2022 • 43

roykoand/ppo-LunarLander-v2.1

Reinforcement Learning • Updated Jul 16, 2022 • 1

6001k1d/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Mar 11, 2024 • 3

csalcedo/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 17, 2022 • 2

Tstarshak/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 16, 2022 • 4

micheljperez/testpyramidsrnd

Reinforcement Learning • Updated Jul 17, 2022 • 44

Retrial9842/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 17, 2022 • 2

micheljperez/testpyramidsrnd2

Reinforcement Learning • Updated Jul 17, 2022 • 55

workRL/ppo-Walker2DBulletEnv-v0

Reinforcement Learning • Updated Jul 17, 2022 • 2

Yuan99/ppo-LunarLander-v1

Reinforcement Learning • Updated Jul 20, 2022 • 2

julmarti/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 18, 2022 • 1

masterdezign/ppo-Walker2DBulletEnv-v0

Reinforcement Learning • Updated Jul 18, 2022 • 3

SimingSiming/testpyramidsrnd

Reinforcement Learning • Updated Jul 19, 2022 • 70

spacestar1705/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 19, 2022 • 4

spacestar1705/testpyramidsrnd

Reinforcement Learning • Updated Jul 19, 2022 • 20

QuickSilver007/MLAgents-Pyramids_v2

Reinforcement Learning • Updated Jul 19, 2022 • 18