Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

40,994

Full-text search

Active filters: deep-reinforcement-learning

Chris1/a2c-Walker2DBulletEnv-v0

Reinforcement Learning • Updated Jul 25, 2022 • 2

osanseviero/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Jan 17, 2023 • 4

HumanCompatibleAI/ppo-seals-MountainCar-v0

Reinforcement Learning • Updated Sep 19, 2023 • 31 • 1

HumanCompatibleAI/ppo-seals-Ant-v0

Reinforcement Learning • Updated Dec 29, 2022 • 3

HumanCompatibleAI/ppo-seals-Swimmer-v0

Reinforcement Learning • Updated Dec 31, 2022 • 14

HumanCompatibleAI/ppo-seals-Hopper-v0

Reinforcement Learning • Updated Dec 31, 2022 • 5

HumanCompatibleAI/ppo-seals-Humanoid-v0

Reinforcement Learning • Updated Jan 2, 2023 • 4

HumanCompatibleAI/ppo-seals-Walker2d-v0

Reinforcement Learning • Updated Jan 2, 2023 • 6

HumanCompatibleAI/ppo-seals-HalfCheetah-v0

Reinforcement Learning • Updated Dec 31, 2022 • 15

HumanCompatibleAI/ppo-Pendulum-v1

Reinforcement Learning • Updated Sep 19, 2023 • 192 • 5

IPPK/LunarLander-v0.1

Reinforcement Learning • Updated Jul 25, 2022 • 2

Chris1/ppo-CarRacing-v0

Reinforcement Learning • Updated Jul 25, 2022 • 6

andrewzhang505/doom_deadly_corridor

Reinforcement Learning • Updated Jul 25, 2022 • 5

th1s1s1t/dqn-SpaceInvadersNoFrameskip-v1

Reinforcement Learning • Updated Jul 26, 2022 • 8

th1s1s1t/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 26, 2022 • 5

ntinosmg/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 7, 2022 • 2

r3sist/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 26, 2022 • 1

butchland/rl-ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 27, 2022 • 10

th1s1s1t/testpyramidsrnd

Reinforcement Learning • Updated Jul 26, 2022 • 38

AlexChe/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Jul 26, 2022 • 4

suvadityamuk/ppo-LunarLander-v2-practicecourse-1

Reinforcement Learning • Updated Jul 27, 2022 • 2

HumanCompatibleAI/sac-seals-Walker2d-v0

Reinforcement Learning • Updated Jan 2, 2023 • 4

HumanCompatibleAI/sac-seals-Hopper-v0

Reinforcement Learning • Updated Dec 31, 2022 • 7

HumanCompatibleAI/sac-seals-HalfCheetah-v0

Reinforcement Learning • Updated Dec 31, 2022 • 5

HumanCompatibleAI/sac-seals-Ant-v0

Reinforcement Learning • Updated Dec 31, 2022 • 4

HumanCompatibleAI/sac-seals-Humanoid-v0

Reinforcement Learning • Updated Jan 2, 2023 • 4

HumanCompatibleAI/sac-seals-Swimmer-v0

Reinforcement Learning • Updated Dec 31, 2022 • 4

heriosousa/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Jul 27, 2022 • 2

jaybeeja/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 17, 2022 • 2

SGme/pyramids

Reinforcement Learning • Updated Jul 27, 2022 • 31