Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

40,999

Full-text search

Active filters: deep-reinforcement-learning

dbarbedillo/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Jul 27, 2022 • 4

reachrkr/testpyramidsrnd

Reinforcement Learning • Updated Jul 30, 2022 • 63

rlbsrn/rlexps

Reinforcement Learning • Updated Jul 28, 2022 • 2

butchland/Optuna-ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 28, 2022 • 2

Al020198zee/ppo-CarRacing-v0

Reinforcement Learning • Updated Jul 28, 2022 • 2

wmFrank/sample-factory-2-atari-pong

Reinforcement Learning • Updated Jul 28, 2022 • 5

wmFrank/sample-factory-2-atari-beamrider

Reinforcement Learning • Updated Jul 28, 2022 • 6

wmFrank/sample-factory-2-atari-breakout

Reinforcement Learning • Updated Jul 28, 2022 • 9

jianzhnie/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Jul 29, 2022 • 5

wpolatkan/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 29, 2022 • 2

jianzhnie/a2c-v1-AntBulletEnv-v0

Reinforcement Learning • Updated Jul 29, 2022 • 4

rhiga/ppo-lunar-lander-v2

Reinforcement Learning • Updated Jul 29, 2022 • 1

jianzhnie/a2c-v1-Walker2DBulletEnv-v0

Reinforcement Learning • Updated Jul 29, 2022 • 4

bkaemper/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 29, 2022 • 5

marii/lunarlander

Reinforcement Learning • Updated Jul 29, 2022 • 2

turhancan97/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jul 29, 2022 • 4

jackoyoungblood/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 29, 2022

andrewzhang505/sample-factory-2-doom-battle

Reinforcement Learning • Updated Aug 3, 2022 • 6

jackoyoungblood/ppo-LunarLander-v2b

Reinforcement Learning • Updated Jul 29, 2022 • 2

jackoyoungblood/ppo-LunarLander-v2c

Reinforcement Learning • Updated Aug 5, 2022 • 2

devetle/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Jul 30, 2022 • 3

constanter/PPO-LunarLander-v2

Reinforcement Learning • Updated Jul 30, 2022 • 2

comodoro/testpyramidsrnd

Reinforcement Learning • Updated Jul 30, 2022 • 22

azimuth3d/rf_lunarlander

Reinforcement Learning • Updated Jul 30, 2022 • 2

comodoro/testpyramidsrnd2

Reinforcement Learning • Updated Jul 30, 2022 • 17

ijnekonasa/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 31, 2022 • 2

Forkits/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Jul 31, 2022 • 2

RayS2022/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 31, 2022 • 2

BekirTaha/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 1, 2022 • 3

meln1k/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Aug 1, 2022 • 2