Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

40,876

Full-text search

Active filters: deep-reinforcement-learning

sb3/a2c-Ant-v3

Reinforcement Learning • Updated Oct 11, 2022 • 2

sb3/a2c-Walker2d-v3

Reinforcement Learning • Updated Oct 11, 2022 • 11

sb3/a2c-Humanoid-v3

Reinforcement Learning • Updated Oct 11, 2022 • 2

RalphX1/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 10, 2022 • 3

meln1k/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 10, 2022 • 4

antonioricciardi/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2023 • 1

meln1k/qrdqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 11, 2022 • 2

DavidCollier/SpaceInvader

Reinforcement Learning • Updated Jun 11, 2022 • 3

antonioricciardi/FrozenLake-v1

Reinforcement Learning • Updated Jun 11, 2022 • 1

send-it/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 11, 2022 • 4

neeenway/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 11, 2022 • 1

antonioricciardi/CarRacing-v0

Reinforcement Learning • Updated Jun 11, 2022 • 1

Galeros/dqn-mountaincar-v0-local

Reinforcement Learning • Updated Jun 11, 2022 • 1

Galeros/dqn-mountaincar-v0-zoo

Reinforcement Learning • Updated Jun 11, 2022 • 2

Galeros/dqn-mountaincar-v0-zoo-mimick

Reinforcement Learning • Updated Jun 11, 2022 • 5

745H1N/LunarLander-v2-PPO-optuna

Reinforcement Learning • Updated Jun 11, 2022 • 1

745H1N/LunarLander-v2-DQN-optuna

Reinforcement Learning • Updated Jun 11, 2022 • 1

DLWCMD/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 11, 2022 • 1

bguan/SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 8

bguan/SpaceInvadersNoFrameskip-v4-2Msteps

Reinforcement Learning • Updated Jun 12, 2022 • 4

ironbar/dqn-SpaceInvadersNoFrameskip-v4-1M-steps

Reinforcement Learning • Updated Jun 12, 2022 • 6

DavidCollier/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Dec 29, 2023 • 2

mgfrantz/dql-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 4

comodoro/SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 2

rhuang/PPO-LunarLander-v2-baseline

Reinforcement Learning • Updated Jun 12, 2022

Forkits/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 1

rhuang/PPO-LunarLander-v2-mlp-10epoch

Reinforcement Learning • Updated Jun 12, 2022 • 1

NikitaErmolaev/ppo_1M-LunarLander-v2

Reinforcement Learning • Updated Jun 12, 2022 • 2

NikitaErmolaev/ppo_2M-LunarLander-v2

Reinforcement Learning • Updated Jun 12, 2022 • 1

kalmufti/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Jun 12, 2022 • 2