Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

41,023

Full-text search

Active filters: deep-reinforcement-learning

curt-tigges/testworm

Reinforcement Learning • Updated Sep 5, 2022 • 73

Ricardmc99/DeepRL-Class

Reinforcement Learning • Updated Sep 6, 2022 • 2

vihu/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 6, 2022 • 2

unfinity/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 6, 2022 • 3

nithiroj/testpyramidsrnd

Reinforcement Learning • Updated Sep 6, 2022 • 38

NithirojTripatarasit/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Sep 7, 2022 • 2

NithirojTripatarasit/ppo-CartPole-v1

Reinforcement Learning • Updated Sep 8, 2022

danieladejumo/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Sep 10, 2022 • 3

danieladejumo/a2c-HalfCheetahBulletEnv-v0

Reinforcement Learning • Updated Sep 10, 2022 • 2

anujshah645/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 11, 2022 • 2

Eksperymenty/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 11, 2022 • 4

Eksperymenty/testpyramidsrnd

Reinforcement Learning • Updated Sep 11, 2022 • 28

michael20at/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 14, 2022 • 9

huijian222/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 12, 2022 • 7

kws/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated May 5, 2023 • 3

huijian222/testpyramidsrnd

Reinforcement Learning • Updated Sep 13, 2022 • 35

Anindya/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 13, 2022 • 2

raulEK2022/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 15 • 1

jcmc/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Sep 13, 2022 • 2

anechaev/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 13, 2022 • 4

Galeros/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 14, 2022 • 4

matemato/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 14, 2022 • 2

rebolforces/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Sep 15, 2022 • 2

rebolforces/a2c-HalfCheetahBulletEnv-v0

Reinforcement Learning • Updated Sep 15, 2022 • 2

huijian222/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Sep 16, 2022 • 2

scoldi/ppo-LunarLander-32env-1M

Reinforcement Learning • Updated Sep 16, 2022 • 2

mayorov-s/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 18, 2022 • 6

rhiga/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Sep 16, 2022 • 2

michael20at/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 17, 2022 • 3

pikodemo/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 18, 2022 • 2