Edit Models filters

Inference Providers

HF Inference API

Misc

deep-reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

41,029

Full-text search

Active filters: deep-reinforcement-learning

flowers-team/TA_RIAC_SAC_fish_s2

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_RIAC_SAC_fish_s5

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_Random_SAC_chimpanzee_s24

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_Random_SAC_chimpanzee_s28

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_Random_SAC_chimpanzee_s19

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_GoalGAN_SAC_chimpanzee_s11

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_GoalGAN_SAC_chimpanzee_s2

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_GoalGAN_SAC_chimpanzee_s15

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_Random_SAC_bipedal_s5

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_Random_SAC_bipedal_s15

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_Random_SAC_bipedal_s1

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_ADR_SAC_bipedal_s15

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_ADR_SAC_bipedal_s1

Reinforcement Learning • Updated Aug 11, 2022

flowers-team/TA_ADR_SAC_bipedal_s2

Reinforcement Learning • Updated Aug 11, 2022

yogeshkulkarni/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 11, 2022 • 2

ClementRomac/TA_ALP-GMM_SAC_spider_s1

Reinforcement Learning • Updated Aug 11, 2022

ClementRomac/TA_ALP-GMM_SAC_spider_s4

Reinforcement Learning • Updated Aug 11, 2022

ClementRomac/TA_Random_SAC_chimpanzee_easy_parkour_s2

Reinforcement Learning • Updated Aug 11, 2022

ClementRomac/TA_Random_SAC_chimpanzee_easy_parkour_s15

Reinforcement Learning • Updated Aug 11, 2022

mrm8488/Worm_v2

Reinforcement Learning • Updated Aug 11, 2022 • 30

QianMolloy/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 11, 2022 • 1

mrm8488/Worm_poca

Reinforcement Learning • Updated Aug 12, 2022 • 48

danielmaxwell/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 12, 2022 • 2

MerlinTK/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Aug 12, 2022 • 4

bdokmeci/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 12, 2022 • 2

mdround/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 12, 2022 • 2

yogeshkulkarni/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Aug 13, 2022 • 4

yogeshkulkarni/testpyramidsrnd

Reinforcement Learning • Updated Aug 13, 2022 • 19

adil-o/PPO-LunarLander-v2

Reinforcement Learning • Updated Aug 13, 2022 • 2

slarionne/ppo-Lander_test

Reinforcement Learning • Updated Aug 13, 2022 • 2