Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

1,152

Full-text search

Active filters: reinforcement-learning, transformers

mkahari/RL_testing

Reinforcement Learning • Updated Jan 11, 2023 • 3

arenbeglaryan/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 8, 2023 • 3

MHaurel/ppo-LunarLander-v2

Reinforcement Learning • Updated May 30, 2023 • 3

akoshel/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 27, 2023 • 3

rootacess/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 5, 2023 • 5

morganjeffries/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 19, 2023 • 3

jrnold/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 1, 2023 • 3

lewtun/dummy-trl-model

Reinforcement Learning • Updated Jan 24, 2023 • 8 • 1

stinoco/PPO-LunarLander-v2

Reinforcement Learning • Updated Mar 6, 2023 • 3

mili7522/ppo-cleanrl-LunarLander-v2

Reinforcement Learning • Updated Apr 16, 2023 • 3

EdenYav/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 22, 2023 • 2

victorivus/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 3, 2023 • 3

slopezay/ppo-LunarLander-v2

Reinforcement Learning • Updated May 20, 2023 • 4

nikogarro/PPO-LunarLander-v2

Reinforcement Learning • Updated Feb 16, 2023 • 2

jamesthong/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 5

ybelkada/gpt-neo-125m-detox

Reinforcement Learning • Updated Feb 17, 2023 • 13

ybelkada/gpt-neo-125m-detoxified-long-context

Reinforcement Learning • Updated Feb 17, 2023 • 7

dungtd2403/CartPole-v1

Reinforcement Learning • Updated Mar 5, 2023 • 3

ZhihongDeng/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 30, 2023 • 5

mkuntz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 3

Gabcsor/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 13, 2023 • 3

dcduplooy/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2023 • 3

Yureeh/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 6, 2023 • 3

TRiddle/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2023 • 3

JulianZas/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 27, 2023 • 3

ElementBrawlerAI/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 28, 2023 • 3

MarkieMark1/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 29, 2023 • 4

D0k-tor/LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2023 • 3

dean-r/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 25, 2023 • 3

dineshresearch/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 13, 2023 • 5