Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

1,147

Full-text search

Active filters: reinforcement-learning, transformers

jvelja/ppo-gemma-2-2b-it-unseeded_1

Reinforcement Learning • Updated Aug 21, 2024 • 1

jvelja/ppo-gemma-2-2b-it-unseeded_2

Reinforcement Learning • Updated Aug 21, 2024 • 2

jvelja/gemma-2-2b-it_imdb_2bit_3

Reinforcement Learning • Updated Aug 22, 2024 • 2

jvelja/gemma-2-2b-it_imdb_2bit_4

Reinforcement Learning • Updated Aug 22, 2024 • 2

jvelja/gpt2_imdb_0

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_1

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_2

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_3

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_4

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_5

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_6

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_7

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_8

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_9

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_10

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 4

jvelja/gpt2_imdb_11

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_12

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gpt2_imdb_13

Reinforcement Learning • 0.1B • Updated Aug 22, 2024 • 3

jvelja/gemma-2-2b-it_imdb_probits_0

Reinforcement Learning • Updated Aug 22, 2024 • 2

jvelja/gemma-2-2b-it-seed-1_0

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-paraphrase_0

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_0

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-paraphrase_1

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_1

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_2

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-paraphrase_2

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_3

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-paraphrase_3

Reinforcement Learning • Updated Aug 23, 2024 • 2

jvelja/gemma-2-2b-it-seed-1_2bit_seed1_4

Reinforcement Learning • Updated Aug 23, 2024 • 2

mertgulexe/mistral-ppo

Reinforcement Learning • 0.1B • Updated Aug 28, 2024 • 3