Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

1,036

Full-text search

Active filters: reinforcement-learning, transformers

bnurpek/kl0.03-mse-gpt2-256T-neg-15

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 4

bnurpek/kl0.03-mse-gpt2-256T-neg-20

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 15

bnurpek/kl0.03-mse-gpt2-256T-neg-30

Reinforcement Learning • 0.1B • Updated Jan 2, 2024 • 4

bnurpek/noref-mgpt-neg-0

Reinforcement Learning • Updated Jan 2, 2024

bnurpek/gpt2-256t-pos-0

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-pos-1

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-pos-2

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-pos-3

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-pos-5

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-pos-7

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-pos-10

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

taku-yoshioka/test4

Reinforcement Learning • Updated Jan 3, 2024

bnurpek/gpt2-256t-pos-15

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-pos-20

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-pos-30

Reinforcement Learning • 0.1B • Updated Jan 3, 2024 • 4

bnurpek/gpt2-256t-nrwr-pos-0

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 7

bnurpek/gpt2-256t-nrwr-pos-1

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 16

bnurpek/gpt2-256t-nrwr-pos-2

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 4

bnurpek/gpt2-256t-nrwr-pos-3

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 4

bnurpek/gpt2-256t-nrwr-pos-5

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 15

bnurpek/gpt2-256t-nrwr-pos-7

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 15

bnurpek/gpt2-256t-nrwr-pos-10

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 4

bnurpek/gpt2-256t-nrwr-pos-15

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 14

bnurpek/gpt2-256t-nrwr-pos-20

Reinforcement Learning • 0.1B • Updated Jan 7, 2024 • 4

bnurpek/gpt2-256t-nr1wr-neg-0

Reinforcement Learning • 0.1B • Updated Jan 8, 2024 • 4

bnurpek/gpt2-256t-nr1wr-neg-1

Reinforcement Learning • 0.1B • Updated Jan 8, 2024 • 15

bnurpek/gpt2-256t-nr1wr-neg-2

Reinforcement Learning • 0.1B • Updated Jan 8, 2024 • 4

bnurpek/gpt2-256t-nr1wr-neg-3

Reinforcement Learning • 0.1B • Updated Jan 8, 2024 • 4

bnurpek/gpt2-256t-nr1wr-neg-5

Reinforcement Learning • 0.1B • Updated Jan 8, 2024 • 4

bnurpek/gpt2-256t-nr1wr-neg-7

Reinforcement Learning • 0.1B • Updated Jan 8, 2024 • 3