Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

1,146

Full-text search

Active filters: reinforcement-learning, transformers

mradermacher/arc-teacher-8b-i1-GGUF

Reinforcement Learning • 8B • Updated 22 days ago • 321

mradermacher/InfiGUI-G1-7B-GGUF

Reinforcement Learning • 8B • Updated 12 days ago • 4.37k • 1

mradermacher/InfiGUI-G1-7B-i1-GGUF

Reinforcement Learning • 8B • Updated 12 days ago • 3.19k • 1

mradermacher/InfiGUI-G1-3B-GGUF

Reinforcement Learning • 3B • Updated 12 days ago • 2.67k • 1

mradermacher/InfiGUI-G1-3B-i1-GGUF

Reinforcement Learning • 3B • Updated 12 days ago • 1.66k • 1

ajagota71/SmolLM-135M-detox-checkpoint-epoch-20

Reinforcement Learning • 0.1B • Updated 9 days ago • 13

ajagota71/SmolLM-135M-detox-checkpoint-epoch-40

Reinforcement Learning • 0.1B • Updated 9 days ago • 13

ajagota71/SmolLM-360M-detox-checkpoint-epoch-20

Reinforcement Learning • 0.4B • Updated 9 days ago • 14

ajagota71/SmolLM-360M-detox-checkpoint-epoch-40

Reinforcement Learning • 0.4B • Updated 9 days ago • 13

ajagota71/SmolLM-135M-detox-checkpoint-epoch-60

Reinforcement Learning • 0.1B • Updated 9 days ago • 13

ajagota71/SmolLM-360M-detox-checkpoint-epoch-60

Reinforcement Learning • 0.4B • Updated 9 days ago • 13

ajagota71/SmolLM-135M-detox-checkpoint-epoch-80

Reinforcement Learning • 0.1B • Updated 9 days ago • 13

ajagota71/SmolLM-360M-detox-checkpoint-epoch-80

Reinforcement Learning • 0.4B • Updated 9 days ago • 13

ajagota71/SmolLM-135M-detox-checkpoint-epoch-100

Reinforcement Learning • 0.1B • Updated 9 days ago • 13

ajagota71/SmolLM-135M-detox

Reinforcement Learning • 0.1B • Updated 9 days ago • 29

ajagota71/SmolLM-360M-detox-checkpoint-epoch-100

Reinforcement Learning • 0.4B • Updated 9 days ago • 12

ajagota71/SmolLM-360M-detox

Reinforcement Learning • 0.4B • Updated 9 days ago • 29

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-20

Reinforcement Learning • 0.1B • Updated 9 days ago • 8

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-20

Reinforcement Learning • 0.4B • Updated 9 days ago • 8

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-40

Reinforcement Learning • 0.1B • Updated 9 days ago • 7

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-40

Reinforcement Learning • 0.4B • Updated 9 days ago • 6

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-60

Reinforcement Learning • 0.1B • Updated 9 days ago • 7

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-60

Reinforcement Learning • 0.4B • Updated 9 days ago • 7

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-80

Reinforcement Learning • 0.1B • Updated 9 days ago • 7

ajagota71/SmolLM2-135M-detox-checkpoint-epoch-100

Reinforcement Learning • 0.1B • Updated 9 days ago • 5

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-80

Reinforcement Learning • 0.4B • Updated 9 days ago • 7

ajagota71/SmolLM2-135M-detox

Reinforcement Learning • 0.1B • Updated 9 days ago • 10

ajagota71/SmolLM2-360M-detox-checkpoint-epoch-100

Reinforcement Learning • 0.4B • Updated 9 days ago • 7

ajagota71/SmolLM2-360M-detox

Reinforcement Learning • 0.4B • Updated 9 days ago • 9

ajagota71/Qwen2.5-0.5B-detox-checkpoint-epoch-20

Reinforcement Learning • 0.5B • Updated 8 days ago • 7