Edit Models filters

Apps

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

129

Full-text search

Active filters: reward model

mradermacher/Starling-LM-7B-beta-laser-dpo-i1-GGUF

7B • Updated Dec 12, 2024 • 21

mradermacher/Starling-LM-7B-beta-laser-dpo-GGUF

7B • Updated Dec 12, 2024 • 42

mradermacher/Starling-LM-7B-beta-GGUF

7B • Updated Aug 1 • 136 • 2

mradermacher/Starling-LM-7B-beta-i1-GGUF

7B • Updated Dec 22, 2024 • 24 • 1

mradermacher/JSL-MedMNX-7B-v2.0-GGUF

7B • Updated Dec 27, 2024 • 10

mradermacher/JSL-MedMNX-7B-v2.0-i1-GGUF

7B • Updated Dec 27, 2024 • 16

mradermacher/Starling-LM-7B-beta-LaserRMT-v1-GGUF

7B • Updated Jan 2 • 9 • 1

mradermacher/GuIA-v2-GGUF

7B • Updated Jan 3 • 25 • 1

Qwen/Qwen2.5-Math-7B-PRM800K

Text Classification • 8B • Updated Jan 17 • 3.19k • 19

Qwen/Qwen2.5-Math-PRM-72B

Text Classification • 73B • Updated Jan 17 • 177 • 72

Qwen/Qwen2.5-Math-PRM-7B

Text Classification • 8B • Updated Jan 17 • 15.2k • 78

sthenno/tempesthenno-hs2-rm

15B • Updated Jan 27 • 2 • 1

prithivMLmods/PRM-Math-7B-Reasoner

Text Classification • 8B • Updated Jan 19 • 11 • 1

mradermacher/JSL-MedMNX-7B-SFT-GGUF

7B • Updated Jan 19 • 12

mradermacher/JSL-MedMNX-7B-SFT-i1-GGUF

7B • Updated Jan 19 • 47

mradermacher/PRM-Math-7B-Reasoner-GGUF

8B • Updated Jan 21 • 9

mradermacher/PRM-Math-7B-Reasoner-i1-GGUF

8B • Updated Jan 21 • 8

internlm/internlm-xcomposer2d5-7b-reward

Any-to-Any • Updated May 20 • 4.38k • 10

mradermacher/Starling-LM-11B-alpha-GGUF

11B • Updated Feb 9 • 189 • 1

mradermacher/Starling-LM-11B-alpha-i1-GGUF

11B • Updated Feb 10 • 496 • 2

mradermacher/Llama-3.1-Nemotron-70B-Reward-HF-GGUF

71B • Updated Jul 31 • 142

mradermacher/Llama-3.1-Nemotron-70B-Reward-HF-i1-GGUF

71B • Updated Mar 8 • 204

weiminw/Heliumos-RM-3B

Text Classification • 3B • Updated May 9

tensorblock/CallComply_Starling-LM-11B-alpha-GGUF

11B • Updated Jul 9 • 35

weiminw/Heliumos-RM-4B

Text Classification • 4B • Updated May 9

Qwen/WorldPM-72B

Text Classification • 73B • Updated May 17 • 83 • 80

Qwen/WorldPM-72B-HelpSteer2

Text Classification • 73B • Updated May 17 • 228 • 9

Qwen/WorldPM-72B-UltraFeedback

Text Classification • 73B • Updated May 17 • 722 • 5

Qwen/WorldPM-72B-RLHFLow

Text Classification • 73B • Updated May 17 • 63 • 9

KnutJaegersberg/WorldPM-72B-4bit

Text Classification • Updated May 19