Edit Models filters

Apps

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

529

Full-text search

Active filters: RLHF

mradermacher/GRAM-RR-LLaMA-3.2-3B-RewardModel-GGUF

3B • Updated Sep 4 • 113

mradermacher/GRAM-RR-LLaMA-3.2-3B-RewardModel-i1-GGUF

3B • Updated Sep 4 • 134

mradermacher/GRAM-RR-LLaMA-3.1-8B-RewardModel-GGUF

8B • Updated Sep 4 • 157

mradermacher/GRAM-RR-LLaMA-3.1-8B-RewardModel-i1-GGUF

8B • Updated Sep 4 • 39

mradermacher/OpenBioLLm-70B-GGUF

71B • Updated Sep 7 • 97

mradermacher/OpenBioLLm-70B-i1-GGUF

71B • Updated Sep 7 • 1.17k

HYDARIM7/SmolLM2_RLHF_PPO_HY

Reinforcement Learning • 0.1B • Updated Sep 21 • 3

SandLogicTechnologies/Hermes-2-Pro-Llama-3-8B-GGUF

Text Generation • 8B • Updated Sep 29 • 19

mradermacher/Binary-Think-RM-8B-GGUF

8B • Updated Oct 13 • 50

mradermacher/Multiclass-Think-RM-8B-GGUF

8B • Updated Oct 13 • 54

ArtusDev/ilgee_Binary-Think-RM-8B-EXL3

Updated Oct 13 • 2

mradermacher/Binary-Think-RM-8B-i1-GGUF

8B • Updated Oct 13 • 135

mradermacher/Multiclass-Think-RM-8B-i1-GGUF

8B • Updated Oct 13 • 122

ArtusDev/ilgee_Multiclass-Think-RM-8B-EXL3

Updated Oct 13 • 7

kp-forks/reward-model-deberta-v3-large-v2

Updated Feb 1, 2023 • 11

mradermacher/Binary-Think-RM-3B-GGUF

3B • Updated 17 days ago • 433 • 1

mradermacher/Binary-Think-RM-3B-i1-GGUF

3B • Updated 17 days ago • 511 • 1

invi-bhagyesh/TinyLlama-1.1B-Chat-v1.0-hh-rlhf

1B • Updated 1 day ago • 95

RMSnow/SpeechJudge-GRM

11B • Updated 6 days ago • 13