Edit Models filters

Inference Providers

HF Inference API

Misc

reward-modeling

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

4

Full-text search

Active filters: reward-modeling

LifelongAlignment/aifgen-piecewise-preference-shift-0-reward-model

Reinforcement Learning • 0.5B • Updated May 7 • 3

opencompass/CompassJudger-2-32B-Instruct

Text Ranking • 33B • Updated Jul 22 • 40 • 2

mradermacher/CompassJudger-2-32B-Instruct-GGUF

Text Ranking • 33B • Updated Jul 23 • 108

mradermacher/CompassJudger-2-32B-Instruct-i1-GGUF

Text Ranking • 33B • Updated Jul 23 • 212