KlearReasoner-8B - a Kwai-Klear Collection

Kwai-Klear 's Collections

mini-swe-agent-plus

Klear-AgentForge

KlearReasoner-8B

RLEP

KlearReasoner-8B

updated Oct 18

KlearReasoner-8B

Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization

Paper • 2508.07629 • Published Aug 11 • 42
CE-GPPO: Controlling Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning

Paper • 2509.20712 • Published Sep 25 • 19
Kwai-Klear/Klear-Reasoner-8B

8B • Updated Sep 27 • 16 • 19
Kwai-Klear/KlearReasoner-MathSub-30K

Viewer • Updated Sep 27 • 30k • 85 • 3
Kwai-Klear/KlearReasoner-CodeSub-15K

Viewer • Updated Sep 27 • 15k • 126 • 5
Kwai-Klear/Klear-Reasoner-8B-SFT

8B • Updated Sep 27 • 3 • 2