RLFR - a JingHaoZ Collection

JingHaoZ 's Collections

RLFR

RLFR

updated 7 days ago

Extending Reinforcement Learning for LLMs with Flow Environment

JingHaoZ/RLFR-Qwen2.5-Math-7B

Text Generation • 8B • Updated 7 days ago • 17
JingHaoZ/RLFR-Qwen2.5-VL-7B-Instruct

Image-to-Text • 8B • Updated 7 days ago • 23 • 1
JingHaoZ/RLFR-Dataset-LM

Viewer • Updated 7 days ago • 102k • 116
JingHaoZ/RLFR-Dataset-VLM

Preview • Updated 7 days ago • 44
RLFR: Extending Reinforcement Learning for LLMs with Flow Environment

Paper • 2510.10201 • Published 9 days ago • 35