AI & ML interests
None defined yet.
ScaleML-RLHF/qwmathbase_ppo_n1_step60
8B
•
Updated
•
4
ScaleML-RLHF/qwmathbase_grpo_n4_bz512_step100
8B
•
Updated
•
5
ScaleML-RLHF/qwmathbase_raw_raft_step300
8B
•
Updated
•
4
ScaleML-RLHF/qwmathbase_non_neg_grpo_step60
8B
•
Updated
•
5
ScaleML-RLHF/qwmathbase_ppo_n1_step200
8B
•
Updated
•
5
ScaleML-RLHF/qwmathbase_ppo_n1_step120
8B
•
Updated
•
4
ScaleML-RLHF/qwmathbase_ppo_n1_step140
8B
•
Updated
•
4
ScaleML-RLHF/qwmathbase_raftpp_bz128_step200
8B
•
Updated
•
4
ScaleML-RLHF/qwmathbase_raf_raft_n4_bz128_step20
8B
•
Updated
•
3
ScaleML-RLHF/qwmathbase_raftpp_bz128_step20
8B
•
Updated
•
4
ScaleML-RLHF/qwmathbase_grpo_n4_bz512_step60
8B
•
Updated
•
3
ScaleML-RLHF/qwmathbase_non_neg_grpo_step160
8B
•
Updated
•
5
ScaleML-RLHF/qwmathbase_raf_raft_n4_bz128_step100
8B
•
Updated
•
6
ScaleML-RLHF/qwmathbase_ppo_n1_step20
8B
•
Updated
•
4
ScaleML-RLHF/qwmathbase_weighted_sft_bz512_step140
8B
•
Updated
•
3
ScaleML-RLHF/qwmathbase_full_raft_step60
8B
•
Updated
•
5
ScaleML-RLHF/qwmathbase_full_raft_step20
8B
•
Updated
•
3
ScaleML-RLHF/qwmathbase_raw_raft_step20
8B
•
Updated
•
3
ScaleML-RLHF/qwmathbase_weighted_sft_bz512_step60
Updated
ScaleML-RLHF/Qwen2.5-Math-1.5B-raft-vanilla-numina_math_flat_em_stage1n64-sample8-iter
Updated