tmpmodelsave/llama3_sft_math_augmath_type12_beta05nosft_300tmp10_vllmexp Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_200tmp10_vllmexp Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/llama3_sft_math_augmath_type12_beta05nosft_200tmp10_vllmexp Viewer • Updated Jan 19 • 15k • 4
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_600tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_500tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_400tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_300tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 4
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_200tmp10_vllmexp2 Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_600tmp10 Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_500tmp10 Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_400tmp10 Viewer • Updated Jan 19 • 15k • 4
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_300tmp10 Viewer • Updated Jan 19 • 15k • 2
tmpmodelsave/beta05dpollama3_sft_math_augmath_type12only_sftloss_200tmp10 Viewer • Updated Jan 19 • 15k • 3
tmpmodelsave/type12_math_augmath_dpo_sftlossbeta05_step400tmp10_vllmexp2 Viewer • Updated Jan 18 • 15k • 1
tmpmodelsave/type12_math_augmath_dpo_sftlossbeta05_step400tmp10_vllmexp1 Viewer • Updated Jan 18 • 15k • 1