CodCodingCode
/

llama-3.1-8b-GRPO-V2.0

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

llama-3.1-8b-GRPO-V2.0 / checkpoint-100 /rng_state.pth

Commit History

Upload folder using huggingface_hub

27a72dd
verified

CodCodingCode commited on 29 days ago