CodCodingCode
/

llama-3.1-8b-GRPO-V2.0

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

llama-3.1-8b-GRPO-V2.0 / checkpoint-100

Commit History

Delete checkpoint-100/optimizer.pt

791ca68
verified

CodCodingCode commited on 26 days ago

Upload folder using huggingface_hub

27a72dd
verified

CodCodingCode commited on 26 days ago