princeton-nlp
/

warm-startppothink__Llama-3.1-8B-Instruct

Model card Files Files and versions

warm-start__ppo__think__Llama-3.1-8B-Instruct / model-00002-of-00007.safetensors

Commit History

Uploading the models

22ff942
verified

princeton-nlp commited on Sep 22