THU-KEG
/

LLaDA-8B-BGPO-sudoku

Reinforcement Learning

Model card Files Files and versions

LLaDA-8B-BGPO-sudoku / model-00004-of-00004.safetensors

Commit History

Upload folder using huggingface_hub

1a9fe0f
verified

NeoZ123 commited on 29 days ago