THU-KEG
/

LLaDA-8B-BGPO-sudoku

Reinforcement Learning

Model card Files Files and versions

LLaDA-8B-BGPO-sudoku

Commit History

Update README.md

101ce15
verified

linny2002 commited on 25 days ago

Create README.md

b691968
verified

linny2002 commited on 28 days ago

Upload folder using huggingface_hub

1a9fe0f
verified

NeoZ123 commited on 28 days ago

initial commit

22bf766
verified

NeoZ123 commited on 28 days ago