THU-KEG
/

LLaDA-8B-BGPO-sudoku

Reinforcement Learning

Model card Files Files and versions

LLaDA-8B-BGPO-sudoku

16 GB

2 contributors

History: 4 commits

linny2002's picture

Update README.md

101ce15 verified 20 days ago