Haitao999
/

Qwen2.5-14B-GRPO-Natural-Reasoning

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-14B-GRPO-Natural-Reasoning / model-00001-of-00006.safetensors

Commit History

Model save

5476593
verified

Haitao999 commited on May 10

Training in progress, step 110

7bf0f2d
verified

Haitao999 commited on May 10

Training in progress, step 100

09c279e
verified

Haitao999 commited on May 10

Training in progress, step 80

457f960
verified

Haitao999 commited on May 10

Training in progress, step 30

ff9d965
verified

Haitao999 commited on May 9

Training in progress, step 20

e48c1c2
verified

Haitao999 commited on May 9

Training in progress, step 10

dadbed2
verified

Haitao999 commited on May 9