Alexander Gurung's picture

Alexander Gurung PRO

agurung

·

alex-gurung

AI & ML interests

None yet

Recent Activity

updated a model about 20 hours ago

agurung/flawed-fictions-qwen3-4b-lengthpenalty

published a model about 20 hours ago

agurung/flawed-fictions-qwen3-4b-lengthpenalty

updated a model about 22 hours ago

agurung/qwen3-4b-ff-grpo-lengthpenalty

View all activity

Organizations

models 68

agurung/flawed-fictions-qwen3-4b-lengthpenalty

Reinforcement Learning • 4B • Updated about 8 hours ago • 9

agurung/qwen3-4b-ff-grpo-lengthpenalty

4B • Updated about 22 hours ago • 45

agurung/colar-ff-qwen3-4b

4B • Updated about 23 hours ago • 27

agurung/qwen-coconut-ff-v2

8B • Updated 1 day ago • 9

agurung/flawed-fictions-qwen25-7b-lengthpenalty-litereason

Reinforcement Learning • 8B • Updated 3 days ago • 75

agurung/flawed-fictions-qwen25-7b-lengthpenalty

Reinforcement Learning • 8B • Updated 4 days ago • 175

agurung/flawed-fictions-olmo-3-7b

Reinforcement Learning • 7B • Updated 8 days ago • 45

agurung/flawed-fictions-gemma-3-4b

Reinforcement Learning • 4B • Updated 9 days ago • 50

agurung/flawed-fictions-qwen3-4b

Reinforcement Learning • 4B • Updated 9 days ago • 58

agurung/qwen3-4b-lcb-dapo-correctness

Updated 13 days ago • 8

datasets 2

agurung/generalization-eval-data

Preview • Updated 1 day ago • 3

agurung/mc-training-data

Viewer • Updated Jan 20 • 733 • 6