Edward Beeching's picture

Edward Beeching PRO

edbeeching

HuggingFaceH4

·

https://edbeeching.github.io/

edbeeching

AI & ML interests

None yet

Recent Activity

updated a model 3 days ago

edbeeching/Qwen3-0.6B-GKD-simple-gold-top1-qwen3-4b-teacher

updated a model 3 days ago

edbeeching/Qwen3-0.6B-GKD-simple-gold-top1-qwen3-1p7b-teacher

published a model 3 days ago

edbeeching/Qwen3-0.6B-GKD-simple-gold-top1-qwen3-1p7b-teacher

View all activity

Organizations

edbeeching 's models 390

edbeeching/Qwen3-0.6B-GKD-simple-gold-top1-qwen3-1p7b-teacher

Updated 3 days ago • 87

edbeeching/Qwen3-0.6B-GKD-simple-gold-top1-qwen3-4b-teacher

Updated 3 days ago • 126

edbeeching/Qwen3-0.6B-GKD-simple-gold-topk

Updated 4 days ago • 258

edbeeching/Qwen3-0.6B-GKD-simple-gold2

Updated 6 days ago • 777

edbeeching/Qwen3-4B-Base-SFT-tr5

Text Generation • 4B • Updated 6 days ago • 2.84k

edbeeching/Qwen3-4B-Instruct-2507-SFT-tr5

Text Generation • 4B • Updated 6 days ago • 2.9k

edbeeching/Qwen3-4B-Thinking-2507-SFT-tr5

Text Generation • 4B • Updated 6 days ago • 2.69k

edbeeching/Qwen3-0.6B-GKD-simple-gold

Updated 7 days ago • 75

edbeeching/Qwen3-4B-GKD-simple-gold

Updated 7 days ago • 453

edbeeching/Qwen3-0.6B-GKD-simple

Updated 9 days ago • 662

edbeeching/Qwen3-4B-GKD-simple

Updated 10 days ago • 368

edbeeching/Qwen3-4B-GKD

Updated 11 days ago • 11

edbeeching/Qwen3-4B-GKD-push

Updated 11 days ago • 1

edbeeching/pipeline-trl-push-callback-smoke-20260317t210929z

Updated 11 days ago • 2

edbeeching/pipeline-trl-test

Updated 11 days ago • 15

edbeeching/Qwen3-0.6B-untied

Text Generation • 0.8B • Updated Jan 30 • 25

edbeeching/fixed-Qwen3-30B-A3B-Thinking-2507-SFT-v03.01-step-000000062

Text Generation • 31B • Updated Jan 23 • 2

edbeeching/Qwen3-30B-A3B-Thinking-2507-trans-5.0-format

Text Generation • 31B • Updated Jan 15 • 27

edbeeching/Qwen2.5-1.5B-Open-R1-Distill-dev

Updated Jul 25, 2025

edbeeching/OpenR1-Distill-7B-packing-benchmarks

8B • Updated Jun 9, 2025 • 2

edbeeching/OpenR1-Distill-7B

Text Generation • 8B • Updated Jun 7, 2025 • 17

edbeeching/SmolLM3-3B-instruct

Updated Jun 2, 2025

edbeeching/Qwen2.5-1.5B-Open-R1-Distill

Text Generation • 2B • Updated Jun 2, 2025 • 7

edbeeching/DeepScaler-DeepSeek-R1-Distill-Qwen-1.5B-GRPO

2B • Updated May 22, 2025 • 3

edbeeching/Qwen2.5-7B-Instruct-GRPO

8B • Updated Mar 25, 2025 • 4

edbeeching/Qwen2.5-Math-7B-Instruct-SFT

Text Generation • 8B • Updated Mar 25, 2025

edbeeching/Qwen2.5-1.5B-Open-R1-Code-GRPO

Updated Mar 11, 2025

edbeeching/Qwen2.5-Coder-3B-Instruct-sft

Text Generation • 3B • Updated Feb 22, 2025 • 1

edbeeching/pythia-1b-deduped-tldr-online-dpo

Updated Feb 19, 2025

edbeeching/DeepSeek-R1-Distill-Qwen-1.5-GRPO

2B • Updated Feb 7, 2025