Kaiwen Wang's picture

7 2

Kaiwen Wang

kaiwenw

·

https://kaiwenw.github.io/

AI & ML interests

Reinforcement Learning

Organizations

kaiwenw 's datasets 220

kaiwenw/nov11_oasst_pref_jdpo_gpt4o_3_judges

Viewer • Updated Nov 11, 2024 • 14.7k • 1

kaiwenw/nov11_oasst_pref_jdpo_llama70b_cot

Viewer • Updated Nov 11, 2024 • 2.68k

kaiwenw/nov11_oasst_pref_jdpo_llama70b_cot_11_judges

Viewer • Updated Nov 11, 2024 • 14.7k

kaiwenw/nov11_oasst_mini_pref_jdpo_llama8b_cot

Viewer • Updated Nov 11, 2024 • 525 • 3

kaiwenw/nov11_oasst_mini_pref_jdpo_llama8b_cot_8_judges

Viewer • Updated Nov 11, 2024 • 790 • 5

kaiwenw/oasst_pref_jdpo_llama70b_cot

Viewer • Updated Nov 9, 2024 • 3.35k • 1

kaiwenw/oasst_pref_jdpo_llama70b_cot_12_judges

Viewer • Updated Nov 9, 2024 • 14.7k • 2

kaiwenw/oasst_pref_jdpo_llama8b_cot_Meta-Llama-3.1-8B-Instruct_5_judges

Viewer • Updated Nov 9, 2024 • 14.7k

kaiwenw/oasst_mini_pref_jdpo_llama70b_cot_Meta-Llama-3.1-70B-Instruct_3_judges

Viewer • Updated Nov 8, 2024 • 80 • 3

kaiwenw/nov6_oasst_jdpo_llama70b

Viewer • Updated Nov 8, 2024 • 10.6k • 2

kaiwenw/oasst_Meta-Llama-3.1-70B-Instruct_3_judges

Viewer • Updated Nov 7, 2024 • 7.37k

kaiwenw/nov6_oasst_jdpo_llama8b

Viewer • Updated Nov 7, 2024 • 11.2k • 4

kaiwenw/oasst_Meta-Llama-3.1-8B-Instruct_3_judges

Viewer • Updated Nov 7, 2024 • 7.37k

kaiwenw/nov5_sp1_jdpo_gap_0.25

Viewer • Updated Nov 7, 2024 • 6.68k • 2

kaiwenw/nov5_sp1_oct31_oasst_llama70b_jft_3_judges

Viewer • Updated Nov 7, 2024 • 3.64k • 1

kaiwenw/nov6_oasst_mini_jdpo_llama8b_unflatten

Viewer • Updated Nov 7, 2024 • 25

kaiwenw/nov6_oasst_mini_jdpo_llama8b

Viewer • Updated Nov 7, 2024 • 50 • 1

kaiwenw/oasst_mini_Meta-Llama-3.1-8B-Instruct_3_judges

Viewer • Updated Nov 7, 2024 • 40 • 3

kaiwenw/nov6_oasst_mini_jdpo_llama70b_unflatten

Viewer • Updated Nov 6, 2024 • 14

kaiwenw/nov6_oasst_mini_jdpo_llama70b

Viewer • Updated Nov 6, 2024 • 28 • 1

kaiwenw/nov5_sp1_jft_gap_0.25

Viewer • Updated Nov 5, 2024 • 1.91k • 1

kaiwenw/nov5_sp1

Viewer • Updated Nov 5, 2024 • 3.64k • 1

kaiwenw/nov2_aft_gpt4o_1.1

Viewer • Updated Nov 3, 2024 • 3.59k

kaiwenw/nov2_aft_gpt4o_1.0

Viewer • Updated Nov 3, 2024 • 3.38k • 1

kaiwenw/nov2_aft_gpt4o_0.9

Viewer • Updated Nov 3, 2024 • 3.05k • 1

kaiwenw/nov2_aft_llama70b_1.1

Viewer • Updated Nov 2, 2024 • 3.63k • 2

kaiwenw/nov2_aft_llama70b_1.0

Viewer • Updated Nov 2, 2024 • 3.5k • 1

kaiwenw/nov2_aft_llama70b_0.9

Viewer • Updated Nov 2, 2024 • 3.37k • 1

kaiwenw/oasst_mini

Viewer • Updated Nov 2, 2024 • 200 • 3

kaiwenw/old_aft_data

Viewer • Updated Nov 2, 2024 • 3k