7 28 30

Sangwoo Park

Sangsang

sangwoopark000312

AI & ML interests

I do LLM Safety & Reasoning research (KAIST AI)

Recent Activity

updated a model about 23 hours ago

Sangsang/grpo_Qwen3-4B_bs16_g16_mb128_lr1e-6_b1e-3_clip0p2_temp0p7_ep30

published a model about 23 hours ago

Sangsang/grpo_Qwen3-4B_bs16_g16_mb128_lr1e-6_b1e-3_clip0p2_temp0p7_ep30

updated a model 2 days ago

Sangsang/feedback_asymmetric_fixed_ema_DeepSeek-R1-Distill-Qwen-7B_bw0p5_fw0p5_ema0p999_ep30

View all activity

Organizations

None yet

Papers 4

models 206

Sangsang/grpo_Qwen3-4B_bs16_g16_mb128_lr1e-6_b1e-3_clip0p2_temp0p7_ep30

Text Generation • Updated about 23 hours ago • 13

Sangsang/feedback_asymmetric_fixed_ema_DeepSeek-R1-Distill-Qwen-7B_bw0p5_fw0p5_ema0p999_ep30

Text Generation • Updated 2 days ago • 13

Sangsang/feedback_asymmetric_fixed_ema_DeepSeek-R1-Distill-Llama-8B_bw0p5_fw0p5_ema0p999_ep30

Text Generation • Updated 2 days ago • 14

Sangsang/grpo_Qwen3-4B-Instruct-2507_bs16_g16_mb128_lr1e-6_b1e-3_clip0p2_temp0p7_ep30

Text Generation • Updated 4 days ago • 17

Sangsang/feedback_asymmetric_fixed_ema_Qwen3-4B-Instruct-2507_bw0p5_fw0p5_ema0p999_ep30

Text Generation • Updated 4 days ago • 15

Sangsang/feedback_disallowed_ema_Qwen3-4B-Instruct-2507_reverse_kl_ema0p999_ep30

Text Generation • Updated 4 days ago • 23

View 206 models

datasets 100

Sangsang/safepath_test_2

Viewer • Updated 8 days ago • 39.9k • 26

Sangsang/safepath_test

Viewer • Updated 8 days ago • 39.9k • 26

Sangsang/ContextualIntegritySyntheticDataset_Qwen3-4B_all

Viewer • Updated 8 days ago • 729 • 34

Sangsang/ContextualIntegritySyntheticDataset_Qwen3-8B_all

Viewer • Updated 9 days ago • 729 • 30

Sangsang/CI-Olmo-3-32B-Think-Augmented-Responses

Viewer • Updated 9 days ago • 729 • 34

Sangsang/ContextualIntegritySyntheticDataset_Olmo-3-32B-Think_all

Viewer • Updated 9 days ago • 729 • 31

Sangsang/Qwen3-8B-thinksafe-unfiltered-raw

Viewer • Updated 10 days ago • 40k • 28

Sangsang/DeepSeek-R1-Distill-Llama-8B-thinksafe-unfiltered-raw

Viewer • Updated 10 days ago • 40k • 57

Sangsang/CI-DeepSeek-R1-Distill-Qwen-32B-Augmented-Responses

Viewer • Updated 10 days ago • 729 • 36

Sangsang/ContextualIntegritySyntheticDataset_DeepSeek-R1-Distill-Qwen-32B_all

Viewer • Updated 10 days ago • 729 • 31

View 100 datasets

Sangwoo Park

AI & ML interests

Recent Activity

Organizations

Papers 4

models 206 Sort: Recently updated

datasets 100 Sort: Recently updated

models 206

datasets 100