Sangwoo Park PRO

Jackson0018

https://psw0021.github.io/

AI & ML interests

natural language processing/Reinforcement Learning

Recent Activity

upvoted a paper 10 days ago

MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering

upvoted a paper 15 days ago

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

upvoted a paper 24 days ago

WorldMM: Dynamic Multimodal Memory Agent for Long Video Reasoning

View all activity

Organizations

upvoted a paper 10 days ago

MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering

Paper • 2410.07095 • Published Oct 9, 2024 • 8

upvoted a paper 15 days ago

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

Paper • 2505.24864 • Published May 30 • 143

upvoted a paper 24 days ago

WorldMM: Dynamic Multimodal Memory Agent for Long Video Reasoning

Paper • 2512.02425 • Published 25 days ago • 23

upvoted a paper about 1 month ago

Adaptive Multi-Agent Response Refinement in Conversational Systems

Paper • 2511.08319 • Published Nov 11 • 41

upvoted 8 papers 2 months ago

CWM: An Open-Weights LLM for Research on Code Generation with World Models

Paper • 2510.02387 • Published Sep 30 • 8

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paper • 2510.11696 • Published Oct 13 • 176

upvoted 3 papers 3 months ago

When Thoughts Meet Facts: Reusable Reasoning for Long-Context LMs

Paper • 2510.07499 • Published Oct 8 • 48

Rethinking Reward Models for Multi-Domain Test-Time Scaling

Paper • 2510.00492 • Published Oct 1 • 27

ACON: Optimizing Context Compression for Long-horizon LLM Agents

Paper • 2510.00615 • Published Oct 1 • 32

upvoted a collection 5 months ago

Qwen3

Collection

84 items • Updated Aug 6 • 1.52k

upvoted a paper 5 months ago

Qwen3 Technical Report

Paper • 2505.09388 • Published May 14 • 319

upvoted a paper 6 months ago

FLOAT: Generative Motion Latent Flow Matching for Audio-driven Talking Portrait

Paper • 2412.01064 • Published Dec 2, 2024 • 47

upvoted 2 papers 7 months ago

Distilling LLM Agent into Small Models with Retrieval and Code Tools

Paper • 2505.17612 • Published May 23 • 81

System Prompt Optimization with Meta-Learning

Paper • 2505.09666 • Published May 14 • 71

Sangwoo Park PRO

AI & ML interests

Recent Activity

Organizations

Jackson0018's activity