Yang Yue's picture

Yang Yue

yueyang2000

·

yueyang2000

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Qwen-Image Technical Report

upvoted a paper 9 days ago

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

liked a dataset 16 days ago

facebook/emu_edit_test_set

View all activity

Organizations

None yet

upvoted a paper 2 days ago

Qwen-Image Technical Report

Paper • 2508.02324 • Published 4 days ago • 149

upvoted a paper 9 days ago

X-Omni: Reinforcement Learning Makes Discrete Autoregressive Image Generative Models Great Again

Paper • 2507.22058 • Published 10 days ago • 37

upvoted a paper 22 days ago

Vision-Language-Vision Auto-Encoder: Scalable Knowledge Distillation from Diffusion Models

Paper • 2507.07104 • Published 30 days ago • 44

upvoted a paper 23 days ago

Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination

Paper • 2507.10532 • Published 25 days ago • 84

upvoted a paper 24 days ago

Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Image Generation

Paper • 2507.08441 • Published 28 days ago • 60

upvoted 2 papers about 1 month ago

Ovis-U1 Technical Report

Paper • 2506.23044 • Published Jun 29 • 60

RLPR: Extrapolating RLVR to General Domains without Verifiers

Paper • 2506.18254 • Published Jun 23 • 32

upvoted 4 papers about 2 months ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published Jun 9 • 253

Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning

Paper • 2506.02327 • Published Jun 2 • 19

ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning

Paper • 2506.09513 • Published Jun 11 • 98

CoMemo: LVLMs Need Image Context with Image Memory

Paper • 2506.06279 • Published Jun 6 • 9

upvoted 3 papers 2 months ago

Towards Scalable Language-Image Pre-training for 3D Medical Imaging

Paper • 2505.21862 • Published May 28 • 1

Beyond the 80/20 Rule: High-Entropy Minority Tokens Drive Effective Reinforcement Learning for LLM Reasoning

Paper • 2506.01939 • Published Jun 2 • 176

Large Language Models for Data Synthesis

Paper • 2505.14752 • Published May 20 • 50

upvoted 2 papers 3 months ago

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

Paper • 2505.03335 • Published May 6 • 182

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

Paper • 2504.20571 • Published Apr 29 • 97

upvoted 4 papers 4 months ago

TTRL: Test-Time Reinforcement Learning

Paper • 2504.16084 • Published Apr 22 • 120

CheXWorld: Exploring Image World Modeling for Radiograph Representation Learning

Paper • 2504.13820 • Published Apr 18 • 17

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

Paper • 2504.13837 • Published Apr 18 • 134

A Sober Look at Progress in Language Model Reasoning: Pitfalls and Paths to Reproducibility

Paper • 2504.07086 • Published Apr 9 • 21