Weijing Huang's picture

3 9 40

Weijing Huang

waleking

·

AI & ML interests

Language Models

Recent Activity

upvoted a paper 28 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

upvoted a paper 9 months ago

VAPO: Efficient and Reliable Reinforcement Learning for Advanced Reasoning Tasks

liked a dataset 11 months ago

OpenStellarTeam/Chinese-SimpleQA

View all activity

Organizations

None yet

upvoted a paper 28 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published Nov 24, 2025 • 60

upvoted a paper 9 months ago

VAPO: Efficient and Reliable Reinforcement Learning for Advanced Reasoning Tasks

Paper • 2504.05118 • Published Apr 7, 2025 • 26

upvoted 2 papers 11 months ago

TransMLA: Multi-head Latent Attention Is All You Need

Paper • 2502.07864 • Published Feb 11, 2025 • 57

Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning

Paper • 2502.03275 • Published Feb 5, 2025 • 18

upvoted an article 12 months ago

Article

Replicating DeepSeek R1 for Information Extraction

Jan 31, 2025

•

44

upvoted a paper about 1 year ago

The Lessons of Developing Process Reward Models in Mathematical Reasoning

Paper • 2501.07301 • Published Jan 13, 2025 • 99

upvoted an article about 1 year ago

Article

Deriving DPO's Loss

Dec 24, 2024

•

29