10 35 1

Yang Shi

DogNeverSleep

https://FrankYang-17.github.io/

FrankYang-17

AI & ML interests

👨🏻‍🎓PhD student at Peking University

Recent Activity

updated a dataset 4 days ago

asdnao21/Qwen3-VL-Eval-0421

published a dataset 4 days ago

asdnao21/Qwen3-VL-Eval-0421

updated a dataset 5 days ago

asdnao21/Qwen3-VL-Eval-New

View all activity

Organizations

updated a dataset 4 days ago

asdnao21/Qwen3-VL-Eval-0421

Preview • Updated 4 days ago • 109

published a dataset 4 days ago

asdnao21/Qwen3-VL-Eval-0421

Preview • Updated 4 days ago • 109

updated a dataset 5 days ago

asdnao21/Qwen3-VL-Eval-New

Preview • Updated 5 days ago • 29

published a dataset 5 days ago

asdnao21/Qwen3-VL-Eval-New

Preview • Updated 5 days ago • 29

updated a dataset 8 days ago

asdnao21/Qwen3-VL-Eval-Res

Preview • Updated 8 days ago • 1.87k

published a dataset 8 days ago

asdnao21/Qwen3-VL-Eval-Res

Preview • Updated 8 days ago • 1.87k

updated a dataset 9 days ago

asdnao21/Edit-Res-New-2

Viewer • Updated 8 days ago • 8.2k • 2.56k

published a dataset 9 days ago

asdnao21/Edit-Res-New-2

Viewer • Updated 8 days ago • 8.2k • 2.56k

updated a dataset 9 days ago

asdnao21/Edit-Res-New

Viewer • Updated 9 days ago • 4.2k • 4.49k

published a dataset 9 days ago

asdnao21/Edit-Res-New

Viewer • Updated 9 days ago • 4.2k • 4.49k

upvoted 3 papers 11 days ago

Pseudo-Unification: Entropy Probing Reveals Divergent Information Patterns in Unified Multimodal Models

Paper • 2604.10949 • Published 12 days ago • 39

OmniShow: Unifying Multimodal Conditions for Human-Object Interaction Video Generation

Paper • 2604.11804 • Published 12 days ago • 70

Attention Sink in Transformers: A Survey on Utilization, Interpretation, and Mitigation

Paper • 2604.10098 • Published 14 days ago • 75

updated a dataset 11 days ago

asdnao21/Edit-Res-1

Viewer • Updated 11 days ago • 4.2k • 9.6k

published a dataset 13 days ago

asdnao21/Edit-Res-1

Viewer • Updated 11 days ago • 4.2k • 9.6k

upvoted a paper 15 days ago

Act Wisely: Cultivating Meta-Cognitive Tool Use in Agentic Multimodal Models

Paper • 2604.08545 • Published 16 days ago • 41

upvoted a paper 17 days ago

Video-MME-v2: Towards the Next Stage in Benchmarks for Comprehensive Video Understanding

Paper • 2604.05015 • Published 19 days ago • 233

authored 2 papers 18 days ago

Agentic-MME: What Agentic Capability Really Brings to Multimodal Intelligence?

Paper • 2604.03016 • Published 22 days ago • 37

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Paper • 2604.04707 • Published 19 days ago • 200

upvoted a paper 18 days ago

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Paper • 2604.04707 • Published 19 days ago • 200

Yang Shi

AI & ML interests

Recent Activity

Organizations

DogNeverSleep's activity