Qianqian Xie's picture

In a Training Loop 🔄

Qianqian Xie

mistletoe111

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 20 hours ago

WebCompass: Towards Multimodal Web Coding Evaluation for Code Language Models

updated a dataset 1 day ago

NJU-LINK/DR3-Eval

authored a paper 1 day ago

MT-Video-Bench: A Holistic Video Understanding Benchmark for Evaluating Multimodal LLMs in Multi-Turn Dialogues

View all activity

Organizations

authored 3 papers 1 day ago

MT-Video-Bench: A Holistic Video Understanding Benchmark for Evaluating Multimodal LLMs in Multi-Turn Dialogues

Paper • 2510.17722 • Published Oct 20, 2025 • 20

IF-VidCap: Can Video Caption Models Follow Instructions?

Paper • 2510.18726 • Published Oct 21, 2025 • 26

DR$^{3}$-Eval: Towards Realistic and Reproducible Deep Research Evaluation

Paper • 2604.14683 • Published 6 days ago • 32