Du Ricky's picture

14 33

Du Ricky PRO

sddwt

·

AI & ML interests

None yet

Recent Activity

upvoted a collection 6 days ago

upvoted a paper 7 days ago

CodeOCR: On the Effectiveness of Vision Language Models in Code Understanding

upvoted a paper 8 days ago

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

View all activity

Organizations

None yet

upvoted a collection 6 days ago

Emu3.5

Native Multimodal Models are World Learners 🌍 • 4 items • Updated 9 days ago • 74

upvoted a paper 7 days ago

CodeOCR: On the Effectiveness of Vision Language Models in Code Understanding

Paper • 2602.01785 • Published 11 days ago • 92

upvoted 2 papers 8 days ago

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published 14 days ago • 150

SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation

Paper • 2602.02402 • Published 10 days ago • 31

upvoted 2 papers 9 days ago

Green-VLA: Staged Vision-Language-Action Model for Generalist Robots

Paper • 2602.00919 • Published 12 days ago • 276

3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation

Paper • 2602.03796 • Published 9 days ago • 55

upvoted a paper 10 days ago

DynamicVLA: A Vision-Language-Action Model for Dynamic Object Manipulation

Paper • 2601.22153 • Published 14 days ago • 68

upvoted a paper 18 days ago

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Paper • 2601.15876 • Published 21 days ago • 89

upvoted a paper 29 days ago

Attention Is All You Need

Paper • 1706.03762 • Published Jun 12, 2017 • 110

upvoted 5 papers 30 days ago

MHLA: Restoring Expressivity of Linear Attention via Token-Level Multi-Head

Paper • 2601.07832 • Published Jan 12 • 52

BabyVision: Visual Reasoning Beyond Language

Paper • 2601.06521 • Published Jan 10 • 196

Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning

Paper • 2601.06943 • Published Jan 11 • 211

Orca: Progressive Learning from Complex Explanation Traces of GPT-4

Paper • 2306.02707 • Published Jun 5, 2023 • 48

The RefinedWeb Dataset for Falcon LLM: Outperforming Curated Corpora with Web Data, and Web Data Only

Paper • 2306.01116 • Published Jun 1, 2023 • 42