BenfengXu's picture

2 12 3

BenfengXu

SpiketheCowboy

·

BenfengXu

AI & ML interests

None yet

Recent Activity

upvoted a paper 11 days ago

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

upvoted a paper 13 days ago

Kimi K2.5: Visual Agentic Intelligence

upvoted a paper 13 days ago

Wiki Live Challenge: Challenging Deep Research Agents with Expert-Level Wikipedia Articles

View all activity

Organizations

upvoted a paper 11 days ago

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

Paper • 2602.03442 • Published 13 days ago • 19

upvoted 4 papers 13 days ago

Kimi K2.5: Visual Agentic Intelligence

Paper • 2602.02276 • Published 13 days ago • 232

Wiki Live Challenge: Challenging Deep Research Agents with Expert-Level Wikipedia Articles

Paper • 2602.01590 • Published 14 days ago • 33

WildGraphBench: Benchmarking GraphRAG with Wild-Source Corpora

Paper • 2602.02053 • Published 14 days ago • 40

FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents

Paper • 2602.01566 • Published 14 days ago • 46

upvoted a paper 5 months ago

MCP-AgentBench: Evaluating Real-World Language Agent Performance with MCP-Mediated Tools

Paper • 2509.09734 • Published Sep 10, 2025 • 16

upvoted a paper 7 months ago

Test-Time Scaling with Reflective Generative Model

Paper • 2507.01951 • Published Jul 2, 2025 • 108

upvoted 2 papers 8 months ago

From Real to Synthetic: Synthesizing Millions of Diversified and Complicated User Instructions with Attributed Grounding

Paper • 2506.03968 • Published Jun 4, 2025 • 15

DeepResearch Bench: A Comprehensive Benchmark for Deep Research Agents

Paper • 2506.11763 • Published Jun 13, 2025 • 74

upvoted 2 papers over 1 year ago

Parameter-Efficient Fine-Tuning of Large Language Models for Unit Test Generation: An Empirical Study

Paper • 2411.02462 • Published Nov 4, 2024 • 9

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 168

upvoted a paper over 2 years ago

Scaling Relationship on Learning Mathematical Reasoning with Large Language Models

Paper • 2308.01825 • Published Aug 3, 2023 • 22