————

sir-timio

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

ROCKET: Rapid Optimization via Calibration-guided Knapsack Enhanced Truncation for Efficient Model Compression

upvoted a paper 4 days ago

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

upvoted a paper 3 months ago

GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization

View all activity

Organizations

upvoted a paper 2 days ago

ROCKET: Rapid Optimization via Calibration-guided Knapsack Enhanced Truncation for Efficient Model Compression

Paper • 2602.11008 • Published 3 days ago • 15

upvoted a paper 4 days ago

AudioSAE: Towards Understanding of Audio-Processing Models with Sparse AutoEncoders

Paper • 2602.05027 • Published 10 days ago • 59

upvoted 3 papers 3 months ago

GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization

Paper • 2511.15705 • Published Nov 19, 2025 • 97

SAM 3: Segment Anything with Concepts

Paper • 2511.16719 • Published Nov 20, 2025 • 129

Unveiling Intrinsic Dimension of Texts: from Academic Abstract to Creative Story

Paper • 2511.15210 • Published Nov 19, 2025 • 90

upvoted 2 collections 3 months ago

agent

Collection

227 items • Updated 7 days ago • 19

Agent & RL

Collection

55 items • Updated Nov 27, 2025 • 21

upvoted a paper 4 months ago

When Models Lie, We Learn: Multilingual Span-Level Hallucination Detection with PsiloQA

Paper • 2510.04849 • Published Oct 6, 2025 • 115

upvoted a collection 4 months ago

Qwen3

Collection

84 items • Updated Dec 31, 2025 • 1.66k

upvoted 3 papers 5 months ago

Language Models Can Learn from Verbal Feedback Without Scalar Rewards

Paper • 2509.22638 • Published Sep 26, 2025 • 70

The Russian-focused embedders' exploration: ruMTEB benchmark and Russian embedding model design

Paper • 2408.12503 • Published Aug 22, 2024 • 27

COSPADI: Compressing LLMs via Calibration-Guided Sparse Dictionary Learning

Paper • 2509.22075 • Published Sep 26, 2025 • 22

upvoted an article 5 months ago

Article

🐯 Liger GRPO meets TRL

May 25, 2025

•

upvoted a paper 8 months ago

Will It Still Be True Tomorrow? Multilingual Evergreen Question Classification to Improve Trustworthy QA

Paper • 2505.21115 • Published May 27, 2025 • 140

upvoted 2 papers 10 months ago

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models

Paper • 2402.03300 • Published Feb 5, 2024 • 140

Iterative Self-Training for Code Generation via Reinforced Re-Ranking

Paper • 2504.09643 • Published Apr 13, 2025 • 34

upvoted 2 papers 11 months ago

Associative Recurrent Memory Transformer

Paper • 2407.04841 • Published Jul 5, 2024 • 35

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published Mar 14, 2025 • 146

upvoted an article 12 months ago

Article

The Large Language Model Course

Jan 16, 2025

•

221

upvoted a paper 12 months ago

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published Feb 20, 2025 • 174

————

AI & ML interests

Recent Activity

Organizations

sir-timio's activity

🐯 Liger GRPO meets TRL

The Large Language Model Course