SIRI - a THU-KEG Collection

THU-KEG 's Collections

SIRI

VerIF

OpenSAE-LLaMA-3.1-8B

Crab

ADELIE

SIRI

updated 22 days ago

Scaling Iterative Reinforcement Learning with Interleaved Compression

SIRI: Scaling Iterative Reinforcement Learning with Interleaved Compression

Paper • 2509.25176 • Published 22 days ago • 12
THU-KEG/SIRI-7B-high

Text Generation • 8B • Updated 22 days ago • 41 • 4
THU-KEG/SIRI-7B-low

Text Generation • 8B • Updated 22 days ago • 17 • 2
THU-KEG/SIRI-1.5B-high

Text Generation • 2B • Updated 22 days ago • 24 • 3
THU-KEG/SIRI-1.5B-low

Text Generation • 2B • Updated 22 days ago • 19 • 2