JiaqiXue
/

R2-Router-RouterArena

@@ -185,7 +185,9 @@ checkpoints/
 ## Training Details
-- **Training Data**: RouterArena sub_10 split (809 queries, 10% of full 8,400)
 - **Method**: Nearest-neighbor regression with cosine distance, distance-weighted
 - **Evaluation**: Full 8,400 RouterArena queries (no data leakage)
 - **Training Time**: < 1 second

 ## Training Details
+Following [chayan](https://huggingface.co/adaptive-classifier/chayan), we only use the official **sub_10 split** (809 queries, 10% of the full 8,400) for training. No full-set data is used during training or hyperparameter tuning.
+- **Training Data**: RouterArena sub_10 split (809 queries)
 - **Method**: Nearest-neighbor regression with cosine distance, distance-weighted
 - **Evaluation**: Full 8,400 RouterArena queries (no data leakage)
 - **Training Time**: < 1 second