Lazycuber
/

pyg-instruct-wizardlm

Text Generation

Model card Files Files and versions

pyg-instruct-wizardlm / README.md

leaderboard-pr-bot's picture

leaderboard-pr-bot

Adding Evaluation Results

959800c almost 2 years ago

|

663 Bytes

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

Metric	Value
Avg.	34.06
ARC (25-shot)	40.96
HellaSwag (10-shot)	66.71
MMLU (5-shot)	26.33
TruthfulQA (0-shot)	31.93
Winogrande (5-shot)	63.69
GSM8K (5-shot)	1.59
DROP (3-shot)	7.22