File size: 2,609 Bytes
3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a 20b4d4f 3b7d44a |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 |
import os
INTRODUCTION_TEXT = """
# Русский ASR-лидерборд
Площадка для честного сравнения моделей распознавания русской речи. Мы считаем WER и CER на единых тестовых наборах и сортируем модели по среднему WER (ниже — лучше). Наведите курсор на значение WER в колонке датасета, чтобы увидеть CER. Все метрики указаны в процентах.
"""
REPO_ID = "Vikhrmodels/russian-asr-leaderboard"
HF_TOKEN = os.getenv("HF_TOKEN")
DATASETS = [
"Russian_LibriSpeech",
"Common_Voice_Corpus_22.0",
"Tone_Webinars",
"Tone_Books",
"Tone_Speak",
"Sova_RuDevices",
]
SHORT_DATASET_NAMES = ["RuLS", "CV 22.0", "Webinars", "Books", "Speak", "Sova"]
DATASET_DESCRIPTIONS = {
"RuLS": {
"full_name": "Russian_LibriSpeech",
"description": "Корпус на основе русскоязычных аудиокниг LibriVox. Около 98 часов речи с верифицированными транскрипциями.",
"num_rows": 1352,
},
"CV 22.0": {
"full_name": "Common_Voice_Corpus_22.0",
"description": "Краудсорсинговый многоязычный корпус Mozilla Common Voice. Версия 22.0 содержит русскую речь с транскрипциями.",
"num_rows": 10244,
},
"Webinars": {
"full_name": "Tone_Webinars",
"description": "Речь из образовательных вебинаров. Разнообразные дикторы и темы, близкие к реальным сценариям.",
"num_rows": 21587,
},
"Books": {
"full_name": "Tone_Books",
"description": "Фрагменты русских аудиокниг. Чистая дикторская речь и аккуратные транскрипции.",
"num_rows": 4930,
},
"Speak": {
"full_name": "Tone_Speak",
"description": "Синтетическая русская речь. Полезна для оценки устойчивости к TTS-голосам.",
"num_rows": 700,
},
"Sova": {
"full_name": "Sova_RuDevices",
"description": "Около 100 часов живой русской речи, записанной на устройствах 16 kHz. Тщательно размеченные транскрипции.",
"num_rows": 5799,
},
}
|