Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
|
@@ -251,35 +251,35 @@ with gr.Blocks(title="Новояз — преобразование дорефо
|
|
| 251 |
gr.Markdown(
|
| 252 |
"""
|
| 253 |
# Новояз — преобразование дореформенной орфографии в современную
|
| 254 |
-
|
| 255 |
-
|
| 256 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 257 |
Загрузите изображение со старой русской орфографией (дореформенной) **или** вставьте такой текст вручную — получите результат в **современной орфографии**. Без лишних комментариев, с сохранением смысла и пунктуации.
|
| 258 |
|
| 259 |
## Техническая информация
|
| 260 |
Внутри используются две открытые модели:
|
| 261 |
-
- **OCR для извлечения текста**: [ChatDOC/OCRFlux-3B](https://huggingface.co/ChatDOC/OCRFlux-3B)
|
| 262 |
-
- **Преобразование орфографии**:
|
| 263 |
-
|
| 264 |
-
Запросы исполняются на **ZeroGPU
|
| 265 |
-
Все модели — **с открытым исходным кодом** и публично доступны на Hugging Face.
|
| 266 |
|
| 267 |
## Инструкция по использованию
|
| 268 |
-
1.
|
| 269 |
-
|
| 270 |
-
|
| 271 |
-
|
| 272 |
-
4. Нажмите **«Распознать и преобразовать»** — результат в современной орфографии появится справа.
|
| 273 |
-
5. При необходимости проверьте блок «Промежуточный текст из OCR» и используйте его для сверки.
|
| 274 |
-
|
| 275 |
-
**Подсказки:**
|
| 276 |
-
• Пространство настроено для **длинных документов** (~6 000 токенов на шаг).
|
| 277 |
-
• Если файл очень большой или с множеством страниц, разделите его на части.
|
| 278 |
-
• Сессия ZeroGPU длится до **5 минут**; для особо объёмных материалов запускайте по разделам.
|
| 279 |
"""
|
| 280 |
)
|
| 281 |
|
| 282 |
-
|
| 283 |
with gr.Row():
|
| 284 |
with gr.Column():
|
| 285 |
img = gr.Image(label="Изображение с дореформенным текстом", type="pil")
|
|
|
|
| 251 |
gr.Markdown(
|
| 252 |
"""
|
| 253 |
# Новояз — преобразование дореформенной орфографии в современную
|
| 254 |
+
"""
|
| 255 |
+
)
|
| 256 |
+
gr.Image(
|
| 257 |
+
value="https://i.ibb.co/JWWws0SK/image.png",
|
| 258 |
+
show_label=False,
|
| 259 |
+
height=400,
|
| 260 |
+
width=400,
|
| 261 |
+
interactive=False,
|
| 262 |
+
elem_id="novoyaz-logo",
|
| 263 |
+
)
|
| 264 |
+
gr.Markdown(
|
| 265 |
+
"""
|
| 266 |
Загрузите изображение со старой русской орфографией (дореформенной) **или** вставьте такой текст вручную — получите результат в **современной орфографии**. Без лишних комментариев, с сохранением смысла и пунктуации.
|
| 267 |
|
| 268 |
## Техническая информация
|
| 269 |
Внутри используются две открытые модели:
|
| 270 |
+
- **OCR для извлечения текста**: [ChatDOC/OCRFlux-3B](https://huggingface.co/ChatDOC/OCRFlux-3B)
|
| 271 |
+
- **Преобразование орфографии**: [openai/gpt-oss-20b](https://huggingface.co/openai/gpt-oss-20b) + [ZennyKenny/oss-20b-prereform-to-modern-ru-merged](https://huggingface.co/ZennyKenny/oss-20b-prereform-to-modern-ru-merged)
|
| 272 |
+
|
| 273 |
+
Запросы исполняются на **ZeroGPU**. Все модели — **с открытым исходным кодом**.
|
|
|
|
| 274 |
|
| 275 |
## Инструкция по использованию
|
| 276 |
+
1. Загрузите изображение (PNG/JPG) или вставьте дореформенный текст вручную.
|
| 277 |
+
2. Можно совместить оба варианта — текст будет объединён перед преобразованием.
|
| 278 |
+
3. Нажмите **«Распознать и преобразовать»** и получите современную орфографию.
|
| 279 |
+
4. Проверяйте «Промежуточный текст из OCR» для сверки.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 280 |
"""
|
| 281 |
)
|
| 282 |
|
|
|
|
| 283 |
with gr.Row():
|
| 284 |
with gr.Column():
|
| 285 |
img = gr.Image(label="Изображение с дореформенным текстом", type="pil")
|