texbert-moderator / README.md
basic-go's picture
Update README.md
d1151e6 verified
---
language:
- ru
pipeline_tag: text-classification
library_name: transformers
---
# basic-go/texbert-moderator
Модель предназначена для классификации входного текста, содержащего математические сущности. Модель разделяет следующие классы:
- `tex` — корректная разметка на языке LaTeX (эталон качества);
- `corrupted` — повреждённая разметка LaTeX, словесные формулировки математических выражений, математические символы Unicode, язык разметки AsciiMath.
## Использование
Пример ниже определяет метку входного текста и оценивает её вероятность:
```python
from transformers import pipeline
pipe = pipeline("text-classification", model="basic-go/texbert-moderator")
print(pipe(r"\frac{1{3 - x^{2 + \phi(x(t)"))
# [{'label': 'corrupted', 'score': 0.9999908208847046}]
```
Вместе с тем рекомендуется использовать модель в составе библиотеки [Emma](https://github.com/basic-go-ahead/emma) для актуальной пред- и постобработки данных.