basic-go
/

texbert-moderator

Text Classification

Model card Files Files and versions

texbert-moderator / README.md

basic-go's picture

Update README.md

d1151e6 verified 5 months ago

|

history blame contribute delete

1.36 kB

	---
	language:
	- ru
	pipeline_tag: text-classification
	library_name: transformers
	---
	# basic-go/texbert-moderator

	Модель предназначена для классификации входного текста, содержащего математические сущности. Модель разделяет следующие классы:

	- `tex` — корректная разметка на языке LaTeX (эталон качества);
	- `corrupted` — повреждённая разметка LaTeX, словесные формулировки математических выражений, математические символы Unicode, язык разметки AsciiMath.

	## Использование

	Пример ниже определяет метку входного текста и оценивает её вероятность:

	```python
	from transformers import pipeline


	pipe = pipeline("text-classification", model="basic-go/texbert-moderator")
	print(pipe(r"\frac{1{3 - x^{2 + \phi(x(t)"))

	# [{'label': 'corrupted', 'score': 0.9999908208847046}]
	```

	Вместе с тем рекомендуется использовать модель в составе библиотеки [Emma](https://github.com/basic-go-ahead/emma) для актуальной пред- и постобработки данных.