Spaces:

bumchik2
/

articles_classifier

Running

bumchik2 commited on Apr 4

Commit

c7f1481

1 Parent(s): fae2fa4

update app

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,11 +4,11 @@ import torch
 from transformers import AutoModelForSequenceClassification
 import pandas as pd
 from typing import Dict
-from transformers import DistilBertTokenizer
 from typing import List
-USED_MODEL = "distilbert-base-cased"
 @st.cache_resource  # кэширование
 def load_model():
@@ -24,7 +24,7 @@ def load_model():
     index_to_category = {value: key for key, value in category_to_index.items()}
     model = AutoModelForSequenceClassification.from_pretrained(
-        "bumchik2/train-distilbert-base-cased-tags-classification",
         problem_type="multi_label_classification",
         num_labels=len(category_to_index),
         id2label=index_to_category,
@@ -38,7 +38,7 @@ model = load_model()
 @st.cache_resource()
 def get_tokenizer():
-    return DistilBertTokenizer.from_pretrained(USED_MODEL)
 def tokenize_function(text):

 from transformers import AutoModelForSequenceClassification
 import pandas as pd
 from typing import Dict
+from transformers import RobertaTokenizer
 from typing import List
+USED_MODEL = "distilroberta-base"
 @st.cache_resource  # кэширование
 def load_model():
     index_to_category = {value: key for key, value in category_to_index.items()}
     model = AutoModelForSequenceClassification.from_pretrained(
+        f"bumchik2/train-{USED_MODEL}-tags-classification",
         problem_type="multi_label_classification",
         num_labels=len(category_to_index),
         id2label=index_to_category,
 @st.cache_resource()
 def get_tokenizer():
+    return RobertaTokenizer.from_pretrained(USED_MODEL)
 def tokenize_function(text):