Spaces:

entropy25
/

mt

Running

entropy25 commited on about 21 hours ago

Commit

e9db9b3

verified ·

1 Parent(s): 56b2235

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,8 +3,13 @@ import torch
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 from peft import PeftModel
 base_model_name = "facebook/nllb-200-distilled-600M"
-adapter_model_name = "entropy25/mt_en_no_oil"
 tokenizer = AutoTokenizer.from_pretrained(base_model_name)
 base_model = AutoModelForSeq2SeqLM.from_pretrained(
@@ -14,7 +19,8 @@ base_model = AutoModelForSeq2SeqLM.from_pretrained(
     device_map="auto"
 )
-model = PeftModel.from_pretrained(base_model, adapter_model_name)
 def translate(text, source_lang, target_lang):
     if not text.strip():
@@ -23,11 +29,18 @@ def translate(text, source_lang, target_lang):
     if source_lang == target_lang:
         return text
-    lang_map = {
-        "English": "eng_Latn",
-        "Norwegian": "nob_Latn"
-    }
     sentences = text.split('\n')
     translated_sentences = []
@@ -48,7 +61,7 @@ def translate(text, source_lang, target_lang):
         outputs = model.generate(
             **inputs,
-            forced_bos_token_id=tokenizer.convert_tokens_to_ids(lang_map[target_lang]),
             max_length=512,
             num_beams=5
         )
@@ -212,7 +225,7 @@ with gr.Blocks(css=custom_css, theme=gr.themes.Default()) as demo:
     gr.HTML(
         "<div class='footer-info'>"
-        "Oil & Gas Translation • English ↔ Norwegian"
         "</div>"
     )

 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 from peft import PeftModel
 base_model_name = "facebook/nllb-200-distilled-600M"
+adapter_en_to_no = "entropy25/mt_en_no_oil"
+adapter_no_to_en = "entropy25/mt_no_en_oil"
 tokenizer = AutoTokenizer.from_pretrained(base_model_name)
 base_model = AutoModelForSeq2SeqLM.from_pretrained(
     device_map="auto"
 )
+model_en_to_no = PeftModel.from_pretrained(base_model, adapter_en_to_no)
+model_no_to_en = PeftModel.from_pretrained(base_model, adapter_no_to_en)
 def translate(text, source_lang, target_lang):
     if not text.strip():
     if source_lang == target_lang:
         return text
+    if source_lang == "English" and target_lang == "Norwegian":
+        model = model_en_to_no
+        src_code = "eng_Latn"
+        tgt_code = "nob_Latn"
+    elif source_lang == "Norwegian" and target_lang == "English":
+        model = model_no_to_en
+        src_code = "nob_Latn"
+        tgt_code = "eng_Latn"
+    else:
+        return "Unsupported language pair"
     sentences = text.split('\n')
     translated_sentences = []
         outputs = model.generate(
             **inputs,
+            forced_bos_token_id=tokenizer.convert_tokens_to_ids(tgt_code),
             max_length=512,
             num_beams=5
         )
     gr.HTML(
         "<div class='footer-info'>"
+        "Oil & Gas Translation • English ↔ Norwegian • Bidirectional Model"
         "</div>"
     )