File size: 1,419 Bytes
943feb5
 
 
a0fde87
 
 
 
943feb5
a0fde87
 
 
943feb5
a0fde87
 
943feb5
 
 
 
1f4014f
a0fde87
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
943feb5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
import gradio as gr
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

# Tải model và tokenizer từ Hugging Face
model_name = "ntviet/mbart-hre-viet1.2"
model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name)

# Hàm dịch từ Hre sang Việt
def translate_hre_to_viet(text):
    # Tokenize văn bản đầu vào
    inputs = tokenizer(text, return_tensors="pt")

    # Thực hiện dịch với forced_bos_token_id để chỉ định đầu ra là tiếng Việt
    generated_tokens = model.generate(
        **inputs,
        forced_bos_token_id=tokenizer.lang_code_to_id["vi_VN"]
    )

    # Giải mã kết quả
    translation = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
    return translation[0]

# Tạo giao diện Gradio
demo = gr.Interface(
    fn=translate_hre_to_viet,
    inputs=gr.Textbox(lines=5, placeholder="Nhập văn bản tiếng Hre...", label="Tiếng Hre"),
    outputs=gr.Textbox(label="Tiếng Việt"),
    title="Dịch máy Hre - Việt",
    description="Mô hình dịch từ tiếng Hre sang tiếng Việt sử dụng mBart",
    examples=[
        ["Chin triêuq chin hring chin jât chin ngan chin hring chin jât chinh"],
        ["Vaiq jât triêuq chin hring ngan"]
    ],
    allow_flagging="never"
)

# Khởi chạy ứng dụng
demo.launch()