Spaces:
Sleeping
Sleeping
File size: 1,419 Bytes
943feb5 a0fde87 943feb5 a0fde87 943feb5 a0fde87 943feb5 1f4014f a0fde87 943feb5 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 |
import gradio as gr
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
# Tải model và tokenizer từ Hugging Face
model_name = "ntviet/mbart-hre-viet1.2"
model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
# Hàm dịch từ Hre sang Việt
def translate_hre_to_viet(text):
# Tokenize văn bản đầu vào
inputs = tokenizer(text, return_tensors="pt")
# Thực hiện dịch với forced_bos_token_id để chỉ định đầu ra là tiếng Việt
generated_tokens = model.generate(
**inputs,
forced_bos_token_id=tokenizer.lang_code_to_id["vi_VN"]
)
# Giải mã kết quả
translation = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
return translation[0]
# Tạo giao diện Gradio
demo = gr.Interface(
fn=translate_hre_to_viet,
inputs=gr.Textbox(lines=5, placeholder="Nhập văn bản tiếng Hre...", label="Tiếng Hre"),
outputs=gr.Textbox(label="Tiếng Việt"),
title="Dịch máy Hre - Việt",
description="Mô hình dịch từ tiếng Hre sang tiếng Việt sử dụng mBart",
examples=[
["Chin triêuq chin hring chin jât chin ngan chin hring chin jât chinh"],
["Vaiq jât triêuq chin hring ngan"]
],
allow_flagging="never"
)
# Khởi chạy ứng dụng
demo.launch() |