import gradio as gr from PIL import Image from transformers import TrOCRProcessor, VisionEncoderDecoderModel # โหลด model และ processor จาก Hugging Face processor = TrOCRProcessor.from_pretrained("microsoft/trocr-base-handwritten") model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-handwritten") def ocr_on_cropped(image: Image.Image): if image is None: return "กรุณาอัปโหลดและครอบภาพก่อน" # แปลงภาพเป็น input ของ HuggingFace model pixel_values = processor(images=image, return_tensors="pt").pixel_values generated_ids = model.generate(pixel_values) generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0] return generated_text.strip() with gr.Blocks() as demo: gr.Markdown("## 🤗 OCR ด้วย HuggingFace - อัปโหลดและครอบภาพ") with gr.Row(): image_input = gr.Image(type="pil", interactive=True, label="อัปโหลดและครอบภาพ") ocr_result = gr.Textbox(label="ข้อความที่ตรวจพบ") image_input.change(fn=ocr_on_cropped, inputs=image_input, outputs=ocr_result) demo.launch()