Spaces:

ddxorg
/

picture_feature_extract

Sleeping

App Files Files Community

ddxorg commited on Apr 23

Commit

7c37ae2

1 Parent(s): f99b3ea

add preview

Browse files

Files changed (2) hide show

.gradio/flagged/dataset1.csv +2 -0
app.py +7 -12

.gradio/flagged/dataset1.csv ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ Input Type,Document or Image URL,Extracted Plain Text,Preview,timestamp
2	+ URL,,,[],2025-04-23 12:25:00.449275

app.py CHANGED Viewed

@@ -4,6 +4,7 @@ from io import BytesIO
 import gradio as gr
 from mistralai import Mistral, TextChunk, ImageURLChunk
 from PIL import Image
 def process_msg(client, target):
@@ -15,14 +16,6 @@ def process_msg(client, target):
     )
     processed_output = image_response.pages[0].markdown
-    images=[]
-    base64_str = image_response.pages[0].images[0].image_base64
-    if "," in base64_str:
-        base64_str = base64_str.split(",")[1]
-    img_bytes = base64.b64decode(base64_str)
-    img_pil = Image.open(BytesIO(img_bytes))
-    images.append(img_pil)
     messages = [
         {
             "role": "user",
@@ -39,7 +32,7 @@ def process_msg(client, target):
             ]
         }
     ]
-    return messages, images
 def chat_response(client, model, messages):
     response = client.chat.complete(
@@ -73,8 +66,10 @@ def do_ocr(input_type, url=None):
     #ocr = PaddleOCR(use_angle_cls=True, lang="en",use_gpu=False)
     #ocr_response = ocr.ocr(document_source[document_source["type"]], cls=True)[0]
-    message, images = process_msg(client, document_source[document_source["type"]])
     response = chat_response(client, model, message)
     return response.choices[0].message.content, images
 custom_css = """
@@ -114,7 +109,7 @@ with gr.Blocks(
             img_example = gr.Button("Image", elem_classes="example-button")
         with gr.Column(scale=2):
             cleaned_output = gr.Textbox(label="Extracted Plain Text", lines=10, show_copy_button=True)
-            image_output = gr.Gallery(label="OCR Extracted Images", columns=10, height="auto")
     def update_visibility(choice):
         return gr.update(visible=(choice == "URL")), gr.update(visible=(choice == "Upload file"))
@@ -132,7 +127,7 @@ with gr.Blocks(
     submit_btn.click(
         fn=do_ocr,
         inputs=[input_type, url_input],
-        outputs=[cleaned_output, url_input]
     )
 if __name__ == "__main__":

 import gradio as gr
 from mistralai import Mistral, TextChunk, ImageURLChunk
 from PIL import Image
+import requests
 def process_msg(client, target):
     )
     processed_output = image_response.pages[0].markdown
     messages = [
         {
             "role": "user",
             ]
         }
     ]
+    return messages
 def chat_response(client, model, messages):
     response = client.chat.complete(
     #ocr = PaddleOCR(use_angle_cls=True, lang="en",use_gpu=False)
     #ocr_response = ocr.ocr(document_source[document_source["type"]], cls=True)[0]
+    message = process_msg(client, document_source[document_source["type"]])
     response = chat_response(client, model, message)
+    images=[]
+    images.append(Image.open(BytesIO(requests.get(url).content)))
     return response.choices[0].message.content, images
 custom_css = """
             img_example = gr.Button("Image", elem_classes="example-button")
         with gr.Column(scale=2):
             cleaned_output = gr.Textbox(label="Extracted Plain Text", lines=10, show_copy_button=True)
+            image_output = gr.Gallery(label="Preview", height="contain")
     def update_visibility(choice):
         return gr.update(visible=(choice == "URL")), gr.update(visible=(choice == "Upload file"))
     submit_btn.click(
         fn=do_ocr,
         inputs=[input_type, url_input],
+        outputs=[cleaned_output, image_output]
     )
 if __name__ == "__main__":