Spaces:

witcher23
/

nanoVLM-inference

Running

App Files Files Community

vidhanm commited on May 23

Commit

a4644a0

1 Parent(s): aecdd6d

nonetype error

Browse files

Files changed (1) hide show

app.py +5 -9

app.py CHANGED Viewed

@@ -29,12 +29,10 @@ else:
 print(f"Using device: {device}")
 # --- Configuration for model components ---
-# The main model ID for weights and overall config
 model_id_for_weights = "lusxvr/nanoVLM-222M"
-# The ID for the vision backbone's image processor configuration
 image_processor_id = "openai/clip-vit-base-patch32"
-# The ID for the tokenizer (can be the main model ID if it provides specific tokenizer files)
-tokenizer_id = "lusxvr/nanoVLM-222M" # Or directly "gpt2" if preferred, but model_id is usually safer
 image_processor = None
 tokenizer = None
@@ -49,7 +47,7 @@ if VisionLanguageModel:
         print(f"Attempting to load GPT2TokenizerFast from: {tokenizer_id}")
         tokenizer = GPT2TokenizerFast.from_pretrained(tokenizer_id, trust_remote_code=True)
         if tokenizer.pad_token is None:
-            tokenizer.pad_token = tokenizer.eos_token
             print("Set tokenizer pad_token to eos_token.")
         print("GPT2TokenizerFast loaded.")
@@ -64,7 +62,7 @@ if VisionLanguageModel:
     except Exception as e:
         print(f"Error loading model or processor components: {e}")
         import traceback
-        traceback.print_exc() # Print full traceback
         image_processor = None
         tokenizer = None
         model = None
@@ -140,7 +138,6 @@ def generate_text_for_image(image_input, prompt_input):
 description = "Interactive demo for lusxvr/nanoVLM-222M."
 example_image_url = "http://images.cocodataset.org/val2017/000000039769.jpg"
-# gradio_cache_dir = os.environ.get("GRADIO_TEMP_DIR", "/tmp/gradio_tmp") # Not used for now
 iface = gr.Interface(
     fn=generate_text_for_image,
@@ -155,8 +152,7 @@ iface = gr.Interface(
         [example_image_url, "a photo of a"],
         [example_image_url, "Describe the image in detail."],
     ],
-    cache_examples=True, # This might cause issues if Gradio version is old. Remove if needed.
-    # examples_cache_folder=gradio_cache_dir, # Removed due to potential Gradio version issue
     allow_flagging="never"
 )

 print(f"Using device: {device}")
 # --- Configuration for model components ---
 model_id_for_weights = "lusxvr/nanoVLM-222M"
 image_processor_id = "openai/clip-vit-base-patch32"
+# Load the tokenizer from its original source to ensure all files are present
+tokenizer_id = "gpt2" # Changed from "lusxvr/nanoVLM-222M"
 image_processor = None
 tokenizer = None
         print(f"Attempting to load GPT2TokenizerFast from: {tokenizer_id}")
         tokenizer = GPT2TokenizerFast.from_pretrained(tokenizer_id, trust_remote_code=True)
         if tokenizer.pad_token is None:
+            tokenizer.pad_token = tokenizer.eos_token # Important for GPT-2
             print("Set tokenizer pad_token to eos_token.")
         print("GPT2TokenizerFast loaded.")
     except Exception as e:
         print(f"Error loading model or processor components: {e}")
         import traceback
+        traceback.print_exc()
         image_processor = None
         tokenizer = None
         model = None
 description = "Interactive demo for lusxvr/nanoVLM-222M."
 example_image_url = "http://images.cocodataset.org/val2017/000000039769.jpg"
 iface = gr.Interface(
     fn=generate_text_for_image,
         [example_image_url, "a photo of a"],
         [example_image_url, "Describe the image in detail."],
     ],
+    # cache_examples=True, # Temporarily commented out to ensure Gradio starts with minimal config
     allow_flagging="never"
 )