Final_Assignment_Template

Running

Coool2 commited on 11 days ago

Commit

05072aa

verified ·

1 Parent(s): 3ff7703

Update agent.py

Files changed (1) hide show

agent.py CHANGED Viewed

@@ -78,20 +78,17 @@ proj_llm = HuggingFaceLLM(
     model_name=model_id,
     tokenizer_name=model_id,
     device_map="auto",
-    model_kwargs={
-        "torch_dtype": "auto",
-        "max_memory": get_max_memory_config("10GB")
-    },
     generate_kwargs={"temperature": 0.1, "top_p": 0.3}  # More focused
 )
 code_llm = HuggingFaceLLM(
     model_name="Qwen/Qwen2.5-Coder-3B",
     tokenizer_name="Qwen/Qwen2.5-Coder-3B",
-    device_map="auto",
     model_kwargs={
-        "torch_dtype": "auto",
-        "max_memory": get_max_memory_config("3GB")
     },
     # Set generation parameters for precise, non-creative code output
     generate_kwargs={"temperature": 0.0, "do_sample": False}

     model_name=model_id,
     tokenizer_name=model_id,
     device_map="auto",
+    model_kwargs={"torch_dtype": torch.float16},
     generate_kwargs={"temperature": 0.1, "top_p": 0.3}  # More focused
 )
 code_llm = HuggingFaceLLM(
     model_name="Qwen/Qwen2.5-Coder-3B",
     tokenizer_name="Qwen/Qwen2.5-Coder-3B",
+    device ="cpu",
     model_kwargs={
+        "torch_dtype": torch.float32,  # Use float32 for CPU
+        "low_cpu_mem_usage": True,     # Still get memory optimization
     },
     # Set generation parameters for precise, non-creative code output
     generate_kwargs={"temperature": 0.0, "do_sample": False}