Spaces:

640510702phithak
/

text-embedding-api

Sleeping

640510702phithak commited on Feb 18

Commit

4355acb

verified ·

1 Parent(s): cbac7b2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,23 +2,20 @@ from fastapi import FastAPI
 from transformers import AutoTokenizer, AutoModel
 import torch
-# โหลดโมเดล Sentence-Transformer
 MODEL_NAME = "sentence-transformers/all-MiniLM-L6-v2"
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-model = AutoModel.from_pretrained(MODEL_NAME)
-# สร้าง API
 app = FastAPI()
-# ฟังก์ชันแปลงข้อความเป็นเวกเตอร์
 def get_embedding(text):
     inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
     with torch.no_grad():
         outputs = model(**inputs)
-    embedding = outputs.last_hidden_state.mean(dim=1)  # ใช้ค่าเฉลี่ยของ hidden states
     return embedding.squeeze().tolist()
-# API Endpoint
 @app.post("/embed")
 async def embed_text(data: dict):
     text = data.get("text", "")

 from transformers import AutoTokenizer, AutoModel
 import torch
+# เปลี่ยน cache directory เป็น /tmp
 MODEL_NAME = "sentence-transformers/all-MiniLM-L6-v2"
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, cache_dir="/tmp")
+model = AutoModel.from_pretrained(MODEL_NAME, cache_dir="/tmp")
 app = FastAPI()
 def get_embedding(text):
     inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
     with torch.no_grad():
         outputs = model(**inputs)
+    embedding = outputs.last_hidden_state.mean(dim=1)
     return embedding.squeeze().tolist()
 @app.post("/embed")
 async def embed_text(data: dict):
     text = data.get("text", "")