Update app.py
Browse files
app.py
CHANGED
|
@@ -544,92 +544,111 @@ from sentence_transformers import SentenceTransformer, util
|
|
| 544 |
model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
|
| 545 |
|
| 546 |
if query:
|
|
|
|
| 547 |
found = False
|
| 548 |
-
threshold = 0.70
|
| 549 |
|
|
|
|
| 550 |
sentence_embeddings = model.encode(all_sentences, convert_to_tensor=True)
|
| 551 |
query_embedding = model.encode(query, convert_to_tensor=True)
|
| 552 |
|
|
|
|
| 553 |
similarities = util.cos_sim(query_embedding, sentence_embeddings)[0]
|
| 554 |
|
|
|
|
| 555 |
top_indices = [i for i, sim in enumerate(similarities) if sim >= threshold]
|
| 556 |
|
| 557 |
-
|
| 558 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
| 559 |
prompt = f"""
|
| 560 |
-
|
| 561 |
-
|
| 562 |
-
|
| 563 |
-
|
| 564 |
-
|
| 565 |
-
|
| 566 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
| 567 |
response = llm([
|
| 568 |
SystemMessage(content="You are a helpful assistant."),
|
| 569 |
HumanMessage(content=prompt)
|
| 570 |
])
|
| 571 |
rewritten = response.content.strip()
|
| 572 |
|
| 573 |
-
# بررسی
|
| 574 |
review_prompt = f"""
|
| 575 |
-
لطفاً بررسی کن که آیا پاسخ
|
| 576 |
-
|
| 577 |
سوال:
|
| 578 |
{query}
|
|
|
|
| 579 |
پاسخ:
|
| 580 |
{rewritten}
|
| 581 |
"""
|
|
|
|
| 582 |
review_response = llm([
|
| 583 |
SystemMessage(content="You are a helpful assistant."),
|
| 584 |
HumanMessage(content=review_prompt)
|
| 585 |
])
|
| 586 |
review_result = review_response.content.strip()
|
| 587 |
|
|
|
|
| 588 |
if "تأیید شد" in review_result:
|
| 589 |
rewritten = clean_text(rewritten)
|
| 590 |
st.markdown(f'<div class="chat-message">{rewritten}</div>', unsafe_allow_html=True)
|
|
|
|
| 591 |
elif "کمی خوب" in review_result:
|
| 592 |
final_prompt = f"""
|
| 593 |
-
|
|
|
|
| 594 |
سوال:
|
| 595 |
{query}
|
| 596 |
-
|
| 597 |
-
|
| 598 |
-
دیتا:
|
| 599 |
{rewritten}
|
|
|
|
|
|
|
| 600 |
"""
|
| 601 |
-
|
| 602 |
SystemMessage(content="You are a helpful assistant."),
|
| 603 |
HumanMessage(content=final_prompt)
|
| 604 |
])
|
| 605 |
-
|
| 606 |
-
|
| 607 |
-
|
| 608 |
else:
|
| 609 |
-
|
| 610 |
-
لطفاً برای سوال زیر پاسخی حرفهای، دقیق و روان تولید کن که مرتبط و معتبر باشد.
|
|
|
|
| 611 |
سوال:
|
| 612 |
{query}
|
| 613 |
"""
|
| 614 |
-
|
| 615 |
SystemMessage(content="You are a helpful assistant."),
|
| 616 |
-
HumanMessage(content=
|
| 617 |
])
|
| 618 |
-
|
| 619 |
-
|
| 620 |
-
st.markdown(f'<div class="chat-message">{final_answer}</div>', unsafe_allow_html=True)
|
| 621 |
|
| 622 |
-
|
| 623 |
-
|
| 624 |
-
|
|
|
|
| 625 |
|
| 626 |
-
|
| 627 |
-
|
|
|
|
| 628 |
response = llm([
|
| 629 |
SystemMessage(content="You are a helpful assistant."),
|
| 630 |
HumanMessage(content=prompt)
|
| 631 |
])
|
| 632 |
-
rewritten = response.content.strip()
|
| 633 |
-
rewritten = clean_text(rewritten)
|
| 634 |
st.markdown(f'<div class="chat-message">{rewritten}</div>', unsafe_allow_html=True)
|
| 635 |
think.empty()
|
|
|
|
|
|
| 544 |
model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
|
| 545 |
|
| 546 |
if query:
|
| 547 |
+
threshold = 0.70
|
| 548 |
found = False
|
|
|
|
| 549 |
|
| 550 |
+
# محاسبه بردارهای جملات و سوال
|
| 551 |
sentence_embeddings = model.encode(all_sentences, convert_to_tensor=True)
|
| 552 |
query_embedding = model.encode(query, convert_to_tensor=True)
|
| 553 |
|
| 554 |
+
# محاسبه شباهتها
|
| 555 |
similarities = util.cos_sim(query_embedding, sentence_embeddings)[0]
|
| 556 |
|
| 557 |
+
# استخراج اندیسهایی که شباهتشان از آستانه بیشتر است
|
| 558 |
top_indices = [i for i, sim in enumerate(similarities) if sim >= threshold]
|
| 559 |
|
| 560 |
+
if top_indices:
|
| 561 |
+
found = True
|
| 562 |
+
# ترکیب همه جملات مشابه در یک متن واحد
|
| 563 |
+
matched_sentences = "\n".join([all_sentences[i] for i in top_indices])
|
| 564 |
+
|
| 565 |
+
# ساخت پرامپت اصلی برای تولید پاسخ نهایی حرفهای
|
| 566 |
prompt = f"""
|
| 567 |
+
تعدادی پاسخ برای سوال زیر تولید شده است. لطفاً ابتدا این پاسخها را بررسی کن، سپس با در نظر گرفتن محتوای سوال و لحن آن، یک پاسخ نهایی حرفهای، دقیق و روان از داخل پاسخها ارائه کن که هم به سوال پاسخ دهد و هم از نظر نگارشی و ساختاری در سطح بالایی باشد. پاسخ نهایی باید حداکثر 2048 کاراکتر و حداقل 512 باشد، خلاصه و واضح نوشته شود و فقط به زبان فارسی باشد. از تکرار اضافی پرهیز کن و فقط از پاسخهای زیر استفاده کن. در صورت نیاز، محتوای چند پاسخ را با هم ترکیب کن.
|
| 568 |
+
|
| 569 |
+
سوال:
|
| 570 |
+
{query}
|
| 571 |
+
|
| 572 |
+
پاسخها:
|
| 573 |
+
{matched_sentences}
|
| 574 |
+
|
| 575 |
+
پاسخ نهایی حرفهای بازنویسیشده:
|
| 576 |
+
"""
|
| 577 |
+
|
| 578 |
response = llm([
|
| 579 |
SystemMessage(content="You are a helpful assistant."),
|
| 580 |
HumanMessage(content=prompt)
|
| 581 |
])
|
| 582 |
rewritten = response.content.strip()
|
| 583 |
|
| 584 |
+
# بررسی کیفیت پاسخ با یک پرامپت ارزیابی
|
| 585 |
review_prompt = f"""
|
| 586 |
+
لطفاً بررسی کن که آیا پاسخ زیر به سوال دادهشده مرتبط، دقیق و معتبر است یا خیر. اگر پاسخ قابل قبول و دقیق است بنویس 'تأیید شد'. اگر متوسط است بنویس 'کمی خوب'. اگر بیربط یا اشتباه است بنویس 'نیاز به اصلاح دارد'.
|
| 587 |
+
|
| 588 |
سوال:
|
| 589 |
{query}
|
| 590 |
+
|
| 591 |
پاسخ:
|
| 592 |
{rewritten}
|
| 593 |
"""
|
| 594 |
+
|
| 595 |
review_response = llm([
|
| 596 |
SystemMessage(content="You are a helpful assistant."),
|
| 597 |
HumanMessage(content=review_prompt)
|
| 598 |
])
|
| 599 |
review_result = review_response.content.strip()
|
| 600 |
|
| 601 |
+
# تحلیل نتیجه بررسی و نمایش پاسخ مناسب
|
| 602 |
if "تأیید شد" in review_result:
|
| 603 |
rewritten = clean_text(rewritten)
|
| 604 |
st.markdown(f'<div class="chat-message">{rewritten}</div>', unsafe_allow_html=True)
|
| 605 |
+
|
| 606 |
elif "کمی خوب" in review_result:
|
| 607 |
final_prompt = f"""
|
| 608 |
+
لطفاً برای سوال زیر پاسخی حرفهای، دقیق و روان تولید کن که مرتبط و معتبر باشد. از زبانی جز فارسی استفاده نکن. از محتوای زیر استفاده کن و یک پاسخ نهایی خوب بنویس:
|
| 609 |
+
|
| 610 |
سوال:
|
| 611 |
{query}
|
| 612 |
+
|
| 613 |
+
پاسخ اولیه:
|
|
|
|
| 614 |
{rewritten}
|
| 615 |
+
|
| 616 |
+
پاسخ نهایی:
|
| 617 |
"""
|
| 618 |
+
new_response = llm([
|
| 619 |
SystemMessage(content="You are a helpful assistant."),
|
| 620 |
HumanMessage(content=final_prompt)
|
| 621 |
])
|
| 622 |
+
final_answer = clean_text(new_response.content.strip())
|
| 623 |
+
st.markdown(f'<div class="chat-message">{final_answer}</div>', unsafe_allow_html=True)
|
| 624 |
+
|
| 625 |
else:
|
| 626 |
+
fallback_prompt = f"""
|
| 627 |
+
لطفاً برای سوال زیر پاسخی حرفهای، دقیق و روان تولید کن که مرتبط و معتبر باشد. اگر اطلاعات کافی وجود ندارد، صادقانه بگو. فقط به زبان فارسی پاسخ بده:
|
| 628 |
+
|
| 629 |
سوال:
|
| 630 |
{query}
|
| 631 |
"""
|
| 632 |
+
fallback_response = llm([
|
| 633 |
SystemMessage(content="You are a helpful assistant."),
|
| 634 |
+
HumanMessage(content=fallback_prompt)
|
| 635 |
])
|
| 636 |
+
final_fallback = clean_text(fallback_response.content.strip())
|
| 637 |
+
st.markdown(f'<div class="chat-message">{final_fallback}</div>', unsafe_allow_html=True)
|
|
|
|
| 638 |
|
| 639 |
+
else:
|
| 640 |
+
# اگر جملهای با شباهت بالا پیدا نشد
|
| 641 |
+
prompt = f"""
|
| 642 |
+
لطفاً برای سوال زیر یک متن مرتبط و معتبر تولید کن. اگر اطلاعات کافی وجود ندارد، صادقانه اعلام کن. فقط به زبان فارسی پاسخ بده:
|
| 643 |
|
| 644 |
+
سوال:
|
| 645 |
+
{query}
|
| 646 |
+
"""
|
| 647 |
response = llm([
|
| 648 |
SystemMessage(content="You are a helpful assistant."),
|
| 649 |
HumanMessage(content=prompt)
|
| 650 |
])
|
| 651 |
+
rewritten = clean_text(response.content.strip())
|
|
|
|
| 652 |
st.markdown(f'<div class="chat-message">{rewritten}</div>', unsafe_allow_html=True)
|
| 653 |
think.empty()
|
| 654 |
+
|