Spaces:

Sbnos
/

medchat2

Running on CPU Upgrade

App Files Files Community

Sbnos commited on 21 days ago

Commit

24337c4

verified ·

1 Parent(s): 47f40b7

changing

Browse files

Files changed (1) hide show

app.py +42 -34

app.py CHANGED Viewed

@@ -1,13 +1,14 @@
 import os
 import streamlit as st
 from together import Together
-from langchain.vectorstores import Chroma
-from langchain.embeddings import HuggingFaceBgeEmbeddings
 # --- Configuration ---
 TOGETHER_API_KEY = os.environ.get("pilotikval")
 if not TOGETHER_API_KEY:
-    st.error("Missing TOGETHER_API_KEY environment variable.")
     st.stop()
 # Initialize TogetherAI client
@@ -51,64 +52,71 @@ vectorstore = Chroma(
     persist_directory=persist_directory,
     embedding_function=embeddings
 )
-retriever = vectorstore.as_retriever(search_kwargs={"k":20})
-# System prompt template
 def build_system(context: str) -> dict:
-    return {"role": "system", "content": (
-        "You are a helpful assistant for medical professionals. "
-        "Use the following context from medical documents to answer the question. "
-        "If you don't know, say you don't know.\n\nContext:\n" + context
-    )}
-st.title("🩺 DocChatter RAG (Streaming)")
 # Initialize chat history
 if 'chat_history' not in st.session_state:
-    st.session_state.chat_history = []
-# Get user input (must be at top-level)
-prompt = st.chat_input("Ask anything about your docs...")
-# Tabs for display
 chat_tab, clear_tab = st.tabs(["Chat", "Clear History"])
 with chat_tab:
-    # Display conversation so far
     for msg in st.session_state.chat_history:
         st.chat_message(msg['role']).write(msg['content'])
-    # If user has just submitted
-    if prompt:
-        # Show user message
-        st.chat_message("user").write(prompt)
-        st.session_state.chat_history.append({"role": "user", "content": prompt})
-        # Retrieve context
-        docs = retriever.get_relevant_documents(prompt)
         context = "\n---\n".join([d.page_content for d in docs])
-        # Assemble messages for streaming
         messages = [build_system(context)]
-        # Include full history
         for m in st.session_state.chat_history:
-            if m['role'] in ('user','assistant'):
-                messages.append(m)
-        # Stream assistant response
         response_container = st.chat_message("assistant")
-        placeholder = response_container.empty()
         answer = ""
         for token in client.chat.completions.create(
             model="meta-llama/Llama-4-Scout-17B-16E-Instruct",
             messages=messages,
             stream=True
         ):
-            if hasattr(token, 'choices'):
                 delta = token.choices[0].delta.content
                 answer += delta
-                placeholder.write(answer)
-        # Save response
         st.session_state.chat_history.append({"role": "assistant", "content": answer})
 with clear_tab:
@@ -116,5 +124,5 @@ with clear_tab:
         st.session_state.chat_history = []
         st.experimental_rerun()
-# Optionally persist new embeddings
 # vectorstore.persist()

 import os
 import streamlit as st
 from together import Together
+from langchain_community.vectorstores import Chroma
+from langchain_community.embeddings import HuggingFaceBgeEmbeddings
 # --- Configuration ---
+# TogetherAI API key (env var name pilotikval)
 TOGETHER_API_KEY = os.environ.get("pilotikval")
 if not TOGETHER_API_KEY:
+    st.error("Missing pilotikval environment variable.")
     st.stop()
 # Initialize TogetherAI client
     persist_directory=persist_directory,
     embedding_function=embeddings
 )
+retriever = vectorstore.as_retriever(search_kwargs={"k": 20})  # k=20
+# System prompt template with instruction for detailed long answers
 def build_system(context: str) -> dict:
+    return {
+        "role": "system",
+        "content": (
+            "You are an expert medical assistant. Provide a thorough, detailed, and complete answer. "
+            "If you don't know, say you don't know.\n"
+            "Use the following context from medical docs to answer.\n\n"
+            "Context:\n" + context
+        )
+    }
+st.title("🩺 DocChatter RAG (Streaming & Memory)")
 # Initialize chat history
 if 'chat_history' not in st.session_state:
+    st.session_state.chat_history = []  # list of dicts {role, content}
+# Get user input at top level
+user_prompt = st.chat_input("Ask anything about your docs…")
+# Tabs for UI
 chat_tab, clear_tab = st.tabs(["Chat", "Clear History"])
 with chat_tab:
+    # Display existing chat
     for msg in st.session_state.chat_history:
         st.chat_message(msg['role']).write(msg['content'])
+    # On new input
+    if user_prompt:
+        # Echo user
+        st.chat_message("user").write(user_prompt)
+        st.session_state.chat_history.append({"role": "user", "content": user_prompt})
+        # Retrieve top-k docs
+        docs = retriever.get_relevant_documents(user_prompt)
         context = "\n---\n".join([d.page_content for d in docs])
+        # Build message sequence: system + full history
         messages = [build_system(context)]
         for m in st.session_state.chat_history:
+            messages.append(m)
+        # Prepare streaming response
         response_container = st.chat_message("assistant")
+        stream_placeholder = response_container.empty()
         answer = ""
+        # Stream tokens
         for token in client.chat.completions.create(
             model="meta-llama/Llama-4-Scout-17B-16E-Instruct",
             messages=messages,
+            max_tokens=22048,
+            temperature=0.1,
             stream=True
         ):
+            if hasattr(token, 'choices') and token.choices[0].delta.content:
                 delta = token.choices[0].delta.content
                 answer += delta
+                stream_placeholder.write(answer)
+        # Save assistant response
         st.session_state.chat_history.append({"role": "assistant", "content": answer})
 with clear_tab:
         st.session_state.chat_history = []
         st.experimental_rerun()
+# (Optional) persist new docs
 # vectorstore.persist()