Spaces:

avsolatorio
/

test-data-mcp-server

Sleeping

App Files Files Community

avsolatorio commited on Jul 8, 2025

Commit

8362096

1 Parent(s): 33f4b8c

Add history

Browse files

Signed-off-by: Aivin V. Solatorio <avsolatorio@gmail.com>

Files changed (1) hide show

mcp_openai_client.py +70 -12

mcp_openai_client.py CHANGED Viewed

@@ -13,6 +13,7 @@ from anthropic import Anthropic
 from anthropic._exceptions import OverloadedError
 from dotenv import load_dotenv
 from openai import OpenAI
 from openai.types.responses import (
     ResponseTextDeltaEvent,
     ResponseContentPartAddedEvent,
@@ -23,6 +24,7 @@ from openai.types.responses import (
     ResponseMcpCallCompletedEvent,
     ResponseOutputItemDoneEvent,
     ResponseOutputItemAddedEvent,
 )
 import ast
@@ -171,7 +173,10 @@ class MCPClientWrapper:
             self.session = None
     async def process_message(
-        self, message: str, history: List[Union[Dict[str, Any], ChatMessage]]
     ):
         if not self.session and LLM_PROVIDER == "anthropic":
             messages = history + [
@@ -181,7 +186,7 @@ class MCPClientWrapper:
                     "content": "Please connect to an MCP server first by reloading the page.",
                 },
             ]
-            yield messages, gr.Textbox(value="")
         else:
             messages = history + [
                 {"role": "user", "content": message},
@@ -191,13 +196,15 @@ class MCPClientWrapper:
                 },
             ]
-            yield messages, gr.Textbox(value="")
             # simulate thinking with asyncio.sleep
             await asyncio.sleep(0.1)
             messages.pop(-1)
             is_delta = False
-            async for partial in self._process_query(message, history):
                 if partial[-1].get("delta"):
                     if not is_delta:
                         is_delta = True
@@ -208,12 +215,25 @@ class MCPClientWrapper:
                             }
                         )
                     messages[-1]["content"] += partial[-1]["delta"]
                 else:
                     is_delta = False
                     messages.extend(partial)
                     print(partial)
-                yield messages, gr.Textbox(value="")
                 await asyncio.sleep(0.01)
                 if (
@@ -227,7 +247,10 @@ class MCPClientWrapper:
             fl.write(json.dumps(dict(time=f"{datetime.now()}", messages=messages)))
     async def _process_query_openai(
-        self, message: str, history: List[Union[Dict[str, Any], ChatMessage]]
     ):
         response = self.openai.responses.create(
             model=OPENAI_MODEL,
@@ -247,14 +270,24 @@ class MCPClientWrapper:
             input=message,
             parallel_tool_calls=False,
             stream=True,
             temperature=0,
         )
         is_tool_call = False
         tool_name = None
         tool_args = None
         for event in response:
-            if (
                 isinstance(event, ResponseOutputItemAddedEvent)
                 and event.item.type == "mcp_call"
             ):
@@ -553,14 +586,36 @@ class MCPClientWrapper:
                 contents.extend(next_response.content)
     async def _process_query(
-        self, message: str, history: List[Union[Dict[Any, Any], ChatMessage]]
     ):
         if LLM_PROVIDER == "anthropic":
             async for partial in self._process_query_anthropic(message, history):
                 yield partial
         elif LLM_PROVIDER == "openai":
-            async for partial in self._process_query_openai(message, history):
-                yield partial
 def gradio_interface(
@@ -625,6 +680,9 @@ def gradio_interface(
                 layout="panel",
                 placeholder="Ask development data questions!",
             )
             with gr.Row(equal_height=True):
                 msg = gr.Textbox(
@@ -647,8 +705,8 @@ def gradio_interface(
             msg.submit(
                 client.process_message,
-                [msg, chatbot],
-                [chatbot, msg],
                 concurrency_limit=10,
             )
             # clear_btn.click(lambda: [], None, chatbot)

 from anthropic._exceptions import OverloadedError
 from dotenv import load_dotenv
 from openai import OpenAI
+import openai
 from openai.types.responses import (
     ResponseTextDeltaEvent,
     ResponseContentPartAddedEvent,
     ResponseMcpCallCompletedEvent,
     ResponseOutputItemDoneEvent,
     ResponseOutputItemAddedEvent,
+    ResponseCompletedEvent,
 )
 import ast
             self.session = None
     async def process_message(
+        self,
+        message: str,
+        history: List[Union[Dict[str, Any], ChatMessage]],
+        previous_response_id: str = None,
     ):
         if not self.session and LLM_PROVIDER == "anthropic":
             messages = history + [
                     "content": "Please connect to an MCP server first by reloading the page.",
                 },
             ]
+            yield messages, gr.Textbox(value=""), gr.Textbox(value=previous_response_id)
         else:
             messages = history + [
                 {"role": "user", "content": message},
                 },
             ]
+            yield messages, gr.Textbox(value=""), gr.Textbox(value=previous_response_id)
             # simulate thinking with asyncio.sleep
             await asyncio.sleep(0.1)
             messages.pop(-1)
             is_delta = False
+            async for partial in self._process_query(
+                message, history, previous_response_id
+            ):
                 if partial[-1].get("delta"):
                     if not is_delta:
                         is_delta = True
                             }
                         )
                     messages[-1]["content"] += partial[-1]["delta"]
+                elif partial[-1].get("response_id"):
+                    previous_response_id = partial[-1]["response_id"]
+                    yield (
+                        messages,
+                        gr.Textbox(value=""),
+                        gr.Textbox(value=previous_response_id),
+                    )
+                    await asyncio.sleep(0.01)
+                    continue
                 else:
                     is_delta = False
                     messages.extend(partial)
                     print(partial)
+                yield (
+                    messages,
+                    gr.Textbox(value=""),
+                    gr.Textbox(value=previous_response_id),
+                )
                 await asyncio.sleep(0.01)
                 if (
             fl.write(json.dumps(dict(time=f"{datetime.now()}", messages=messages)))
     async def _process_query_openai(
+        self,
+        message: str,
+        history: List[Union[Dict[str, Any], ChatMessage]],
+        previous_response_id: str = None,
     ):
         response = self.openai.responses.create(
             model=OPENAI_MODEL,
             input=message,
             parallel_tool_calls=False,
             stream=True,
+            max_output_tokens=32768,
             temperature=0,
+            previous_response_id=previous_response_id
+            if previous_response_id.strip()
+            else None,
         )
         is_tool_call = False
         tool_name = None
         tool_args = None
         for event in response:
+            if isinstance(event, ResponseCompletedEvent):
+                yield [
+                    {
+                        "response_id": event.response.id,
+                    }
+                ]
+            elif (
                 isinstance(event, ResponseOutputItemAddedEvent)
                 and event.item.type == "mcp_call"
             ):
                 contents.extend(next_response.content)
     async def _process_query(
+        self,
+        message: str,
+        history: List[Union[Dict[Any, Any], ChatMessage]],
+        previous_response_id: str = None,
     ):
         if LLM_PROVIDER == "anthropic":
             async for partial in self._process_query_anthropic(message, history):
                 yield partial
         elif LLM_PROVIDER == "openai":
+            try:
+                async for partial in self._process_query_openai(
+                    message, history, previous_response_id
+                ):
+                    yield partial
+            except openai.APIError as e:
+                print(e)
+                yield [
+                    {
+                        "role": "assistant",
+                        "content": "The LLM encountered an error. Please try again or reload the page.",
+                    }
+                ]
+            except Exception as e:
+                print(e)
+                yield [
+                    {
+                        "role": "assistant",
+                        "content": f"Sorry, I encountered an unexpected error: `{e}`. Please try again or reload the page.",
+                    }
+                ]
 def gradio_interface(
                 layout="panel",
                 placeholder="Ask development data questions!",
             )
+            previous_response_id = gr.Textbox(
+                label="Previous Response ID", interactive=False, visible=False
+            )
             with gr.Row(equal_height=True):
                 msg = gr.Textbox(
             msg.submit(
                 client.process_message,
+                [msg, chatbot, previous_response_id],
+                [chatbot, msg, previous_response_id],
                 concurrency_limit=10,
             )
             # clear_btn.click(lambda: [], None, chatbot)