Final_Assignment_Template

Sleeping

Markiian Tsalyk commited on May 5

Commit

783d369

1 Parent(s): 8eea4d3

New transcript tool

Files changed (3) hide show

__pycache__/tools.cpython-313.pyc CHANGED Viewed

Binary files a/__pycache__/tools.cpython-313.pyc and b/__pycache__/tools.cpython-313.pyc differ

requirements.txt CHANGED Viewed

@@ -12,4 +12,5 @@ llama-index-llms-openrouter
 wikipedia
 youtube-transcript-api
 python-dotenv
-openpyxl

 wikipedia
 youtube-transcript-api
 python-dotenv
+openpyxl
+supadata

tools.py CHANGED Viewed

@@ -1,5 +1,6 @@
 from smolagents import DuckDuckGoSearchTool, GoogleSearchTool
 from youtube_transcript_api import YouTubeTranscriptApi
 import wikipedia
 from wikipedia_tables_parser import fetch_wikipedia_tables
 import pandas as pd
@@ -21,6 +22,7 @@ llm = OpenRouter(
     model="google/gemini-2.5-flash-preview",
     temperature=0.7,
 )
 def reverse_text(text: str, **kwargs) -> str:
@@ -254,7 +256,7 @@ def execute_python_file(file_path: str) -> Any:
             del sys.modules[module_name]
-def trascript_youtube(video_id: str, **kwargs) -> list:
     """
     Returns transcript of YouTube video.
@@ -264,10 +266,9 @@ def trascript_youtube(video_id: str, **kwargs) -> list:
     Return:
     Transcript of YouTube video.
     """
-    ytt_api = YouTubeTranscriptApi()
-    result = ytt_api.fetch(video_id)
-    return result.snippets
 def read_excel(path: str, **kwargs) -> pd.DataFrame:

 from smolagents import DuckDuckGoSearchTool, GoogleSearchTool
 from youtube_transcript_api import YouTubeTranscriptApi
+from supadata import Supadata, SupadataError
 import wikipedia
 from wikipedia_tables_parser import fetch_wikipedia_tables
 import pandas as pd
     model="google/gemini-2.5-flash-preview",
     temperature=0.7,
 )
+supadata = Supadata(api_key=os.getenv("SUPADATA_API_KEY"))
 def reverse_text(text: str, **kwargs) -> str:
             del sys.modules[module_name]
+def trascript_youtube(video_id: str, **kwargs) -> str:
     """
     Returns transcript of YouTube video.
     Return:
     Transcript of YouTube video.
     """
+    transcript = supadata.youtube.transcript(video_id=video_id, lang="en")
+    return transcript.content
 def read_excel(path: str, **kwargs) -> pd.DataFrame: