NH-Korea

Running

App Files Files Community

ginipick commited on Apr 26

Commit

3ab6484

verified ·

1 Parent(s): eaabaee

Update app-backup3.py

Browse files

Files changed (1) hide show

app-backup3.py +443 -19

app-backup3.py CHANGED Viewed

@@ -95,6 +95,90 @@ def load_agriculture_dataset():
         logging.error(f"Error loading Kaggle dataset: {e}")
         return None
 def get_dataset_summary():
     """Generate a summary of the available agriculture datasets"""
     dataset_info = load_agriculture_dataset()
@@ -228,7 +312,287 @@ def analyze_dataset_for_query(query):
     analysis_result += "이 분석은 UN 글로벌 식량 및 농업 통계 데이터셋을 기반으로 합니다.\n\n"
     return analysis_result
 # ──────────────────────────────── System Prompt ─────────────────────────
 def get_system_prompt(mode="price_forecast", style="professional", include_search_results=True, include_uploaded_files=False) -> str:
     """
@@ -245,6 +609,8 @@ def get_system_prompt(mode="price_forecast", style="professional", include_searc
 3. 데이터를 바탕으로 명확하고 근거 있는 분석 제공
 4. 관련 정보와 인사이트를 체계적으로 구성하여 제시
 5. 시각적 이해를 돕기 위해 차트, 그래프 등을 적절히 활용
 중요 가이드라인:
 - 데이터에 기반한 객관적 분석을 제공하세요
@@ -305,12 +671,41 @@ def get_system_prompt(mode="price_forecast", style="professional", include_searc
     }
     dataset_guide = """
-UN 글로벌 식량 및 농업 통계 데이터셋 활용 지침:
-- 제공된 데이터셋 분석 결과를 응답의 주요 근거로 사용하세요
 - 데이터의 출처와 연도를 명확히 인용하세요
 - 데이터셋 내 주요 변수 간의 관계를 분석하여 인사이트를 도출하세요
 - 데이터의 한계와 불확실성을 투명하게 언급하세요
 - 필요시 데이터 격차를 식별하고 추가 연구가 필요한 영역을 제안하세요
 """
     search_guide = """
@@ -346,8 +741,14 @@ UN 글로벌 식량 및 농업 통계 데이터셋 활용 지침:
     if style in style_guides:
         final_prompt += f"\n\n분석 스타일: {style_guides[style]}"
-    # Always include dataset guide
     final_prompt += f"\n\n{dataset_guide}"
     if include_search_results:
         final_prompt += f"\n\n{search_guide}"
@@ -381,8 +782,6 @@ def brave_search(query: str, count: int = 10):
             r.raise_for_status()
             data = r.json()
-            logging.info(f"Brave search result data structure: {list(data.keys())}")
             raw = data.get("web", {}).get("results") or data.get("results", [])
             if not raw:
                 logging.warning(f"No Brave search results found. Response: {data}")
@@ -400,7 +799,6 @@ def brave_search(query: str, count: int = 10):
                     "displayed_link": host
                 })
-            logging.info(f"Brave search success: {len(arts)} results")
             return arts
         except Exception as e:
@@ -434,7 +832,6 @@ def brave_video_search(query: str, count: int = 3):
                     "source": vid.get("provider", {}).get("name", "Unknown source")
                 })
-            logging.info(f"Brave video search success: {len(results)} results")
             return results
         except Exception as e:
@@ -469,7 +866,6 @@ def brave_news_search(query: str, count: int = 3):
                     "date": news.get("age", "Unknown date")
                 })
-            logging.info(f"Brave news search success: {len(results)} results")
             return results
         except Exception as e:
@@ -716,6 +1112,8 @@ def agricultural_price_forecast_app():
         st.session_state.analysis_mode = "price_forecast"
     if "response_style" not in st.session_state:
         st.session_state.response_style = "professional"
     sb = st.sidebar
     sb.title("분석 설정")
@@ -748,6 +1146,17 @@ def agricultural_price_forecast_app():
         key="response_style"
     )
     # Example queries
     sb.subheader("예시 질문")
     c1, c2, c3 = sb.columns(3)
@@ -929,18 +1338,27 @@ def process_input(query: str, uploaded_files):
             status.update(label="농업 데이터셋 분석 중...")
             with st.spinner("데이터셋 분석 중..."):
                 dataset_analysis = analyze_dataset_for_query(query)
             if use_web_search:
-                status.update(label="웹 검색 수행 중...")
-                with st.spinner("웹 검색 중..."):
                     search_content = do_web_search(keywords(query, top=5))
-                try:
-                    status.update(label="비디오 검색 중...")
                     video_results = brave_video_search(query, 2)
-                    news_results  = brave_news_search(query, 3)
-                except Exception as search_err:
-                    logging.error(f"미디어 검색 오류: {search_err}")
             file_content = None
             if has_uploaded_files:
@@ -972,8 +1390,14 @@ def process_input(query: str, uploaded_files):
             ]
             user_content = query
-            # 항상 데이터셋 분석 결과 포함
             user_content += "\n\n" + dataset_analysis
             if search_content:
                 user_content += "\n\n" + search_content
@@ -1077,4 +1501,4 @@ def main():
     agricultural_price_forecast_app()
 if __name__ == "__main__":
-    main()

         logging.error(f"Error loading Kaggle dataset: {e}")
         return None
+# New function to load Advanced Soybean Agricultural Dataset
+@st.cache_resource
+def load_soybean_dataset():
+    """Download and load the Advanced Soybean Agricultural Dataset from Kaggle"""
+    try:
+        path = kagglehub.dataset_download("wisam1985/advanced-soybean-agricultural-dataset-2025")
+        logging.info(f"Soybean dataset downloaded to: {path}")
+        available_files = []
+        for root, dirs, files in os.walk(path):
+            for file in files:
+                if file.endswith(('.csv', '.xlsx')):
+                    file_path = os.path.join(root, file)
+                    file_size = os.path.getsize(file_path) / (1024 * 1024)  # Size in MB
+                    available_files.append({
+                        'name': file,
+                        'path': file_path,
+                        'size_mb': round(file_size, 2)
+                    })
+        return {
+            'base_path': path,
+            'files': available_files
+        }
+    except Exception as e:
+        logging.error(f"Error loading Soybean dataset: {e}")
+        return None
+# Function to load Crop Recommendation Dataset
+@st.cache_resource
+def load_crop_recommendation_dataset():
+    """Download and load the Soil and Environmental Variables Crop Recommendation Dataset"""
+    try:
+        path = kagglehub.dataset_download("agriinnovate/agricultural-crop-dataset")
+        logging.info(f"Crop recommendation dataset downloaded to: {path}")
+        available_files = []
+        for root, dirs, files in os.walk(path):
+            for file in files:
+                if file.endswith(('.csv', '.xlsx')):
+                    file_path = os.path.join(root, file)
+                    file_size = os.path.getsize(file_path) / (1024 * 1024)  # Size in MB
+                    available_files.append({
+                        'name': file,
+                        'path': file_path,
+                        'size_mb': round(file_size, 2)
+                    })
+        return {
+            'base_path': path,
+            'files': available_files
+        }
+    except Exception as e:
+        logging.error(f"Error loading Crop recommendation dataset: {e}")
+        return None
+# Function to load Climate Change Impact Dataset
+@st.cache_resource
+def load_climate_impact_dataset():
+    """Download and load the Climate Change Impact on Agriculture Dataset"""
+    try:
+        path = kagglehub.dataset_download("waqi786/climate-change-impact-on-agriculture")
+        logging.info(f"Climate impact dataset downloaded to: {path}")
+        available_files = []
+        for root, dirs, files in os.walk(path):
+            for file in files:
+                if file.endswith(('.csv', '.xlsx')):
+                    file_path = os.path.join(root, file)
+                    file_size = os.path.getsize(file_path) / (1024 * 1024)  # Size in MB
+                    available_files.append({
+                        'name': file,
+                        'path': file_path,
+                        'size_mb': round(file_size, 2)
+                    })
+        return {
+            'base_path': path,
+            'files': available_files
+        }
+    except Exception as e:
+        logging.error(f"Error loading Climate impact dataset: {e}")
+        return None
 def get_dataset_summary():
     """Generate a summary of the available agriculture datasets"""
     dataset_info = load_agriculture_dataset()
     analysis_result += "이 분석은 UN 글로벌 식량 및 농업 통계 데이터셋을 기반으로 합니다.\n\n"
     return analysis_result
+# Function to analyze crop recommendation dataset
+def analyze_crop_recommendation_dataset(query):
+    """Find and analyze crop recommendation data based on the query"""
+    try:
+        dataset_info = load_crop_recommendation_dataset()
+        if not dataset_info or not dataset_info['files']:
+            return "작물 추천 데이터셋을 불러올 수 없습니다."
+        analysis_result = "# 토양 및 환경 변수 기반 작물 추천 데이터 분석\n\n"
+        # Process main files
+        for file_info in dataset_info['files'][:2]:  # Limit to the first 2 files
+            try:
+                analysis_result += f"## 파일: {file_info['name']}\n\n"
+                if file_info['name'].endswith('.csv'):
+                    df = pd.read_csv(file_info['path'])
+                elif file_info['name'].endswith('.xlsx'):
+                    df = pd.read_excel(file_info['path'])
+                else:
+                    continue
+                # Basic dataset info
+                analysis_result += f"- 데이터 크기: {len(df)} 행 × {len(df.columns)} 열\n"
+                analysis_result += f"- 포함된 작물 종류: "
+                # Check if crop column exists
+                crop_cols = [col for col in df.columns if 'crop' in col.lower() or '작물' in col.lower()]
+                if crop_cols:
+                    main_crop_col = crop_cols[0]
+                    unique_crops = df[main_crop_col].unique()
+                    analysis_result += f"{len(unique_crops)}종 ({', '.join(str(c) for c in unique_crops[:10])})\n\n"
+                else:
+                    analysis_result += "작물 정보 열을 찾을 수 없음\n\n"
+                # Extract environmental factors
+                env_factors = [col for col in df.columns if col.lower() not in ['crop', 'label', 'id', 'index']]
+                if env_factors:
+                    analysis_result += f"- 고려된 환경 요소: {', '.join(env_factors)}\n\n"
+                # Sample data
+                analysis_result += "### 데이터 샘플:\n\n"
+                analysis_result += df.head(5).to_markdown() + "\n\n"
+                # Summary statistics for environmental factors
+                if env_factors:
+                    numeric_factors = df[env_factors].select_dtypes(include=['number']).columns
+                    if len(numeric_factors) > 0:
+                        analysis_result += "### 환경 요소 통계:\n\n"
+                        stats_df = df[numeric_factors].describe().round(2)
+                        analysis_result += stats_df.to_markdown() + "\n\n"
+                # Check for query-specific crops
+                query_terms = query.lower().split()
+                relevant_crops = []
+                if crop_cols:
+                    for crop in df[main_crop_col].unique():
+                        crop_str = str(crop).lower()
+                        if any(term in crop_str for term in query_terms):
+                            relevant_crops.append(crop)
+                if relevant_crops:
+                    analysis_result += f"### 쿼리 관련 작물 분석: {', '.join(str(c) for c in relevant_crops)}\n\n"
+                    for crop in relevant_crops[:3]:  # Limit to 3 crops
+                        crop_data = df[df[main_crop_col] == crop]
+                        analysis_result += f"#### {crop} 작물 요약:\n\n"
+                        analysis_result += f"- 샘플 수: {len(crop_data)}개\n"
+                        if len(numeric_factors) > 0:
+                            crop_stats = crop_data[numeric_factors].describe().round(2)
+                            analysis_result += f"- 평균 환경 조건:\n"
+                            for factor in numeric_factors[:5]:  # Limit to 5 factors
+                                analysis_result += f"  * {factor}: {crop_stats.loc['mean', factor]}\n"
+                        analysis_result += "\n"
+            except Exception as e:
+                logging.error(f"Error analyzing crop recommendation file {file_info['name']}: {e}")
+                analysis_result += f"분석 오류: {str(e)}\n\n"
+        analysis_result += "## 작물 추천 인사이트\n\n"
+        analysis_result += "토양 및 환경 변수 데이터셋 분석 결과, 다음과 같은 주요 인사이트를 제공합니다:\n\n"
+        analysis_result += "1. 지역 환경에 적합한 작물 추천\n"
+        analysis_result += "2. 작물 생산성에 영향을 미치는 주요 환경 요인\n"
+        analysis_result += "3. 지속 가능한 농업을 위한 최적의 작물 선택 기준\n\n"
+        return analysis_result
+    except Exception as e:
+        logging.error(f"Crop recommendation dataset analysis error: {e}")
+        return "작물 추천 데이터셋 분석 중 오류가 발생했습니다."
+# Function to analyze climate impact dataset
+def analyze_climate_impact_dataset(query):
+    """Find and analyze climate impact on agriculture data based on the query"""
+    try:
+        dataset_info = load_climate_impact_dataset()
+        if not dataset_info or not dataset_info['files']:
+            return "기후 변화 영향 데이터셋을 불러올 수 없습니다."
+        analysis_result = "# 기후 변화가 농업에 미치는 영향 데이터 분석\n\n"
+        # Process main files
+        for file_info in dataset_info['files'][:2]:  # Limit to first 2 files
+            try:
+                analysis_result += f"## 파일: {file_info['name']}\n\n"
+                if file_info['name'].endswith('.csv'):
+                    df = pd.read_csv(file_info['path'])
+                elif file_info['name'].endswith('.xlsx'):
+                    df = pd.read_excel(file_info['path'])
+                else:
+                    continue
+                # Basic dataset info
+                analysis_result += f"- 데이터 크기: {len(df)} 행 × {len(df.columns)} 열\n"
+                # Check for region column
+                region_cols = [col for col in df.columns if 'region' in col.lower() or 'country' in col.lower() or '지역' in col.lower()]
+                if region_cols:
+                    main_region_col = region_cols[0]
+                    regions = df[main_region_col].unique()
+                    analysis_result += f"- 포함된 지역: {len(regions)}개 ({', '.join(str(r) for r in regions[:5])})\n"
+                # Identify climate and crop related columns
+                climate_cols = [col for col in df.columns if any(term in col.lower() for term in
+                                ['temp', 'rainfall', 'precipitation', 'climate', 'weather', '기온', '강수량'])]
+                crop_cols = [col for col in df.columns if any(term in col.lower() for term in
+                            ['yield', 'production', 'crop', 'harvest', '수확량', '생산량'])]
+                if climate_cols:
+                    analysis_result += f"- 기후 관련 변수: {', '.join(climate_cols)}\n"
+                if crop_cols:
+                    analysis_result += f"- 작물 관련 변수: {', '.join(crop_cols)}\n\n"
+                # Sample data
+                analysis_result += "### 데이터 샘플:\n\n"
+                analysis_result += df.head(5).to_markdown() + "\n\n"
+                # Time series pattern if available
+                year_cols = [col for col in df.columns if 'year' in col.lower() or 'date' in col.lower() or '연도' in col.lower()]
+                if year_cols:
+                    analysis_result += "### 시계열 기후 영향 패턴:\n\n"
+                    analysis_result += "이 데이터셋은 시간에 따른 기후 변화와 농업 생산성 간의 관계를 분석할 수 있습니다.\n\n"
+                # Statistical summary of key variables
+                key_vars = climate_cols + crop_cols
+                numeric_vars = df[key_vars].select_dtypes(include=['number']).columns
+                if len(numeric_vars) > 0:
+                    analysis_result += "### 주요 변수 통계:\n\n"
+                    stats_df = df[numeric_vars].describe().round(2)
+                    analysis_result += stats_df.to_markdown() + "\n\n"
+                # Check for correlations between climate and crop variables
+                if len(climate_cols) > 0 and len(crop_cols) > 0:
+                    numeric_climate = df[climate_cols].select_dtypes(include=['number']).columns
+                    numeric_crop = df[crop_cols].select_dtypes(include=['number']).columns
+                    if len(numeric_climate) > 0 and len(numeric_crop) > 0:
+                        analysis_result += "### 기후와 작물 생산 간의 상관관계:\n\n"
+                        try:
+                            corr_vars = list(numeric_climate)[:2] + list(numeric_crop)[:2]  # Limit to 2 of each type
+                            corr_df = df[corr_vars].corr().round(3)
+                            analysis_result += corr_df.to_markdown() + "\n\n"
+                            analysis_result += "위 상관관계 표는 기후 변수와 작물 생산성 간의 관계 강도를 보여줍니다.\n\n"
+                        except:
+                            analysis_result += "상관관계 계산 중 오류가 발생했습니다.\n\n"
+            except Exception as e:
+                logging.error(f"Error analyzing climate impact file {file_info['name']}: {e}")
+                analysis_result += f"분석 오류: {str(e)}\n\n"
+        analysis_result += "## 기후 변화 영향 인사이트\n\n"
+        analysis_result += "기후 변화가 농업에 미치는 영향 데이터 분석 결과, 다음과 같은 인사이트를 제공합니다:\n\n"
+        analysis_result += "1. 기온 변화에 따른 작물 생산성 변동 패턴\n"
+        analysis_result += "2. 강수량 변화가 농업 수확량에 미치는 영향\n"
+        analysis_result += "3. 기후 변화에 대응하기 위한 농업 전략 제안\n"
+        analysis_result += "4. 지역별 기후 취약성 및 적응 방안\n\n"
+        return analysis_result
+    except Exception as e:
+        logging.error(f"Climate impact dataset analysis error: {e}")
+        return "기후 변화 영향 데이터셋 분석 중 오류가 발생했습니다."
+# Function to analyze soybean dataset if selected
+def analyze_soybean_dataset(query):
+    """Find and analyze soybean agriculture data based on the query"""
+    try:
+        dataset_info = load_soybean_dataset()
+        if not dataset_info or not dataset_info['files']:
+            return "대두 농업 데이터셋을 불러올 수 없습니다."
+        analysis_result = "# 고급 대두 농업 데이터 분석\n\n"
+        # Process main files
+        for file_info in dataset_info['files'][:2]:  # Limit to the first 2 files
+            try:
+                analysis_result += f"## 파일: {file_info['name']}\n\n"
+                if file_info['name'].endswith('.csv'):
+                    df = pd.read_csv(file_info['path'])
+                elif file_info['name'].endswith('.xlsx'):
+                    df = pd.read_excel(file_info['path'])
+                else:
+                    continue
+                # Basic file stats
+                analysis_result += f"- 데이터 크기: {len(df)} 행 × {len(df.columns)} 열\n"
+                # Check for region/location columns
+                location_cols = [col for col in df.columns if any(term in col.lower() for term in
+                                ['region', 'location', 'area', 'country', '지역'])]
+                if location_cols:
+                    main_loc_col = location_cols[0]
+                    locations = df[main_loc_col].unique()
+                    analysis_result += f"- 포함된 지역: {len(locations)}개 ({', '.join(str(loc) for loc in locations[:5])})\n"
+                # Identify yield and production columns
+                yield_cols = [col for col in df.columns if any(term in col.lower() for term in
+                             ['yield', 'production', 'harvest', '수확량', '생산량'])]
+                if yield_cols:
+                    analysis_result += f"- 생산성 관련 변수: {', '.join(yield_cols)}\n"
+                # Identify environmental factors
+                env_cols = [col for col in df.columns if any(term in col.lower() for term in
+                           ['temp', 'rainfall', 'soil', 'fertilizer', 'nutrient', 'irrigation',
+                            '기온', '강수량', '토양', '비료', '관개'])]
+                if env_cols:
+                    analysis_result += f"- 환경 관련 변수: {', '.join(env_cols)}\n\n"
+                # Sample data
+                analysis_result += "### 데이터 샘플:\n\n"
+                analysis_result += df.head(5).to_markdown() + "\n\n"
+                # Statistical summary of key variables
+                key_vars = yield_cols + env_cols
+                numeric_vars = df[key_vars].select_dtypes(include=['number']).columns
+                if len(numeric_vars) > 0:
+                    analysis_result += "### 주요 변수 통계:\n\n"
+                    stats_df = df[numeric_vars].describe().round(2)
+                    analysis_result += stats_df.to_markdown() + "\n\n"
+                # Time series analysis if possible
+                year_cols = [col for col in df.columns if 'year' in col.lower() or 'date' in col.lower() or '연도' in col.lower()]
+                if year_cols:
+                    analysis_result += "### 시계열 생산성 패턴:\n\n"
+                    analysis_result += "이 데이터셋은 시간에 따른 대두 생산성의 변화를 추적할 수 있습니다.\n\n"
+                # Check for correlations between environmental factors and yield
+                if len(env_cols) > 0 and len(yield_cols) > 0:
+                    numeric_env = df[env_cols].select_dtypes(include=['number']).columns
+                    numeric_yield = df[yield_cols].select_dtypes(include=['number']).columns
+                    if len(numeric_env) > 0 and len(numeric_yield) > 0:
+                        analysis_result += "### 환경 요소와 대두 생산성 간의 상관관계:\n\n"
+                        try:
+                            corr_vars = list(numeric_env)[:3] + list(numeric_yield)[:2]  # Limit variables
+                            corr_df = df[corr_vars].corr().round(3)
+                            analysis_result += corr_df.to_markdown() + "\n\n"
+                        except:
+                            analysis_result += "상관관계 계산 중 오류가 발생했습니다.\n\n"
+            except Exception as e:
+                logging.error(f"Error analyzing soybean file {file_info['name']}: {e}")
+                analysis_result += f"분석 오류: {str(e)}\n\n"
+        analysis_result += "## 대두 농업 인사이트\n\n"
+        analysis_result += "고급 대두 농업 데이터셋 분석 결과, 다음과 같은 인사이트를 제공합니다:\n\n"
+        analysis_result += "1. 최적의 대두 생산을 위한 환경 조건\n"
+        analysis_result += "2. 지역별 대두 생산성 변화 패턴\n"
+        analysis_result += "3. 생산성 향상을 위한 농업 기술 및 접근법\n"
+        analysis_result += "4. 시장 수요에 맞는 대두 품종 선택 가이드\n\n"
+        return analysis_result
+    except Exception as e:
+        logging.error(f"Soybean dataset analysis error: {e}")
+        return "대두 농업 데이터셋 분석 중 오류가 발생했습니다."
 # ──────────────────────────────── System Prompt ─────────────────────────
 def get_system_prompt(mode="price_forecast", style="professional", include_search_results=True, include_uploaded_files=False) -> str:
     """
 3. 데이터를 바탕으로 명확하고 근거 있는 분석 제공
 4. 관련 정보와 인사이트를 체계적으로 구성하여 제시
 5. 시각적 이해를 돕기 위해 차트, 그래프 등을 적절히 활용
+6. 토양 및 환경 변수 기반 작물 추천 데이터셋에서 추출한 인사이트 적용
+7. 기후 변화가 농업에 미치는 영향 데이터셋을 통한 환경 변화 시나리오 분석
 중요 가이드라인:
 - 데이터에 기반한 객관적 분석을 제공하세요
     }
     dataset_guide = """
+농업 데이터셋 활용 지침:
+- UN 글로벌 식량 및 농업 통계 데이터셋을 기본 분석의 근거로 사용하세요
+- 토양 및 환경 변수 기반 작물 추천 데이터셋의 인사이트를 작물 선택 및 재배 조건 분석에 통합하세요
+- 기후 변화가 농업에 미치는 영향 데이터셋의 정보를 지속 가능성 및 미래 전망 분석에 활용하세요
 - 데이터의 출처와 연도를 명확히 인용하세요
 - 데이터셋 내 주요 변수 간의 관계를 분석하여 인사이트를 도출하세요
 - 데이터의 한계와 불확실성을 투명하게 언급하세요
 - 필요시 데이터 격차를 식별하고 추가 연구가 필요한 영역을 제안하세요
+"""
+    soybean_guide = """
+고급 대두 농업 데이터셋 활용 지침:
+- 대두 생산 조건 및 수확량 패턴을 다른 작물과 비교하여 분석하세요
+- 대두 농업의 경제적 가치와 시장 기회에 대한 인사이트를 제공하세요
+- 대두 생산성에 영향을 미치는 주요 환경 요인을 강조하세요
+- 대두 재배 기술 혁신과 수익성 향상 방안을 제안하세요
+- 지속 가능한 대두 농업을 위한 실질적인 접근법을 공유하세요
+"""
+    crop_recommendation_guide = """
+토양 및 환경 변수 기반 작물 추천 활용 지침:
+- 지역 특성에 맞는 최적의 작물 선택 기준을 제시하세요
+- 토양 조건과 작물 적합성 간의 상관관계를 분석하세요
+- 환경 변수에 따른 작물 생산성 예측 모델을 활용하세요
+- 농업 생산성과 수익성 향상을 위한 작물 선택 전략을 제안하세요
+- 지속 가능한 농업을 위한 작물 다양화 접근법을 권장하세요
+"""
+    climate_impact_guide = """
+기후 변화가 농업에 미치는 영향 데이터셋 활용 지침:
+- 기후 변화 시나리오에 따른 작물 생산성 변화를 예측하세요
+- 기후 적응형 농업 기술 및 전략을 제안하세요
+- 지역별 기후 위험 요소와 대응 방안을 분석하세요
+- 기후 변화에 대응하기 위한 작물 선택 및 재배 시기 조정 방안을 제시하세요
+- 기후 변화가 농산물 가격 및 시장 동향에 미치는 영향을 평가하세요
 """
     search_guide = """
     if style in style_guides:
         final_prompt += f"\n\n분석 스타일: {style_guides[style]}"
+    # Always include dataset guides
     final_prompt += f"\n\n{dataset_guide}"
+    final_prompt += f"\n\n{crop_recommendation_guide}"
+    final_prompt += f"\n\n{climate_impact_guide}"
+    # Conditionally add soybean dataset guide if selected in UI
+    if st.session_state.get('use_soybean_dataset', False):
+        final_prompt += f"\n\n{soybean_guide}"
     if include_search_results:
         final_prompt += f"\n\n{search_guide}"
             r.raise_for_status()
             data = r.json()
             raw = data.get("web", {}).get("results") or data.get("results", [])
             if not raw:
                 logging.warning(f"No Brave search results found. Response: {data}")
                     "displayed_link": host
                 })
             return arts
         except Exception as e:
                     "source": vid.get("provider", {}).get("name", "Unknown source")
                 })
             return results
         except Exception as e:
                     "date": news.get("age", "Unknown date")
                 })
             return results
         except Exception as e:
         st.session_state.analysis_mode = "price_forecast"
     if "response_style" not in st.session_state:
         st.session_state.response_style = "professional"
+    if "use_soybean_dataset" not in st.session_state:
+        st.session_state.use_soybean_dataset = False
     sb = st.sidebar
     sb.title("분석 설정")
         key="response_style"
     )
+    # Dataset selection
+    sb.subheader("데이터셋 선택")
+    sb.checkbox(
+        "고급 대두 농업 데이터셋 사용",
+        key="use_soybean_dataset",
+        help="대두(콩) 관련 질문에 더 정확한 정보를 제공합니다."
+    )
+    # Always enabled datasets info
+    sb.info("기본 활성화된 데이터셋:\n- UN 글로벌 식량 및 농업 통계\n- 토양 및 환경 변수 기반 작물 추천\n- 기후 변화가 농업에 미치는 영향")
     # Example queries
     sb.subheader("예시 질문")
     c1, c2, c3 = sb.columns(3)
             status.update(label="농업 데이터셋 분석 중...")
             with st.spinner("데이터셋 분석 중..."):
                 dataset_analysis = analyze_dataset_for_query(query)
+                # 항상 포함되는 추가 데이터셋 분석
+                crop_recommendation_analysis = analyze_crop_recommendation_dataset(query)
+                climate_impact_analysis = analyze_climate_impact_dataset(query)
+                #
+# 조건부 데이터셋 분석
+                soybean_analysis = None
+                if st.session_state.use_soybean_dataset:
+                    status.update(label="대두 농업 데이터셋 분석 중...")
+                    with st.spinner("대두 데이터셋 분석 중..."):
+                        soybean_analysis = analyze_soybean_dataset(query)
             if use_web_search:
+                # 웹 검색 과정은 노출하지 않고 조용히 진행
+                with st.spinner("정보 수집 중..."):
                     search_content = do_web_search(keywords(query, top=5))
                     video_results = brave_video_search(query, 2)
+                    news_results = brave_news_search(query, 3)
             file_content = None
             if has_uploaded_files:
             ]
             user_content = query
+            # 항상 기본 데이터셋 분석 결과 포함
             user_content += "\n\n" + dataset_analysis
+            user_content += "\n\n" + crop_recommendation_analysis
+            user_content += "\n\n" + climate_impact_analysis
+            # 조건부 데이터셋 결과 포함
+            if soybean_analysis:
+                user_content += "\n\n" + soybean_analysis
             if search_content:
                 user_content += "\n\n" + search_content
     agricultural_price_forecast_app()
 if __name__ == "__main__":
+    main()