Spaces:

C2MV
/

Project-HF-2025

Running

App Files Files Community

C2MV commited on 4 days ago

Commit

fd48c2d

verified ·

1 Parent(s): 3442269

Update app.py

Browse files

Files changed (1) hide show

app.py +632 -276

app.py CHANGED Viewed

@@ -25,7 +25,7 @@ client = anthropic.Anthropic()
 class AnalysisType(Enum):
     MATHEMATICAL_MODEL = "mathematical_model"
     DATA_FITTING = "data_fitting"
-    FITTING_RESULTS = "fitting_results"  # Nuevo: resultados de ajuste
     UNKNOWN = "unknown"
 # Estructura modular para modelos
@@ -194,10 +194,8 @@ class AIAnalyzer:
     def detect_analysis_type(self, content: Union[str, pd.DataFrame]) -> AnalysisType:
         """Detecta el tipo de análisis necesario"""
         if isinstance(content, pd.DataFrame):
-            # Analizar si son datos experimentales o resultados de ajuste
             columns = [col.lower() for col in content.columns]
-            # Indicadores de resultados de ajuste
             fitting_indicators = [
                 'r2', 'r_squared', 'rmse', 'mse', 'aic', 'bic',
                 'parameter', 'param', 'coefficient', 'fit',
@@ -205,7 +203,6 @@ class AIAnalyzer:
                 'p_value', 'confidence', 'standard_error', 'se'
             ]
-            # Verificar si hay indicadores de resultados de ajuste
             has_fitting_results = any(indicator in ' '.join(columns) for indicator in fitting_indicators)
             if has_fitting_results:
@@ -213,7 +210,6 @@ class AIAnalyzer:
             else:
                 return AnalysisType.DATA_FITTING
-        # Analizar texto para determinar tipo
         prompt = """
         Analiza este contenido y determina si es:
         1. Un artículo científico que describe modelos matemáticos biotecnológicos
@@ -274,7 +270,6 @@ class AIAnalyzer:
         }
         try:
-            # Identificar modelos
             response = self.client.messages.create(
                 model=claude_model,
                 max_tokens=2000,
@@ -286,7 +281,6 @@ class AIAnalyzer:
             models_info = response.content[0].text
-            # Recomendaciones
             response2 = self.client.messages.create(
                 model=claude_model,
                 max_tokens=2000,
@@ -307,7 +301,6 @@ class AIAnalyzer:
     def analyze_fitting_data(self, data: pd.DataFrame, claude_model: str) -> Dict:
         """Analiza datos experimentales para ajuste de parámetros"""
-        # Preparar resumen de datos
         data_summary = f"""
         Columnas: {list(data.columns)}
         Forma: {data.shape}
@@ -348,14 +341,16 @@ class AIAnalyzer:
         except Exception as e:
             return {"error": str(e)}
-    def analyze_fitting_results(self, data: pd.DataFrame, claude_model: str) -> Dict:
-        """Analiza resultados de ajuste de modelos cinéticos"""
-        # Preparar resumen detallado de resultados
         data_summary = f"""
-        DATOS DE RESULTADOS DE AJUSTE:
-        Columnas disponibles: {list(data.columns)}
-        Forma de los datos: {data.shape}
         Datos completos:
         {data.to_string()}
@@ -364,39 +359,86 @@ class AIAnalyzer:
         {data.describe().to_string()}
         """
-        prompt = """
-        Estos son RESULTADOS DE AJUSTE DE MODELOS CINÉTICOS/BIOTECNOLÓGICOS ya calculados.
-        Necesito que analices:
-        1. **IDENTIFICACIÓN DE MODELOS**: ¿Qué modelos matemáticos se ajustaron? (Monod, Logístico, Gompertz, Michaelis-Menten, etc.)
-        2. **CALIDAD DEL AJUSTE**:
-           - Compara R², RMSE, AIC, BIC entre modelos
-           - ¿Cuál ajusta mejor y por qué?
-           - ¿Hay sobreajuste o subajuste?
-        3. **SIGNIFICADO BIOLÓGICO**:
-           - ¿Qué significan los parámetros estimados biológicamente?
-           - ¿Son valores realistas para el sistema biológico?
-           - ¿Qué información nos dan sobre el proceso?
-        4. **INFERENCIA DEL DISEÑO EXPERIMENTAL**:
-           - ¿Qué tipo de experimento se realizó?
-           - ¿Qué variables se midieron?
-           - ¿Batch, continuo, fed-batch?
-        5. **INTERPRETACIÓN EN LENGUAJE HUMANO**:
-           - Traduce los resultados técnicos a conclusiones comprensibles
-           - ¿Qué nos dicen sobre el comportamiento del microorganismo/proceso?
-           - ¿Cuáles son las implicaciones prácticas?
-        6. **RECOMENDACIONES**:
-           - ¿Qué modelo(s) recomiendas usar?
-           - ¿Qué limitaciones tienen?
-           - ¿Qué experimentos adicionales serían útiles?
-        Estructura tu respuesta de forma clara y detallada.
         """
         try:
@@ -405,27 +447,62 @@ class AIAnalyzer:
                 max_tokens=4000,
                 messages=[{
                     "role": "user",
-                    "content": f"{prompt}\n\nRESULTADOS DE AJUSTE:\n{data_summary}"
                 }]
             )
             return {
-                "tipo": "Análisis de Resultados de Ajuste de Modelos Cinéticos",
                 "analisis_completo": response.content[0].text,
-                "resumen_datos": data_summary,
-                "n_modelos": len(data),
-                "metricas_disponibles": [col for col in data.columns if any(metric in col.lower()
-                                       for metric in ['r2', 'rmse', 'aic', 'bic', 'mse'])]
             }
         except Exception as e:
             return {"error": str(e)}
-def process_files(files, claude_model: str) -> str:
     """Procesa múltiples archivos"""
     processor = FileProcessor()
     analyzer = AIAnalyzer(client, model_registry)
     results = []
     for file in files:
         if file is None:
@@ -434,13 +511,10 @@ def process_files(files, claude_model: str) -> str:
         file_name = file.name if hasattr(file, 'name') else "archivo"
         file_ext = Path(file_name).suffix.lower()
-        # Leer contenido del archivo
         with open(file.name, 'rb') as f:
             file_content = f.read()
-        # Procesar según tipo
         if file_ext == '.zip':
-            # Extraer y procesar archivos del ZIP
             extracted_files = processor.extract_from_zip(file_content)
             results.append(f"## 📦 Archivo ZIP: {file_name}")
             results.append(f"Contiene {len(extracted_files)} archivos\n")
@@ -458,7 +532,7 @@ def process_files(files, claude_model: str) -> str:
                     else:
                         result = {"tipo": "PDF no reconocido", "contenido": text[:500]}
-                    results.append(json.dumps(result, indent=2, ensure_ascii=False))
                 elif sub_ext in ['.csv', '.xlsx', '.xls']:
                     if sub_ext == '.csv':
@@ -470,11 +544,13 @@ def process_files(files, claude_model: str) -> str:
                         analysis_type = analyzer.detect_analysis_type(df)
                         if analysis_type == AnalysisType.FITTING_RESULTS:
-                            result = analyzer.analyze_fitting_results(df, claude_model)
                         else:
                             result = analyzer.analyze_fitting_data(df, claude_model)
-                        results.append(json.dumps(result, indent=2, ensure_ascii=False))
                 results.append("\n---\n")
@@ -486,13 +562,13 @@ def process_files(files, claude_model: str) -> str:
             if analysis_type == AnalysisType.MATHEMATICAL_MODEL:
                 result = analyzer.analyze_mathematical_article(text, claude_model)
             else:
                 result = {"tipo": "PDF - Contenido no identificado", "texto": text[:1000]}
-            results.append(json.dumps(result, indent=2, ensure_ascii=False))
         elif file_ext in ['.csv', '.xlsx', '.xls']:
-            results.append(f"## 📊 Archivo de datos: {file_name}")
             if file_ext == '.csv':
                 df = processor.read_csv(file_content)
@@ -503,17 +579,22 @@ def process_files(files, claude_model: str) -> str:
                 analysis_type = analyzer.detect_analysis_type(df)
                 if analysis_type == AnalysisType.FITTING_RESULTS:
-                    result = analyzer.analyze_fitting_results(df, claude_model)
-                    results.append("### 🎯 ANÁLISIS DE RESULTADOS DE AJUSTE")
                 else:
                     result = analyzer.analyze_fitting_data(df, claude_model)
                     results.append("### 📈 ANÁLISIS DE DATOS EXPERIMENTALES")
-                results.append(json.dumps(result, indent=2, ensure_ascii=False))
         results.append("\n---\n")
-    return "\n".join(results)
 def generate_implementation_code(analysis_results: str) -> str:
     """Genera código de implementación basado en el análisis"""
@@ -525,183 +606,448 @@ from scipy.integrate import odeint
 from scipy.optimize import curve_fit, differential_evolution
 from sklearn.metrics import r2_score, mean_squared_error
 import seaborn as sns
 # Configuración de visualización
 plt.style.use('seaborn-v0_8-darkgrid')
 sns.set_palette("husl")
-class BiotechModelAnalyzer:
-    \"\"\"Clase para análisis de resultados de ajuste de modelos biotecnológicos\"\"\"
     def __init__(self):
-        self.models = {}
-        self.fitted_params = {}
-        self.results = {}
-        self.biological_interpretations = {}
-    def load_fitting_results(self, data_path):
-        \"\"\"Carga resultados de ajuste desde CSV/Excel\"\"\"
-        if data_path.endswith('.csv'):
-            self.results_df = pd.read_csv(data_path)
         else:
-            self.results_df = pd.read_excel(data_path)
         return self.results_df
-    def compare_models(self, r2_col='R2', rmse_col='RMSE', model_col='Model'):
-        \"\"\"Compara modelos basado en métricas de ajuste\"\"\"
-        if not hasattr(self, 'results_df'):
-            raise ValueError("Primero carga los datos con load_fitting_results()")
-        # Ordenar por R² descendente
-        comparison = self.results_df.sort_values(by=r2_col, ascending=False)
-        print("=== COMPARACIÓN DE MODELOS ===")
-        print(f"{'Modelo':<20} {'R²':<10} {'RMSE':<10} {'Ranking':<10}")
-        print("-" * 60)
-        for i, (idx, row) in enumerate(comparison.iterrows()):
-            model_name = row[model_col] if model_col in row else f"Modelo_{idx}"
-            r2_val = row[r2_col] if r2_col in row else "N/A"
-            rmse_val = row[rmse_col] if rmse_col in row else "N/A"
-            print(f"{model_name:<20} {r2_val:<10.4f} {rmse_val:<10.4f} {i+1:<10}")
-        return comparison
-    def interpret_biological_meaning(self, model_name, parameters):
-        \"\"\"Interpreta el significado biológico de parámetros\"\"\"
-        interpretations = {
-            'monod': {
-                'mu_max': 'Velocidad máxima específica de crecimiento',
-                'Ks': 'Constante de saturación (afinidad por sustrato)',
-                'biological_meaning': 'Crecimiento limitado por sustrato único'
-            },
-            'logistic': {
-                'K': 'Capacidad de carga del sistema',
-                'r': 'Tasa intrínseca de crecimiento',
-                'biological_meaning': 'Crecimiento limitado por densidad poblacional'
-            },
-            'gompertz': {
-                'A': 'Asíntota superior (biomasa máxima)',
-                'mu': 'Velocidad máxima de crecimiento',
-                'lambda': 'Tiempo de fase lag',
-                'biological_meaning': 'Crecimiento con adaptación inicial'
-            }
-        }
-        model_key = model_name.lower()
-        if model_key in interpretations:
-            return interpretations[model_key]
-        else:
-            return {'biological_meaning': 'Modelo no reconocido en base de datos'}
-    def generate_human_readable_report(self):
-        \"\"\"Genera reporte en lenguaje humano\"\"\"
-        if not hasattr(self, 'results_df'):
             raise ValueError("Primero carga los datos")
-        report = []
-        report.append("# 🧬 REPORTE DE ANÁLISIS BIOTECNOLÓGICO")
-        report.append("=" * 50)
-        report.append("")
-        # Mejor modelo
-        best_model = self.results_df.loc[self.results_df['R2'].idxmax()]
-        report.append(f"## 🏆 MEJOR MODELO IDENTIFICADO")
-        report.append(f"**Modelo:** {best_model.get('Model', 'No especificado')}")
-        report.append(f"**Calidad del ajuste:** R² = {best_model.get('R2', 'N/A'):.4f}")
-        report.append(f"**Error:** RMSE = {best_model.get('RMSE', 'N/A'):.4f}")
-        report.append("")
-        # Interpretación biológica
-        report.append("## 🔬 SIGNIFICADO BIOLÓGICO")
-        report.append("Los parámetros ajustados nos indican:")
-        # Aquí puedes expandir según los modelos específicos encontrados
-        report.append("- El sistema estudiado muestra un comportamiento predecible")
-        report.append("- Los parámetros están dentro de rangos biológicamente plausibles")
-        report.append("")
-        # Recomendaciones
-        report.append("## 💡 RECOMENDACIONES")
-        report.append("1. Validar el modelo con datos independientes")
-        report.append("2. Considerar factores ambientales adicionales")
-        report.append("3. Evaluar la robustez del modelo")
-        return "\\n".join(report)
-    def plot_model_comparison(self):
-        \"\"\"Visualiza comparación de modelos\"\"\"
-        if not hasattr(self, 'results_df'):
-            raise ValueError("Primero carga los datos")
-        fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))
-        # Gráfico de R²
-        models = self.results_df.get('Model', range(len(self.results_df)))
-        r2_values = self.results_df.get('R2', [])
-        ax1.bar(models, r2_values, color='skyblue', edgecolor='navy', alpha=0.7)
         ax1.set_title('Comparación de R² por Modelo', fontsize=14, fontweight='bold')
         ax1.set_ylabel('R² (Coeficiente de Determinación)', fontsize=12)
-        ax1.set_ylim(0, 1)
         ax1.grid(True, alpha=0.3)
-        # Rotar etiquetas si es necesario
-        plt.setp(ax1.get_xticklabels(), rotation=45, ha='right')
-        # Gráfico de RMSE
-        rmse_values = self.results_df.get('RMSE', [])
-        ax2.bar(models, rmse_values, color='lightcoral', edgecolor='darkred', alpha=0.7)
         ax2.set_title('Comparación de RMSE por Modelo', fontsize=14, fontweight='bold')
         ax2.set_ylabel('RMSE (Error Cuadrático Medio)', fontsize=12)
         ax2.grid(True, alpha=0.3)
-        plt.setp(ax2.get_xticklabels(), rotation=45, ha='right')
-        plt.tight_layout()
         return fig
-# Modelos predefinidos comunes
-def monod_model(S, mu_max, Ks):
-    return mu_max * S / (Ks + S)
-def logistic_growth(t, K, r, t0):
-    return K / (1 + np.exp(-r * (t - t0)))
-def gompertz_model(t, A, mu, lambda_param):
-    return A * np.exp(-np.exp(mu * np.e / A * (lambda_param - t) + 1))
-def michaelis_menten(S, Vmax, Km):
-    return Vmax * S / (Km + S)
-# Ejemplo de uso para análisis de resultados
 if __name__ == "__main__":
-    # Crear instancia del analizador
-    analyzer = BiotechModelAnalyzer()
-    # Ejemplo de carga de datos
-    # analyzer.load_fitting_results('resultados_ajuste.csv')
-    # Ejemplo de comparación
-    # comparison = analyzer.compare_models()
-    # Generar reporte
-    # report = analyzer.generate_human_readable_report()
-    # print(report)
-    print("🔬 Sistema de análisis de resultados listo!")
-    print("📊 Carga tus resultados CSV y utiliza analyzer.load_fitting_results()")
-    print("📈 Luego usa analyzer.compare_models() para comparar")
 """
     return code
-# Interfaz Gradio optimizada para HuggingFace
 def create_interface():
     with gr.Blocks(
-        title="Analizador Inteligente de Modelos Biotecnológicos",
         theme=gr.themes.Soft(),
         css="""
         .gradio-container {
@@ -713,30 +1059,31 @@ def create_interface():
             border-radius: 10px;
             border-left: 5px solid #4CAF50;
         }
         """
     ) as demo:
         gr.Markdown("""
-        # 🧬 Analizador Inteligente de Modelos Biotecnológicos
-        ### 🎯 Especializado en Análisis de Resultados de Ajuste:
-        - **Análisis automático** de resultados de ajuste de modelos cinéticos
-        - **Interpretación biológica** de parámetros y métricas
-        - **Comparación inteligente** entre modelos (R², RMSE, AIC, BIC)
-        - **Traducción a lenguaje humano** de resultados técnicos
-        - **Inferencia del diseño experimental** a partir de los datos
-        - **Recomendaciones** sobre qué modelos usar y por qué
-        ### 📁 Tipos de archivo soportados:
-        - **CSV/Excel** con resultados de ajuste (parámetros, R², RMSE, etc.)
-        - **PDF** con artículos científicos o reportes
-        - **ZIP** con múltiples archivos
-        ### 🔍 ¿Qué analiza específicamente?
-        - Calidad del ajuste y comparación entre modelos
-        - Significado biológico de parámetros estimados
-        - Detección de sobreajuste o problemas en el ajuste
-        - Interpretación de resultados en contexto biotecnológico
         """)
         with gr.Row():
@@ -755,8 +1102,15 @@ def create_interface():
                     info="Selecciona el modelo de IA"
                 )
                 analyze_btn = gr.Button(
-                    "🚀 Analizar Resultados",
                     variant="primary",
                     size="lg"
                 )
@@ -782,81 +1136,83 @@ def create_interface():
             with gr.Column(scale=2):
                 analysis_output = gr.Markdown(
-                    label="📊 Análisis de Resultados",
                     elem_classes=["highlight-results"]
                 )
                 code_output = gr.Code(
-                    label="💻 Código de Análisis",
                     language="python",
-                    interactive=True
                 )
         # Ejemplos
         gr.Examples(
             examples=[
-                [["examples/fitting_results.csv"]],
-                [["examples/model_comparison.xlsx"]],
-                [["examples/kinetic_parameters.csv"]]
             ],
-            inputs=[files_input],
-            label="📚 Ejemplos de resultados de ajuste"
         )
-        # Guía de uso
-        gr.Markdown("""
-        ---
-        ### 📋 Guía de uso para resultados de ajuste:
-        **Para obtener el mejor análisis, asegúrate que tu CSV/Excel contenga:**
-        1. **Columna de modelos**: Nombres de los modelos ajustados (Monod, Logístico, Gompertz, etc.)
-        2. **Métricas de ajuste**: R², RMSE, AIC, BIC, MSE, etc.
-        3. **Parámetros**: Valores de parámetros estimados (μmax, Ks, K, etc.)
-        4. **Errores estándar**: Si están disponibles
-        **Ejemplo de estructura ideal:**
-        ```
-        Model          | R2    | RMSE   | mu_max | Ks    | AIC
-        Monod          | 0.985 | 0.023  | 0.45   | 2.1   | -45.2
-        Logistic       | 0.976 | 0.031  | 0.42   | 15.3  | -42.1
-        Gompertz       | 0.992 | 0.018  | 0.48   | 1.8   | -48.5
-        ```
-        ### 🔬 Lo que obtendrás:
-        - **Ranking de modelos** basado en calidad de ajuste
-        - **Interpretación biológica** de cada parámetro
-        - **Análisis del diseño experimental** inferido
-        - **Recomendaciones** sobre cuál modelo usar
-        - **Explicación en lenguaje simple** de los resultados
-        """)
-        # Footer
-        gr.Markdown("""
-        ---
-        ### 🔧 Características técnicas:
-        - **Detección automática** de tipo de análisis (datos vs resultados)
-        - **Interpretación contextual** de parámetros biotecnológicos
-        - **Análisis comparativo** inteligente entre modelos
-        - **Traducción técnica** a lenguaje comprensible
-        ### 💡 Casos de uso:
-        - Análisis de resultados de ajustes de crecimiento microbiano
-        - Comparación de modelos de consumo de sustrato
-        - Evaluación de modelos de formación de producto
-        - Interpretación de parámetros cinéticos
-        """)
         # Eventos
         analyze_btn.click(
-            fn=lambda files, model: (
-                process_files(files, model) if files else "Por favor sube archivos con resultados de ajuste para analizar",
-                generate_implementation_code("") if files else ""
             ),
-            inputs=[files_input, model_selector],
             outputs=[analysis_output, code_output]
         )
         # Cargar info inicial del modelo
         demo.load(
             fn=lambda: update_model_info("claude-3-5-sonnet-20241022"),

 class AnalysisType(Enum):
     MATHEMATICAL_MODEL = "mathematical_model"
     DATA_FITTING = "data_fitting"
+    FITTING_RESULTS = "fitting_results"
     UNKNOWN = "unknown"
 # Estructura modular para modelos
     def detect_analysis_type(self, content: Union[str, pd.DataFrame]) -> AnalysisType:
         """Detecta el tipo de análisis necesario"""
         if isinstance(content, pd.DataFrame):
             columns = [col.lower() for col in content.columns]
             fitting_indicators = [
                 'r2', 'r_squared', 'rmse', 'mse', 'aic', 'bic',
                 'parameter', 'param', 'coefficient', 'fit',
                 'p_value', 'confidence', 'standard_error', 'se'
             ]
             has_fitting_results = any(indicator in ' '.join(columns) for indicator in fitting_indicators)
             if has_fitting_results:
             else:
                 return AnalysisType.DATA_FITTING
         prompt = """
         Analiza este contenido y determina si es:
         1. Un artículo científico que describe modelos matemáticos biotecnológicos
         }
         try:
             response = self.client.messages.create(
                 model=claude_model,
                 max_tokens=2000,
             models_info = response.content[0].text
             response2 = self.client.messages.create(
                 model=claude_model,
                 max_tokens=2000,
     def analyze_fitting_data(self, data: pd.DataFrame, claude_model: str) -> Dict:
         """Analiza datos experimentales para ajuste de parámetros"""
         data_summary = f"""
         Columnas: {list(data.columns)}
         Forma: {data.shape}
         except Exception as e:
             return {"error": str(e)}
+    def analyze_fitting_results(self, data: pd.DataFrame, claude_model: str, detail_level: str = "detallado") -> Dict:
+        """Analiza resultados de ajuste de modelos con enfoque mejorado"""
+        # Preparar resumen completo de los datos
         data_summary = f"""
+        RESULTADOS DE AJUSTE DE MODELOS MATEMÁTICOS:
+        Estructura de datos:
+        - Columnas: {list(data.columns)}
+        - Número de modelos evaluados: {len(data)}
         Datos completos:
         {data.to_string()}
         {data.describe().to_string()}
         """
+        # Prompt mejorado y especializado
+        prompt = f"""
+        Eres un experto en biotecnología y modelado matemático. Analiza estos resultados de ajuste de modelos cinéticos/biotecnológicos.
+        NIVEL DE DETALLE SOLICITADO: {detail_level}
+        REALIZA UN ANÁLISIS COMPARATIVO EXHAUSTIVO:
+        1. **IDENTIFICACIÓN Y CLASIFICACIÓN DE MODELOS**
+           - Identifica TODOS los modelos matemáticos ajustados
+           - Clasifícalos por tipo: biomasa, sustrato, producto
+           - Indica la ecuación matemática de cada modelo si es posible inferirla
+        2. **ANÁLISIS COMPARATIVO DE CALIDAD DE AJUSTE**
+           - Compara TODOS los indicadores disponibles: R², RMSE, AIC, BIC, etc.
+           - Crea un ranking ordenado de mejor a peor modelo
+           - Identifica diferencias significativas entre modelos
+           - Detecta posible sobreajuste o subajuste
+        3. **DETERMINACIÓN DEL MEJOR MODELO**
+           - Selecciona el MEJOR modelo basándote en MÚLTIPLES criterios:
+             * Mayor R² (más cercano a 1)
+             * Menor RMSE/MSE
+             * Menor AIC/BIC (si están disponibles)
+             * Parsimonia (menos parámetros si el ajuste es similar)
+           - Justifica NUMÉRICAMENTE por qué es el mejor
+           - Si hay empate técnico, explica las ventajas de cada uno
+        4. **ANÁLISIS ESPECÍFICO POR TIPO DE VARIABLE**
+           a) **BIOMASA (si aplica)**:
+              - Parámetros de crecimiento (μmax, Xmax, etc.)
+              - Tiempo de duplicación
+              - Productividad de biomasa
+              - Comparación numérica entre modelos
+           b) **SUSTRATO (si aplica)**:
+              - Constantes de afinidad (Ks, Km)
+              - Velocidades de consumo
+              - Rendimiento Yx/s
+              - Eficiencia de utilización
+           c) **PRODUCTO (si aplica)**:
+              - Parámetros de producción (α, β)
+              - Productividad específica
+              - Rendimiento Yp/x
+              - Tipo de producción (asociada/no asociada)
+        5. **INTERPRETACIÓN BIOLÓGICA DE PARÁMETROS**
+           - Explica qué significa CADA parámetro biológicamente
+           - Compara valores entre modelos
+           - Evalúa si son realistas para el sistema
+           - Identifica parámetros críticos del proceso
+        6. **CONCLUSIONES CON CONTENIDO NUMÉRICO**
+           - Resume los hallazgos clave con NÚMEROS específicos
+           - Proporciona rangos de confianza si están disponibles
+           - Indica condiciones óptimas de operación
+           - Sugiere valores de diseño para escalamiento
+        7. **RECOMENDACIONES PRÁCTICAS**
+           - Qué modelo(s) usar para predicción
+           - Limitaciones del modelo seleccionado
+           - Experimentos adicionales recomendados
+           - Consideraciones para implementación industrial
+        8. **TABLA COMPARATIVA FINAL**
+           Crea una tabla resumen con:
+           - Modelo | R² | RMSE | AIC/BIC | Parámetros clave | Ranking
+        FORMATO DE RESPUESTA:
+        - Si el nivel es "detallado": incluye TODOS los puntos con explicaciones completas
+        - Si el nivel es "resumido": enfócate en puntos 3, 6 y 8 con valores numéricos clave
+        Usa formato Markdown con:
+        - Títulos y subtítulos claros
+        - **Negritas** para valores importantes
+        - Tablas cuando sea apropiado
+        - Listas numeradas y con viñetas
+        IMPORTANTE: Basa TODAS las conclusiones en los NÚMEROS específicos de los datos proporcionados.
         """
         try:
                 max_tokens=4000,
                 messages=[{
                     "role": "user",
+                    "content": f"{prompt}\n\n{data_summary}"
+                }]
+            )
+            # Análisis adicional para generar código si es necesario
+            code_prompt = """
+            Basándote en el análisis anterior, genera código Python para:
+            1. Cargar y visualizar estos resultados de ajuste
+            2. Crear gráficos comparativos de modelos (barras para R², RMSE)
+            3. Implementar el mejor modelo identificado
+            4. Generar predicciones con el modelo seleccionado
+            5. Análisis de sensibilidad de parámetros
+            Incluye:
+            - Imports necesarios
+            - Funciones bien documentadas
+            - Visualizaciones profesionales
+            - Manejo de errores
+            - Ejemplo de uso
+            El código debe ser ejecutable y modular.
+            """
+            code_response = self.client.messages.create(
+                model=claude_model,
+                max_tokens=3000,
+                messages=[{
+                    "role": "user",
+                    "content": f"{code_prompt}\n\nBasado en estos modelos:\n{response.content[0].text[:1000]}"
                 }]
             )
             return {
+                "tipo": "Análisis Comparativo de Modelos Matemáticos",
                 "analisis_completo": response.content[0].text,
+                "codigo_implementacion": code_response.content[0].text,
+                "resumen_datos": {
+                    "n_modelos": len(data),
+                    "columnas": list(data.columns),
+                    "metricas_disponibles": [col for col in data.columns if any(metric in col.lower()
+                                           for metric in ['r2', 'rmse', 'aic', 'bic', 'mse'])],
+                    "mejor_r2": data['R2'].max() if 'R2' in data.columns else None,
+                    "mejor_modelo_r2": data.loc[data['R2'].idxmax()]['Model'] if 'R2' in data.columns and 'Model' in data.columns else None
+                }
             }
         except Exception as e:
             return {"error": str(e)}
+def process_files(files, claude_model: str, detail_level: str = "detallado") -> Tuple[str, str]:
     """Procesa múltiples archivos"""
     processor = FileProcessor()
     analyzer = AIAnalyzer(client, model_registry)
     results = []
+    all_code = []
     for file in files:
         if file is None:
         file_name = file.name if hasattr(file, 'name') else "archivo"
         file_ext = Path(file_name).suffix.lower()
         with open(file.name, 'rb') as f:
             file_content = f.read()
         if file_ext == '.zip':
             extracted_files = processor.extract_from_zip(file_content)
             results.append(f"## 📦 Archivo ZIP: {file_name}")
             results.append(f"Contiene {len(extracted_files)} archivos\n")
                     else:
                         result = {"tipo": "PDF no reconocido", "contenido": text[:500]}
+                    results.append(result.get("analisis_completo", json.dumps(result, indent=2, ensure_ascii=False)))
                 elif sub_ext in ['.csv', '.xlsx', '.xls']:
                     if sub_ext == '.csv':
                         analysis_type = analyzer.detect_analysis_type(df)
                         if analysis_type == AnalysisType.FITTING_RESULTS:
+                            result = analyzer.analyze_fitting_results(df, claude_model, detail_level)
+                            results.append(result.get("analisis_completo", ""))
+                            if "codigo_implementacion" in result:
+                                all_code.append(result["codigo_implementacion"])
                         else:
                             result = analyzer.analyze_fitting_data(df, claude_model)
+                            results.append(result.get("analisis", ""))
                 results.append("\n---\n")
             if analysis_type == AnalysisType.MATHEMATICAL_MODEL:
                 result = analyzer.analyze_mathematical_article(text, claude_model)
+                results.append(result.get("modelos", "") + "\n" + result.get("recomendaciones", ""))
             else:
                 result = {"tipo": "PDF - Contenido no identificado", "texto": text[:1000]}
+                results.append(json.dumps(result, indent=2, ensure_ascii=False))
         elif file_ext in ['.csv', '.xlsx', '.xls']:
+            results.append(f"## 📊 Análisis de Resultados: {file_name}")
             if file_ext == '.csv':
                 df = processor.read_csv(file_content)
                 analysis_type = analyzer.detect_analysis_type(df)
                 if analysis_type == AnalysisType.FITTING_RESULTS:
+                    result = analyzer.analyze_fitting_results(df, claude_model, detail_level)
+                    results.append("### 🎯 ANÁLISIS COMPARATIVO DE MODELOS MATEMÁTICOS")
+                    results.append(result.get("analisis_completo", ""))
+                    if "codigo_implementacion" in result:
+                        all_code.append(result["codigo_implementacion"])
                 else:
                     result = analyzer.analyze_fitting_data(df, claude_model)
                     results.append("### 📈 ANÁLISIS DE DATOS EXPERIMENTALES")
+                    results.append(result.get("analisis", ""))
         results.append("\n---\n")
+    analysis_text = "\n".join(results)
+    code_text = "\n\n# " + "="*50 + "\n\n".join(all_code) if all_code else generate_implementation_code(analysis_text)
+    return analysis_text, code_text
 def generate_implementation_code(analysis_results: str) -> str:
     """Genera código de implementación basado en el análisis"""
 from scipy.optimize import curve_fit, differential_evolution
 from sklearn.metrics import r2_score, mean_squared_error
 import seaborn as sns
+from typing import Dict, List, Tuple, Optional
 # Configuración de visualización
 plt.style.use('seaborn-v0_8-darkgrid')
 sns.set_palette("husl")
+class ComparativeModelAnalyzer:
+    \"\"\"
+    Clase para análisis comparativo de resultados de ajuste de modelos biotecnológicos.
+    Especializada en comparar modelos de biomasa, sustrato y producto.
+    \"\"\"
     def __init__(self):
+        self.results_df = None
+        self.best_models = {}
+        self.model_rankings = {}
+    def load_results(self, file_path: str) -> pd.DataFrame:
+        \"\"\"Carga resultados de ajuste desde archivo CSV o Excel\"\"\"
+        if file_path.endswith('.csv'):
+            self.results_df = pd.read_csv(file_path)
         else:
+            self.results_df = pd.read_excel(file_path)
+        print(f"✅ Datos cargados: {len(self.results_df)} modelos")
+        print(f"📊 Columnas disponibles: {list(self.results_df.columns)}")
         return self.results_df
+    def analyze_model_quality(self,
+                            r2_col: str = 'R2',
+                            rmse_col: str = 'RMSE',
+                            aic_col: Optional[str] = 'AIC',
+                            bic_col: Optional[str] = 'BIC',
+                            model_col: str = 'Model') -> pd.DataFrame:
+        \"\"\"
+        Analiza y compara la calidad de ajuste de todos los modelos.
+        Crea un ranking basado en múltiples métricas.
+        \"\"\"
+        if self.results_df is None:
+            raise ValueError("Primero carga los datos con load_results()")
+        # Crear DataFrame de comparación
+        comparison = self.results_df.copy()
+        # Calcular puntuación compuesta
+        scores = pd.DataFrame(index=comparison.index)
+        # Normalizar métricas (0-1)
+        if r2_col in comparison.columns:
+            scores['r2_score'] = comparison[r2_col]  # Ya está entre 0-1
+        if rmse_col in comparison.columns:
+            # Invertir y normalizar RMSE (menor es mejor)
+            max_rmse = comparison[rmse_col].max()
+            scores['rmse_score'] = 1 - (comparison[rmse_col] / max_rmse)
+        if aic_col and aic_col in comparison.columns:
+            # Invertir y normalizar AIC (menor es mejor)
+            min_aic = comparison[aic_col].min()
+            max_aic = comparison[aic_col].max()
+            scores['aic_score'] = 1 - ((comparison[aic_col] - min_aic) / (max_aic - min_aic))
+        if bic_col and bic_col in comparison.columns:
+            # Invertir y normalizar BIC (menor es mejor)
+            min_bic = comparison[bic_col].min()
+            max_bic = comparison[bic_col].max()
+            scores['bic_score'] = 1 - ((comparison[bic_col] - min_bic) / (max_bic - min_bic))
+        # Calcular puntuación total (promedio ponderado)
+        weights = {
+            'r2_score': 0.4,
+            'rmse_score': 0.3,
+            'aic_score': 0.15,
+            'bic_score': 0.15
+        }
+        scores['total_score'] = 0
+        for metric, weight in weights.items():
+            if metric in scores.columns:
+                scores['total_score'] += scores[metric] * weight
+        # Añadir puntuación al DataFrame de comparación
+        comparison['Score'] = scores['total_score']
+        comparison['Ranking'] = comparison['Score'].rank(ascending=False).astype(int)
+        # Ordenar por ranking
+        comparison = comparison.sort_values('Ranking')
+        # Identificar mejor modelo
+        best_idx = comparison['Score'].idxmax()
+        self.best_models['overall'] = comparison.loc[best_idx]
+        # Imprimir tabla de comparación
+        print("\\n" + "="*80)
+        print("📊 TABLA COMPARATIVA DE MODELOS")
+        print("="*80)
+        print(f"\\n{'Rank':<6} {'Modelo':<20} {'R²':<8} {'RMSE':<10} {'AIC':<10} {'BIC':<10} {'Score':<8}")
+        print("-"*80)
+        for idx, row in comparison.iterrows():
+            rank = row['Ranking']
+            model = row.get(model_col, f'Model_{idx}')[:20]
+            r2 = row.get(r2_col, 0)
+            rmse = row.get(rmse_col, 0)
+            aic = row.get(aic_col, 'N/A')
+            bic = row.get(bic_col, 'N/A')
+            score = row['Score']
+            print(f"{rank:<6} {model:<20} {r2:<8.4f} {rmse:<10.4f} ", end="")
+            if isinstance(aic, (int, float)):
+                print(f"{aic:<10.2f} ", end="")
+            else:
+                print(f"{'N/A':<10} ", end="")
+            if isinstance(bic, (int, float)):
+                print(f"{bic:<10.2f} ", end="")
+            else:
+                print(f"{'N/A':<10} ", end="")
+            print(f"{score:<8.4f}")
+        print("\\n🏆 MEJOR MODELO: " + comparison.iloc[0].get(model_col, 'No especificado'))
+        print(f"   - R² = {comparison.iloc[0].get(r2_col, 0):.4f}")
+        print(f"   - RMSE = {comparison.iloc[0].get(rmse_col, 0):.4f}")
+        self.model_rankings = comparison
+        return comparison
+    def analyze_by_category(self, category_col: Optional[str] = None) -> Dict:
+        \"\"\"
+        Analiza modelos por categoría (biomasa, sustrato, producto).
+        Si no hay columna de categoría, intenta inferir del nombre del modelo.
+        \"\"\"
+        if self.results_df is None:
             raise ValueError("Primero carga los datos")
+        categories = {}
+        if category_col and category_col in self.results_df.columns:
+            # Usar columna de categoría existente
+            for cat in self.results_df[category_col].unique():
+                cat_data = self.results_df[self.results_df[category_col] == cat]
+                categories[cat] = cat_data
+        else:
+            # Inferir categorías del nombre del modelo
+            biomass_keywords = ['monod', 'logistic', 'gompertz', 'baranyi', 'growth']
+            substrate_keywords = ['michaelis', 'menten', 'substrate', 'consumption']
+            product_keywords = ['luedeking', 'piret', 'product', 'formation']
+            for idx, row in self.results_df.iterrows():
+                model_name = str(row.get('Model', '')).lower()
+                if any(kw in model_name for kw in biomass_keywords):
+                    if 'biomasa' not in categories:
+                        categories['biomasa'] = []
+                    categories['biomasa'].append(row)
+                elif any(kw in model_name for kw in substrate_keywords):
+                    if 'sustrato' not in categories:
+                        categories['sustrato'] = []
+                    categories['sustrato'].append(row)
+                elif any(kw in model_name for kw in product_keywords):
+                    if 'producto' not in categories:
+                        categories['producto'] = []
+                    categories['producto'].append(row)
+                else:
+                    if 'otros' not in categories:
+                        categories['otros'] = []
+                    categories['otros'].append(row)
+        # Convertir listas a DataFrames
+        for cat in categories:
+            if isinstance(categories[cat], list):
+                categories[cat] = pd.DataFrame(categories[cat])
+        # Analizar cada categoría
+        print("\\n" + "="*80)
+        print("📈 ANÁLISIS POR CATEGORÍA")
+        print("="*80)
+        for cat, data in categories.items():
+            if len(data) > 0:
+                print(f"\\n### {cat.upper()}")
+                print(f"Modelos analizados: {len(data)}")
+                if 'R2' in data.columns:
+                    best_idx = data['R2'].idxmax()
+                    best_model = data.loc[best_idx]
+                    print(f"Mejor modelo: {best_model.get('Model', 'N/A')}")
+                    print(f"  - R² = {best_model.get('R2', 0):.4f}")
+                    print(f"  - RMSE = {best_model.get('RMSE', 0):.4f}")
+                    self.best_models[cat] = best_model
+        return categories
+    def plot_comparison(self, save_path: Optional[str] = None) -> plt.Figure:
+        \"\"\"
+        Genera visualizaciones comparativas de los modelos.
+        \"\"\"
+        if self.model_rankings is None:
+            raise ValueError("Primero ejecuta analyze_model_quality()")
+        fig = plt.figure(figsize=(16, 10))
+        # Configurar grid de subplots
+        gs = fig.add_gridspec(3, 2, height_ratios=[1, 1, 1], hspace=0.3, wspace=0.3)
+        # 1. Gráfico de barras R²
+        ax1 = fig.add_subplot(gs[0, 0])
+        models = self.model_rankings.get('Model', range(len(self.model_rankings)))
+        r2_values = self.model_rankings.get('R2', [])
+        bars1 = ax1.bar(range(len(models)), r2_values, color='skyblue', edgecolor='navy', alpha=0.7)
         ax1.set_title('Comparación de R² por Modelo', fontsize=14, fontweight='bold')
         ax1.set_ylabel('R² (Coeficiente de Determinación)', fontsize=12)
+        ax1.set_ylim(0, 1.05)
+        ax1.set_xticks(range(len(models)))
+        ax1.set_xticklabels(models, rotation=45, ha='right')
         ax1.grid(True, alpha=0.3)
+        # Añadir valores en las barras
+        for bar, val in zip(bars1, r2_values):
+            height = bar.get_height()
+            ax1.text(bar.get_x() + bar.get_width()/2., height + 0.01,
+                    f'{val:.3f}', ha='center', va='bottom', fontsize=9)
+        # 2. Gráfico de barras RMSE
+        ax2 = fig.add_subplot(gs[0, 1])
+        rmse_values = self.model_rankings.get('RMSE', [])
+        bars2 = ax2.bar(range(len(models)), rmse_values, color='lightcoral', edgecolor='darkred', alpha=0.7)
         ax2.set_title('Comparación de RMSE por Modelo', fontsize=14, fontweight='bold')
         ax2.set_ylabel('RMSE (Error Cuadrático Medio)', fontsize=12)
+        ax2.set_xticks(range(len(models)))
+        ax2.set_xticklabels(models, rotation=45, ha='right')
         ax2.grid(True, alpha=0.3)
+        # 3. Gráfico de puntuación total
+        ax3 = fig.add_subplot(gs[1, :])
+        scores = self.model_rankings.get('Score', [])
+        rankings = self.model_rankings.get('Ranking', [])
+        # Crear gradiente de colores basado en ranking
+        colors = plt.cm.RdYlGn(1 - (rankings - 1) / (len(rankings) - 1))
+        bars3 = ax3.bar(range(len(models)), scores, color=colors, edgecolor='black', alpha=0.8)
+        ax3.set_title('Puntuación Total Compuesta (Mayor es Mejor)', fontsize=16, fontweight='bold')
+        ax3.set_ylabel('Puntuación Total', fontsize=12)
+        ax3.set_xticks(range(len(models)))
+        ax3.set_xticklabels(models, rotation=45, ha='right')
+        ax3.grid(True, alpha=0.3)
+        # Marcar el mejor modelo
+        best_idx = scores.argmax()
+        bars3[best_idx].set_linewidth(3)
+        bars3[best_idx].set_edgecolor('gold')
+        # 4. Tabla de métricas
+        ax4 = fig.add_subplot(gs[2, :])
+        ax4.axis('tight')
+        ax4.axis('off')
+        # Preparar datos para la tabla
+        table_data = []
+        for idx, row in self.model_rankings.head(5).iterrows():
+            table_data.append([
+                row.get('Ranking', ''),
+                row.get('Model', '')[:20],
+                f"{row.get('R2', 0):.4f}",
+                f"{row.get('RMSE', 0):.4f}",
+                f"{row.get('AIC', 'N/A'):.2f}" if isinstance(row.get('AIC'), (int, float)) else 'N/A',
+                f"{row.get('BIC', 'N/A'):.2f}" if isinstance(row.get('BIC'), (int, float)) else 'N/A',
+                f"{row.get('Score', 0):.4f}"
+            ])
+        table = ax4.table(cellText=table_data,
+                         colLabels=['Rank', 'Modelo', 'R²', 'RMSE', 'AIC', 'BIC', 'Score'],
+                         cellLoc='center',
+                         loc='center',
+                         colWidths=[0.08, 0.25, 0.12, 0.12, 0.12, 0.12, 0.12])
+        table.auto_set_font_size(False)
+        table.set_fontsize(10)
+        table.scale(1.2, 1.5)
+        # Colorear la primera fila (mejor modelo)
+        for j in range(len(table_data[0])):
+            table[(1, j)].set_facecolor('#90EE90')
+        ax4.set_title('Top 5 Modelos - Tabla Resumen', fontsize=14, fontweight='bold', pad=20)
+        plt.suptitle('Análisis Comparativo de Modelos Biotecnológicos', fontsize=18, fontweight='bold')
+        if save_path:
+            plt.savefig(save_path, dpi=300, bbox_inches='tight')
+            print(f"\\n💾 Gráfico guardado en: {save_path}")
         return fig
+    def generate_report(self, output_file: str = 'informe_comparativo.txt'):
+        \"\"\"
+        Genera un informe detallado con todas las conclusiones numéricas.
+        \"\"\"
+        if self.model_rankings is None:
+            raise ValueError("Primero ejecuta analyze_model_quality()")
+        report = []
+        report.append("="*80)
+        report.append("INFORME DE ANÁLISIS COMPARATIVO DE MODELOS MATEMÁTICOS")
+        report.append("="*80)
+        report.append(f"\\nFecha: {pd.Timestamp.now().strftime('%Y-%m-%d %H:%M:%S')}")
+        report.append(f"Número de modelos analizados: {len(self.results_df)}")
+        # Resumen ejecutivo
+        report.append("\\n" + "-"*40)
+        report.append("RESUMEN EJECUTIVO")
+        report.append("-"*40)
+        best_model = self.model_rankings.iloc[0]
+        report.append(f"\\nMEJOR MODELO GLOBAL: {best_model.get('Model', 'N/A')}")
+        report.append(f"  - R² = {best_model.get('R2', 0):.4f} (explica {best_model.get('R2', 0)*100:.1f}% de la variabilidad)")
+        report.append(f"  - RMSE = {best_model.get('RMSE', 0):.4f}")
+        if 'AIC' in best_model:
+            report.append(f"  - AIC = {best_model.get('AIC'):.2f}")
+        if 'BIC' in best_model:
+            report.append(f"  - BIC = {best_model.get('BIC'):.2f}")
+        # Análisis detallado
+        report.append("\\n" + "-"*40)
+        report.append("ANÁLISIS DETALLADO POR MODELO")
+        report.append("-"*40)
+        for idx, row in self.model_rankings.iterrows():
+            report.append(f"\\n{row.get('Ranking')}. {row.get('Model', 'N/A')}")
+            report.append(f"   Métricas de ajuste:")
+            report.append(f"   - R² = {row.get('R2', 0):.4f}")
+            report.append(f"   - RMSE = {row.get('RMSE', 0):.4f}")
+            # Interpretación
+            r2_val = row.get('R2', 0)
+            if r2_val > 0.95:
+                quality = "EXCELENTE"
+            elif r2_val > 0.90:
+                quality = "MUY BUENO"
+            elif r2_val > 0.80:
+                quality = "BUENO"
+            elif r2_val > 0.70:
+                quality = "ACEPTABLE"
+            else:
+                quality = "POBRE"
+            report.append(f"   - Calidad del ajuste: {quality}")
+        # Análisis por categorías si está disponible
+        if hasattr(self, 'best_models') and len(self.best_models) > 1:
+            report.append("\\n" + "-"*40)
+            report.append("MEJORES MODELOS POR CATEGORÍA")
+            report.append("-"*40)
+            for cat, model in self.best_models.items():
+                if cat != 'overall':
+                    report.append(f"\\n{cat.upper()}:")
+                    report.append(f"  Mejor modelo: {model.get('Model', 'N/A')}")
+                    report.append(f"  - R² = {model.get('R2', 0):.4f}")
+                    report.append(f"  - RMSE = {model.get('RMSE', 0):.4f}")
+        # Recomendaciones
+        report.append("\\n" + "-"*40)
+        report.append("RECOMENDACIONES")
+        report.append("-"*40)
+        report.append(f"\\n1. Para predicciones generales, usar: {best_model.get('Model', 'N/A')}")
+        report.append("2. Validar con conjunto de datos independiente")
+        report.append("3. Considerar análisis de residuos")
+        report.append("4. Evaluar estabilidad de parámetros")
+        # Guardar informe
+        with open(output_file, 'w', encoding='utf-8') as f:
+            f.write("\\n".join(report))
+        print(f"\\n📄 Informe guardado en: {output_file}")
+        return "\\n".join(report)
+# Implementación de modelos específicos
+class BiotechModels:
+    \"\"\"Biblioteca de modelos biotecnológicos comunes\"\"\"
+    @staticmethod
+    def monod(S, mu_max, Ks):
+        \"\"\"Modelo de Monod para crecimiento\"\"\"
+        return mu_max * S / (Ks + S)
+    @staticmethod
+    def logistic(t, K, r, t0):
+        \"\"\"Modelo logístico\"\"\"
+        return K / (1 + np.exp(-r * (t - t0)))
+    @staticmethod
+    def gompertz(t, A, mu, lambda_param):
+        \"\"\"Modelo de Gompertz\"\"\"
+        return A * np.exp(-np.exp(mu * np.e / A * (lambda_param - t) + 1))
+    @staticmethod
+    def michaelis_menten(S, Vmax, Km):
+        \"\"\"Modelo de Michaelis-Menten\"\"\"
+        return Vmax * S / (Km + S)
+    @staticmethod
+    def luedeking_piret_integrated(t, X0, mu_max, alpha, beta):
+        \"\"\"Modelo de Luedeking-Piret integrado\"\"\"
+        X = X0 * np.exp(mu_max * t)
+        P = alpha * (X - X0) + beta * X0 * (np.exp(mu_max * t) - 1) / mu_max
+        return P
+# Ejemplo de uso
 if __name__ == "__main__":
+    print("🧬 Sistema de Análisis Comparativo de Modelos Biotecnológicos")
+    print("="*60)
+    # Crear analizador
+    analyzer = ComparativeModelAnalyzer()
+    # Instrucciones
+    print("\\n📋 INSTRUCCIONES DE USO:")
+    print("1. analyzer.load_results('tu_archivo.csv')")
+    print("2. analyzer.analyze_model_quality()")
+    print("3. analyzer.analyze_by_category()")
+    print("4. analyzer.plot_comparison()")
+    print("5. analyzer.generate_report()")
+    print("\\n✨ ¡Sistema listo para análisis!")
 """
     return code
+# Interfaz Gradio optimizada
 def create_interface():
     with gr.Blocks(
+        title="Analizador Comparativo de Modelos Biotecnológicos",
         theme=gr.themes.Soft(),
         css="""
         .gradio-container {
             border-radius: 10px;
             border-left: 5px solid #4CAF50;
         }
+        .comparison-table {
+            background-color: #f9f9f9;
+            padding: 10px;
+            border-radius: 8px;
+            font-family: monospace;
+        }
         """
     ) as demo:
         gr.Markdown("""
+        # 🧬 Analizador Comparativo de Modelos Biotecnológicos
+        ### 🎯 Especializado en:
+        - **Análisis comparativo** de resultados de ajuste de modelos matemáticos
+        - **Determinación del mejor modelo** con justificación numérica
+        - **Análisis específico** para biomasa, sustrato y producto
+        - **Conclusiones numéricas** detalladas y ordenadas
+        - **Generación de código** para implementación y análisis
+        ### 📊 Métricas analizadas:
+        - R² (Coeficiente de determinación)
+        - RMSE (Error cuadrático medio)
+        - AIC/BIC (Criterios de información)
+        - Parámetros específicos del modelo
+        - Intervalos de confianza
         """)
         with gr.Row():
                     info="Selecciona el modelo de IA"
                 )
+                detail_level = gr.Radio(
+                    choices=["detallado", "resumido"],
+                    value="detallado",
+                    label="📋 Nivel de detalle del análisis",
+                    info="Detallado: análisis completo | Resumido: puntos clave"
+                )
                 analyze_btn = gr.Button(
+                    "🚀 Analizar y Comparar Modelos",
                     variant="primary",
                     size="lg"
                 )
             with gr.Column(scale=2):
                 analysis_output = gr.Markdown(
+                    label="📊 Análisis Comparativo",
                     elem_classes=["highlight-results"]
                 )
                 code_output = gr.Code(
+                    label="💻 Código de Implementación",
                     language="python",
+                    interactive=True,
+                    lines=20
                 )
+        # Guía de formato de datos
+        with gr.Accordion("📋 Formato de datos esperado", open=False):
+            gr.Markdown("""
+            ### Estructura ideal del CSV/Excel:
+            | Model | R2 | RMSE | AIC | BIC | mu_max | Ks | Parameters |
+            |-------|-----|------|-----|-----|--------|-------|------------|
+            | Monod | 0.985 | 0.023 | -45.2 | -42.1 | 0.45 | 2.1 | {...} |
+            | Logistic | 0.976 | 0.031 | -42.1 | -39.5 | 0.42 | - | {...} |
+            | Gompertz | 0.992 | 0.018 | -48.5 | -45.2 | 0.48 | - | {...} |
+            **Columnas mínimas requeridas:**
+            - `Model` o `Modelo`: Nombre del modelo
+            - `R2` o `R_squared`: Coeficiente de determinación
+            - `RMSE` o `MSE`: Error de ajuste
+            **Columnas opcionales pero recomendadas:**
+            - `AIC`, `BIC`: Criterios de información
+            - Parámetros específicos del modelo
+            - `SE` o `Standard_Error`: Errores estándar
+            - `CI_lower`, `CI_upper`: Intervalos de confianza
+            """)
         # Ejemplos
         gr.Examples(
             examples=[
+                [["examples/biomass_models_comparison.csv"], "claude-3-5-sonnet-20241022", "detallado"],
+                [["examples/substrate_kinetics_results.xlsx"], "claude-3-5-sonnet-20241022", "resumido"],
+                [["examples/product_formation_fits.csv"], "claude-3-opus-20240229", "detallado"]
             ],
+            inputs=[files_input, model_selector, detail_level],
+            label="📚 Ejemplos de análisis"
         )
         # Eventos
         analyze_btn.click(
+            fn=lambda files, model, detail: process_files(files, model, detail) if files else (
+                "Por favor sube archivos con resultados de ajuste para analizar",
+                ""
             ),
+            inputs=[files_input, model_selector, detail_level],
             outputs=[analysis_output, code_output]
         )
+        # Footer con información adicional
+        gr.Markdown("""
+        ---
+        ### 🔍 Qué analiza específicamente:
+        1. **Comparación de modelos**: Ranking basado en múltiples métricas
+        2. **Mejor modelo**: Identificación y justificación numérica
+        3. **Análisis por tipo**:
+           - **Biomasa**: μmax, Xmax, tiempo de duplicación
+           - **Sustrato**: Ks, Km, velocidades de consumo, Yx/s
+           - **Producto**: α, β, productividad, Yp/x
+        4. **Significado biológico**: Interpretación de parámetros
+        5. **Conclusiones numéricas**: Valores óptimos, rangos de operación
+        6. **Código Python**: Implementación lista para usar
+        ### 💡 Tips para mejores resultados:
+        - Incluye todas las métricas de ajuste disponibles
+        - Usa nombres descriptivos para los modelos
+        - Incluye errores estándar si están disponibles
+        - Añade información de condiciones experimentales si es relevante
+        """)
         # Cargar info inicial del modelo
         demo.load(
             fn=lambda: update_model_info("claude-3-5-sonnet-20241022"),