import gradio as gr
import anthropic
import PyPDF2
import io
import os
import json
from typing import Dict, List, Tuple
import re

# Inicializar cliente Anthropic
client = anthropic.Anthropic()

# Modelos de Claude disponibles (actualizados)
CLAUDE_MODELS = {
    "claude-opus-4-20250514": {
        "name": "Claude Opus 4 (Latest)",
        "description": "Modelo más potente para desafíos complejos",
        "max_tokens": 4000,
        "best_for": "Análisis muy detallados y complejos"
    },
    "claude-sonnet-4-20250514": {
        "name": "Claude Sonnet 4 (Latest)",
        "description": "Modelo inteligente y eficiente para uso cotidiano",
        "max_tokens": 4000,
        "best_for": "Análisis general, recomendado para la mayoría de casos"
    },
    "claude-3-5-haiku-20241022": {
        "name": "Claude 3.5 Haiku (Latest)",
        "description": "Modelo más rápido para tareas diarias",
        "max_tokens": 4000,
        "best_for": "Análisis rápidos y económicos"
    },
    "claude-3-7-sonnet-20250219": {
        "name": "Claude 3.7 Sonnet",
        "description": "Modelo avanzado de la serie 3.7",
        "max_tokens": 4000,
        "best_for": "Análisis equilibrados con alta calidad"
    },
    "claude-3-5-sonnet-20241022": {
        "name": "Claude 3.5 Sonnet (Oct 2024)",
        "description": "Excelente balance entre velocidad y capacidad",
        "max_tokens": 4000,
        "best_for": "Análisis rápidos y precisos"
    }
}

# Base de conocimientos de modelos matemáticos biotecnológicos
BIOTECH_MODELS = {
    "crecimiento_biomasa": {
        "Monod": {
            "ecuacion": "μ = μmax × (S / (Ks + S))",
            "parametros": ["μmax (h⁻¹)", "Ks (g/L)"],
            "aplicacion": "Crecimiento limitado por sustrato único",
            "fuentes": "Cambridge, MIT, DTU"
        },
        "Logístico": {
            "ecuacion": "dX/dt = μmax × X × (1 - X/Xmax)",
            "parametros": ["μmax (h⁻¹)", "Xmax (g/L)"],
            "aplicacion": "Sistemas cerrados batch",
            "fuentes": "Cranfield, Swansea, HAL Theses"
        },
        "Gompertz": {
            "ecuacion": "X(t) = Xmax × exp(-exp((μmax × e / Xmax) × (λ - t) + 1))",
            "parametros": ["λ (h)", "μmax (h⁻¹)", "Xmax (g/L)"],
            "aplicacion": "Crecimiento con fase lag pronunciada",
            "fuentes": "Lund University, NC State"
        },
        "Contois": {
            "ecuacion": "μ = μmax × S / (Ks × X + S)",
            "parametros": ["μmax (h⁻¹)", "Ks (adimensional)"],
            "aplicacion": "Dependencia de concentración de biomasa",
            "fuentes": "Virginia Tech, UMONS"
        },
        "Andrews": {
            "ecuacion": "μ = μmax × S / (Ks + S + S²/Ki)",
            "parametros": ["μmax (h⁻¹)", "Ks (g/L)", "Ki (g/L)"],
            "aplicacion": "Inhibición a altas concentraciones de sustrato",
            "fuentes": "RWTH Aachen, TU Berlin"
        }
    },
    "consumo_sustrato": {
        "Michaelis-Menten": {
            "ecuacion": "v = Vmax × S / (Km + S)",
            "parametros": ["Vmax", "Km"],
            "aplicacion": "Cinética enzimática básica",
            "fuentes": "Warsaw Univ Tech, Food Processing"
        },
        "Inhibición Competitiva": {
            "ecuacion": "v = Vmax × S / (Km × (1 + I/Ki) + S)",
            "parametros": ["Vmax", "Km", "I", "Ki"],
            "aplicacion": "Inhibición competitiva",
            "fuentes": "TU Delft, Uni Düsseldorf"
        },
        "Sustrato Dual": {
            "ecuacion": "μ = μmax × (S1/(Ks1 + S1)) × (S2/(Ks2 + S2))",
            "parametros": ["μmax", "S1", "S2", "Ks1", "Ks2"],
            "aplicacion": "Crecimiento con múltiples sustratos limitantes",
            "fuentes": "Cornell, TU Clausthal"
        }
    },
    "formacion_producto": {
        "Luedeking-Piret": {
            "ecuacion": "dP/dt = α × (dX/dt) + β × X",
            "parametros": ["α (asociado)", "β (no asociado)"],
            "aplicacion": "Producción mixta asociada/no asociada",
            "fuentes": "Cambridge, E-Century"
        },
        "Inhibición por Producto": {
            "ecuacion": "μ = μmax × (1 - P/Pmax)^n",
            "parametros": ["μmax", "Pmax", "n"],
            "aplicacion": "Fermentaciones inhibidas por producto",
            "fuentes": "Virginia Tech, EcoEET"
        }
    },
    "biorreactores": {
        "Batch": {
            "ecuaciones": [
                "dX/dt = μ × X",
                "dS/dt = -μ × X / YX/S",
                "dP/dt = α × μ × X + β × X"
            ],
            "aplicacion": "Procesos discontinuos",
            "fuentes": "DTU, UCL"
        },
        "Fed-Batch": {
            "ecuaciones": [
                "dX/dt = μ × X - D × X",
                "dS/dt = D × (Sf - S) - μ × X / YX/S"
            ],
            "parametros": ["D (tasa dilución)", "Sf"],
            "aplicacion": "Alimentación controlada",
            "fuentes": "Core Academic, UNESP"
        },
        "CSTR": {
            "ecuaciones": [
                "dX/dt = μ × X - D × X",
                "dS/dt = D × (Sf - S) - μ × X / YX/S"
            ],
            "aplicacion": "Estado estacionario continuo",
            "fuentes": "MIT, UCL"
        }
    },
    "transferencia_masa": {
        "OTR": {
            "ecuacion": "OTR = kLa × (C* - CL)",
            "parametros": ["kLa", "C*", "CL"],
            "aplicacion": "Transferencia de oxígeno",
            "fuentes": "UK Kentucky, TU Delft"
        }
    },
    "metabolicos_avanzados": {
        "FBA": {
            "ecuacion": "S × v = 0, vmin ≤ v ≤ vmax",
            "aplicacion": "Análisis de redes metabólicas",
            "fuentes": "Cornell, TU Clausthal"
        }
    }
}

def extract_text_from_pdf(pdf_file) -> str:
    """Extrae texto de un archivo PDF"""
    try:
        pdf_reader = PyPDF2.PdfReader(io.BytesIO(pdf_file))
        text = ""
        for page in pdf_reader.pages:
            text += page.extract_text() + "\n"
        return text
    except Exception as e:
        return f"Error al leer PDF: {str(e)}"

def analyze_with_ai(pdf_text: str, analysis_type: str, claude_model: str = "claude-opus-4-20250514") -> str:
    """Analiza el texto del PDF usando IA con el modelo de Claude seleccionado"""
    
    prompts = {
        "identificar_proceso": """
        Analiza este texto científico y identifica:
        1. ¿Qué tipo de proceso biotecnológico se describe?
        2. ¿Qué microorganismos están involucrados?
        3. ¿Qué sustratos y productos se mencionan?
        4. ¿Qué tipo de reactor o sistema se utiliza?
        5. ¿Hay menciones de inhibición, limitación o efectos específicos?
        
        Responde de manera concisa y técnica.
        """,
        
        "recomendar_modelos": """
        Basado en el análisis del proceso biotecnológico, recomienda los modelos matemáticos más apropiados de esta lista:
        
        MODELOS DISPONIBLES:
        - Crecimiento: Monod, Logístico, Gompertz, Contois, Andrews
        - Enzimático: Michaelis-Menten, Inhibición Competitiva, Sustrato Dual  
        - Producto: Luedeking-Piret, Inhibición por Producto
        - Reactores: Batch, Fed-Batch, CSTR
        - Transferencia: OTR
        - Avanzados: FBA
        
        Para cada modelo recomendado, explica por qué es apropiado para este proceso específico.
        """,
        
        "parametros_estimacion": """
        Identifica qué parámetros cinéticos podrían necesitar estimación experimental para este proceso:
        1. Parámetros de crecimiento (μmax, Ks, etc.)
        2. Parámetros de producto (α, β, etc.)
        3. Parámetros de inhibición (Ki, Pmax, etc.)
        4. Coeficientes de rendimiento (YX/S, YP/S, etc.)
        
        Sugiere métodos experimentales para determinar cada parámetro.
        """
    }
    
    try:
        # Obtener configuración del modelo seleccionado
        model_config = CLAUDE_MODELS.get(claude_model, CLAUDE_MODELS["claude-opus-4-20250514"])
        
        response = client.messages.create(
            model=claude_model,
            max_tokens=model_config["max_tokens"],
            system="Eres un experto en biotecnología y modelado matemático de bioprocesos. Analiza textos científicos y proporciona recomendaciones técnicas precisas basadas en la extensa base de conocimientos de 140 modelos matemáticos biotecnológicos de universidades prestigiosas.",
            messages=[
                {
                    "role": "user", 
                    "content": f"{prompts[analysis_type]}\n\nTEXTO A ANALIZAR:\n{pdf_text[:4000]}"
                }
            ]
        )
        return response.content[0].text
    except Exception as e:
        return f"Error en análisis con IA ({claude_model}): {str(e)}"

def get_model_details(recommended_models: List[str]) -> str:
    """Obtiene detalles de los modelos recomendados"""
    details = "## 📋 DETALLES DE MODELOS RECOMENDADOS\n\n"
    
    for category, models in BIOTECH_MODELS.items():
        for model_name, model_info in models.items():
            if any(model_name.lower() in rec.lower() for rec in recommended_models):
                details += f"### {model_name}\n"
                if "ecuacion" in model_info:
                    details += f"**Ecuación:** `{model_info['ecuacion']}`\n\n"
                elif "ecuaciones" in model_info:
                    details += "**Ecuaciones:**\n"
                    for eq in model_info['ecuaciones']:
                        details += f"- `{eq}`\n"
                    details += "\n"
                
                if "parametros" in model_info:
                    details += f"**Parámetros:** {', '.join(model_info['parametros'])}\n\n"
                
                details += f"**Aplicación:** {model_info['aplicacion']}\n\n"
                details += f"**Fuentes académicas:** {model_info['fuentes']}\n\n"
                details += "---\n\n"
    
    return details

def generate_implementation_code(models: List[str]) -> str:
    """Genera código Python para implementar los modelos"""
    code = """
import numpy as np
import matplotlib.pyplot as plt
from scipy.integrate import odeint
from scipy.optimize import curve_fit

# Implementación de modelos biotecnológicos recomendados

"""
    
    if any("monod" in m.lower() for m in models):
        code += """
def monod_model(S, mu_max, Ks):
    \"\"\"Modelo de Monod para crecimiento\"\"\"
    return mu_max * S / (Ks + S)

def batch_monod(y, t, mu_max, Ks, Yxs):
    \"\"\"Sistema batch con cinética de Monod\"\"\"
    X, S = y
    mu = monod_model(S, mu_max, Ks)
    dXdt = mu * X
    dSdt = -mu * X / Yxs
    return [dXdt, dSdt]

"""
    
    if any("luedeking" in m.lower() for m in models):
        code += """
def luedeking_piret(X, dXdt, alpha, beta):
    \"\"\"Modelo de Luedeking-Piret para formación de producto\"\"\"
    return alpha * dXdt + beta * X

"""
    
    if any("michaelis" in m.lower() for m in models):
        code += """
def michaelis_menten(S, Vmax, Km):
    \"\"\"Cinética de Michaelis-Menten\"\"\"
    return Vmax * S / (Km + S)

"""
    
    code += """
# Ejemplo de ajuste de parámetros
def fit_model_parameters(time_data, concentration_data, model_function):
    \"\"\"Ajusta parámetros del modelo a datos experimentales\"\"\"
    try:
        popt, pcov = curve_fit(model_function, time_data, concentration_data)
        return popt, pcov
    except Exception as e:
        print(f"Error en ajuste: {e}")
        return None, None

# Ejemplo de simulación
def simulate_process(initial_conditions, time_span, parameters):
    \"\"\"Simula el proceso biotecnológico\"\"\"
    t = np.linspace(0, time_span, 100)
    # Aquí integrarías tu sistema de ecuaciones específico
    # sol = odeint(your_system, initial_conditions, t, args=parameters)
    return t, None  # Reemplazar con solución real

print("Modelos implementados exitosamente!")
print("Personaliza los parámetros según tus datos experimentales.")
"""
    
    return code

def comprehensive_analysis(pdf_file, claude_model: str = "claude-opus-4-20250514") -> Tuple[str, str, str]:
    """Análisis completo del PDF con el modelo de Claude seleccionado"""
    if pdf_file is None:
        return "❌ Por favor sube un archivo PDF", "", "⚠️ No hay archivo para analizar"
    
    try:
        # Extraer texto
        pdf_text = extract_text_from_pdf(pdf_file)
        if "Error" in pdf_text:
            return pdf_text, "", "❌ Error al procesar PDF"
        
        # Mostrar modelo seleccionado
        model_info = CLAUDE_MODELS.get(claude_model, CLAUDE_MODELS["claude-opus-4-20250514"])
        status_msg = f"🤖 Analizando con {model_info['name']}..."
        
        # Análisis por etapas
        process_analysis = analyze_with_ai(pdf_text, "identificar_proceso", claude_model)
        model_recommendations = analyze_with_ai(pdf_text, "recomendar_modelos", claude_model)
        parameter_analysis = analyze_with_ai(pdf_text, "parametros_estimacion", claude_model)
        
        # Extraer modelos recomendados para obtener detalles
        recommended_models = []
        for category, models in BIOTECH_MODELS.items():
            for model_name in models.keys():
                if model_name.lower() in model_recommendations.lower():
                    recommended_models.append(model_name)
        
        model_details = get_model_details(recommended_models)
        implementation_code = generate_implementation_code(recommended_models)
        
        # Formatear respuesta final
        final_report = f"""
# 🧬 ANÁLISIS BIOTECNOLÓGICO COMPLETO

## 🔍 IDENTIFICACIÓN DEL PROCESO
{process_analysis}

## 🎯 MODELOS RECOMENDADOS
{model_recommendations}

## ⚙️ ANÁLISIS DE PARÁMETROS
{parameter_analysis}

{model_details}

## 💡 RECOMENDACIONES FINALES
- Validar modelos con datos experimentales
- Considerar efectos de escala en el reactor
- Monitorear parámetros críticos identificados
- Implementar control adaptativo si es necesario
"""
        
        success_msg = f"✅ Análisis completado con {model_info['name']} - {len(recommended_models)} modelos identificados"
        
        return final_report, implementation_code, success_msg
        
    except Exception as e:
        return f"❌ Error durante el análisis: {str(e)}", "", "❌ Error en el procesamiento"

# Crear interfaz Gradio
def create_interface():
    with gr.Blocks(title="Analizador de Modelos Biotecnológicos", theme=gr.themes.Soft()) as demo:
        gr.Markdown("""
        # 🧬 Analizador de Modelos Matemáticos Biotecnológicos
        
        **Herramienta inteligente basada en 140+ modelos de universidades prestigiosas**
        
        📄 Sube tu PDF científico y obtén:
        - ✅ Identificación automática del proceso biotecnológico
        - 🎯 Recomendación de modelos matemáticos apropiados  
        - 📊 Análisis de parámetros a estimar
        - 🔬 Código Python listo para implementar
        - 📚 Referencias académicas validadas
        """)
        
        with gr.Row():
            with gr.Column(scale=1):
                pdf_input = gr.File(
                    label="📄 Subir PDF Científico",
                    file_types=[".pdf"],
                    type="binary"
                )
                
                # Selector de modelo Claude
                model_selector = gr.Dropdown(
                    choices=list(CLAUDE_MODELS.keys()),
                    value="claude-opus-4-20250514",
                    label="🤖 Seleccionar Modelo Claude",
                    info="Elige el modelo que mejor se adapte a tu análisis"
                )
                
                # Mostrar información del modelo seleccionado
                def update_model_info(selected_model):
                    model_info = CLAUDE_MODELS.get(selected_model, {})
                    return f"**{model_info.get('name', 'N/A')}**\n{model_info.get('description', 'N/A')}\n\n*Mejor para:* {model_info.get('best_for', 'N/A')}"
                
                model_info_display = gr.Markdown(
                    value=update_model_info("claude-opus-4-20250514"),
                    label="ℹ️ Información del Modelo"
                )
                
                analyze_btn = gr.Button(
                    "🚀 Analizar con IA",
                    variant="primary",
                    size="lg"
                )
                
                status = gr.Textbox(
                    label="📊 Estado del Análisis",
                    interactive=False,
                    value="Listo para analizar..."
                )
            
            with gr.Column(scale=2):
                analysis_output = gr.Markdown(
                    label="📋 Reporte de Análisis",
                    value="**Instrucciones:**\n1. Sube un archivo PDF con contenido biotecnológico\n2. Selecciona el modelo Claude apropiado\n3. Haz clic en 'Analizar con IA'\n4. Revisa el análisis y código generado"
                )
        
        with gr.Row():
            code_output = gr.Code(
                label="🐍 Código Python Generado",
                language="python",
                interactive=True,
                value="# El código Python se generará aquí después del análisis..."
            )
        
        with gr.Row():
            gr.Markdown("""
            ### 📚 Base de Conocimientos Incluye:
            - **35+ Universidades:** MIT, Cambridge, UCL, Cornell, TU Delft, DTU, etc.
            - **8 Categorías:** Crecimiento, Sustrato, Producto, Reactores, Transferencia, Metabólicos
            - **40+ Modelos:** Desde Monod clásico hasta FBA avanzado
            - **Validación académica:** 140 PDFs científicos analizados
            
            ### 🔧 Modelos Claude Disponibles:
            - **Opus 4:** Máximo rendimiento para análisis complejos
            - **Sonnet 4:** Equilibrio perfecto para uso general
            - **Haiku 3.5:** Velocidad optimizada para análisis rápidos
            """)
        
        # Conectar eventos
        analyze_btn.click(
            comprehensive_analysis,
            inputs=[pdf_input, model_selector],
            outputs=[analysis_output, code_output, status]
        )
        
        # Actualizar información del modelo cuando se cambie la selección
        model_selector.change(
            update_model_info,
            inputs=[model_selector],
            outputs=[model_info_display]
        )
    
    return demo

# Ejecutar aplicación
if __name__ == "__main__":
    if not os.getenv("ANTHROPIC_API_KEY"):
        print("⚠️  Configura ANTHROPIC_API_KEY como variable de entorno")
        print("export ANTHROPIC_API_KEY='tu-clave-api'")
    else:
        demo = create_interface()
        print("🚀 Iniciando Analizador de Modelos Biotecnológicos...")
        demo.launch(
            server_name="0.0.0.0",
            server_port=7860,
            share=False
        )