Spaces:
Runtime error
Runtime error
import datetime | |
import time | |
from streamlit import components | |
import altair as alt | |
import pandas as pd | |
import streamlit as st | |
from PIL import Image | |
from sklearn.linear_model import LinearRegression | |
from streamlit_option_menu import option_menu | |
import plotly.express as px | |
# from streamlit.components.v1 import IFrame | |
image = Image.open('./assets/logo_latam_brain.png') | |
logo = Image.open('./assets/LatamBrainlogo.png') | |
scrum = Image.open("./assets/Scrum'ProcessLB.png") | |
dashboard_ejemplo = Image.open('./assets/dashboard_ejemplo.png') | |
df = pd.read_csv('./ML/ds_salaries.csv') | |
st.markdown("""<link href="https://cdn.jsdelivr.net/npm/bootstrap@5.3.0-alpha3/dist/css/bootstrap.min.css" rel="stylesheet" integrity="sha384-KK94CHFLLe+nY2dmCWGMq91rCGa5gtU4mk92HdvYe+M/SXH301p5ILy+dN9+nJOZ" crossorigin="anonymous"> | |
<script src="https://cdn.jsdelivr.net/npm/bootstrap@5.3.0-alpha3/dist/js/bootstrap.bundle.min.js" integrity="sha384-ENjdO4Dr2bkBIFxQpeoTz1HIcje39Wm4jDKdf19U8gI4ddQ3GYNS7NTKfAdVQSZe" crossorigin="anonymous"></script>""", | |
unsafe_allow_html=True) | |
# Menu horizontal | |
selected2 = option_menu(None, ["Home", "Projects", "New", "Contact US"], | |
icons=['house', 'bi-archive', | |
"bi-arrow-up-right-square", "bi-envelope"], | |
menu_icon="cast", default_index=0, | |
orientation="horizontal", | |
) | |
# Pagina HOME | |
if selected2 == "Home": | |
col1, col2 = st.columns(2) | |
col1.markdown(""" | |
<br/> | |
<br/> | |
<br/> | |
<h1 style="text-align:center; font-weight:bold; | |
text-shadow:0px 0px 10px #5c62ac;font-size:3rem">LatamBrain</h1> | |
<h5 style="text-align:center;color:#5c62ac">tú cerebro tecnológico</h5> | |
<br /> | |
""", unsafe_allow_html=True) | |
col2.image(image, width=300) | |
st.markdown(''' | |
<br> | |
<h2>Quienes somos?</h2> | |
<hr> | |
<p>LatamBrain es una startup latinoamericana altamente innovadora y | |
tecnológica que está aprovechando las últimas tendencias en tecnología | |
para brindar soluciones personalizadas, seguras y eficientes a sus | |
clientes. | |
Si busca soluciones que lo preparen para el futuro, | |
no dude en contactar a LatamBrain. | |
</p> | |
<p>LatamBrain, tú cerebro tecnológico!</p> | |
''', unsafe_allow_html=True) | |
st.markdown(''' | |
<br> | |
<h2>Servicios</h2> | |
<hr> | |
''', unsafe_allow_html=True) | |
col1, col2, col3 = st.columns(3) | |
col1.markdown(''' | |
<li>Data Análisis | |
<li>Reportes financieros | |
<li>KPI's personalizados | |
<li>Asesoramientos y Plan de Ejecución | |
<li>Y más.. | |
''', unsafe_allow_html=True) | |
col2.markdown(''' | |
<li>Machine Learning | |
<li>Deep Learning | |
<li>Automatización de con ML | |
<li>ChatBot | |
<li>Y más... | |
''', unsafe_allow_html=True) | |
col3.markdown(''' | |
<li>Cloud AWS | |
<li>Máxima seguridad en tús datos | |
<li>Disponibilidad y velocidad de datos | |
<li>Y más... | |
''', unsafe_allow_html=True) | |
st.markdown(''' | |
<br> | |
<h2>Nosotros y Como Trabajamos</h2> | |
<hr> | |
''', unsafe_allow_html=True) | |
st.image(scrum) | |
# st.image(logo, width=700) | |
st.markdown(''' | |
<br> | |
<h2>Opiniones</h2> | |
<hr> | |
''', unsafe_allow_html=True) | |
col1, col2, col3 = st.columns(3) | |
catriel = ''' | |
<h4>Catriel Pérez</h4> | |
<p style="margin-top:-20px">Data Engineer</p> | |
<p>Ha sido una experiencia increíble trabajar con este equipo. Todos | |
han sido muy profesionales y comprometidos con el éxito del proyecto. Me siento agradecido de haber formado parte de este equipo y haber aprendido tanto en el proceso. Y esto... recién comienza!</p> | |
<a href="mailto:perezcatriel@gmail.com">Contactame...</a> | |
<p>24 de abril del 2023</p> | |
''' | |
mati = ''' | |
<h4>Matias Benitez</h4> | |
<p style="margin-top:-20px">Machine Learning</p> | |
<p>Trabajar en este proyecto ha sido una verdadera aventura. He enfrentado muchos desafíos y he aprendido cosas nuevas todos los días. El equipo con el que he trabajado ha sido excepcional, siempre dispuesto a ayudar y colaborar en todo momento. Me llevo una experiencia enriquecedora y valiosa.</p> | |
<a href="mailto:matiasbenitezcarrizo@gmail.com">Contactame...</a> | |
<p>24 de abril del 2023</p> | |
''' | |
luis = ''' | |
<h4>Luis Rascón</h4> | |
<p style="margin-top:-20px">Data Analyst</p> | |
<p>No tengo más que palabras de agradecimiento por esta experiencia. He tenido la oportunidad de trabajar con gente talentosa y apasionada por su trabajo, lo que ha hecho que el proyecto sea un éxito rotundo. Me llevo muchas lecciones aprendidas y nuevas habilidades que me servirán en mi carrera profesional. Ha sido una experiencia inolvidable.</p> | |
<a href="mailto:luis.francisco.rc@gmail.com">Contactame...</a> | |
<p>24 de abril del 2023</p> | |
''' | |
col1.markdown(luis, unsafe_allow_html=True) | |
col2.markdown(mati, unsafe_allow_html=True) | |
col3.markdown(catriel, unsafe_allow_html=True) | |
# Pagina Projects | |
if selected2 == "Projects": | |
st.markdown(''' | |
<h1 style="text-shadow:0 0 10px #5c62ac;font-weight:bold">Data | |
World Jobs</h1> | |
''', unsafe_allow_html=True) | |
st.markdown(''' | |
<h2>Situación actual</h2> | |
<hr> | |
''', unsafe_allow_html=True) | |
st.write(''' | |
Primero, es importante tener en cuenta que la demanda de trabajos relacionados con la tecnología y la analítica de datos ha aumentado significativamente en los últimos años, lo que ha llevado a que muchos trabajos de data analyst y data scientist se hayan convertido en algunas de las posiciones más populares y mejor remuneradas en el mercado laboral. | |
En Latinoamérica, el crecimiento de la industria tecnológica y de la analítica de datos se ha ido acelerando en los últimos años, especialmente en países como México, Brasil, Argentina, Colombia y Chile. Estos países han experimentado una demanda creciente de profesionales en el área de la tecnología y la analítica de datos, lo que ha llevado a que la mayoría de los empleos en estas áreas se concentren en las grandes ciudades de estos países. | |
Según los informes de los portales de empleo en línea, las posiciones de data analyst en Latinoamérica tienen un salario promedio anual de alrededor de $ 25,000 a $ 40,000 dólares. Sin embargo, es importante tener en cuenta que el salario puede variar dependiendo del país, la ciudad, la experiencia del profesional y la empresa. | |
Además, hay una serie de habilidades que son muy importantes para los profesionales que buscan trabajar en el área de data. Algunas de las habilidades más importantes para un data analyst son: | |
Conocimientos avanzados en Excel y otras herramientas de análisis de datos como Python, R, SQL, entre otras. | |
Habilidad para trabajar con grandes volúmenes de datos y bases de datos complejas. | |
Conocimientos de estadística y análisis de datos. | |
Habilidad para presentar los resultados de los análisis de datos en informes y presentaciones claras y precisas. | |
Habilidad para trabajar en equipo y colaborar con otros profesionales. | |
En resumen, la industria de la tecnología y la analítica de datos está en constante crecimiento en Latinoamérica, lo que ha llevado a una alta demanda de profesionales en el área de data. Los salarios en este campo son competitivos y las habilidades requeridas para ser un buen data analyst incluyen una combinación de conocimientos técnicos y habilidades blandas. | |
''', unsafe_allow_html=True) | |
st.write("Este es mi dashboard de Tableau:") | |
####### | |
st.markdown('''<iframe src="https://public.tableau.com/views/latam_brain_mvp/General?:language=es-ES&publish=yes&:display_count=n&:origin=viz_share_link" width="100%" height="800"></iframe>''', unsafe_allow_html=True) | |
tableau_url = "https://public.tableau.com/views/latam_brain_mvp/DashboardGeneralDataJobs?:language=es-ES&:display_count=n&:origin=viz_share_link" | |
# Incruste el dashboard de Tableau utilizando components.html | |
st.components.v1.html( | |
f'<iframe src="{tableau_url}" width="100%" height="800"></iframe>', | |
height=800) | |
######### | |
st.markdown(''' | |
<br> | |
<h3>Dashboard contexto actual</h3> | |
<hr> | |
''', unsafe_allow_html=True) | |
st.image(dashboard_ejemplo, width=700) | |
# Crea un gráfico | |
st.bar_chart(df['salary']) | |
st.title('Ejemplo de gráfico de barras apiladas') | |
chart = alt.Chart(df).mark_bar().encode( | |
x='work_year:N', | |
y='salary:Q', | |
color='categoria:N' | |
).properties( | |
width=700, | |
height=400 | |
) | |
st.altair_chart(chart, use_container_width=True) | |
st.title('Ejemplo de gráfico de líneas') | |
chart = alt.Chart(df).mark_line().encode( | |
x='work_year:N', | |
y='salary:Q', | |
color='categoria:N' | |
).properties( | |
width=700, | |
height=400 | |
) | |
st.altair_chart(chart, use_container_width=True) | |
st.title('Ejemplo de gráfico de dispersión') | |
chart = alt.Chart(df).mark_point().encode( | |
x='work_year:Q', | |
y='salary:Q', | |
color='genero:N' | |
).properties( | |
width=700, | |
height=400 | |
) | |
st.altair_chart(chart, use_container_width=True) | |
st.title('Ejemplo de gráfico de pastel') | |
fig = px.pie(df, values='work_year', names='salary') | |
st.plotly_chart(fig, use_container_width=True) | |
st.markdown(''' | |
<br> | |
<h2>Nuestra Solución</h2> | |
<hr> | |
''', unsafe_allow_html=True) | |
st.write(''' | |
Gracias por compartir su análisis sobre el mercado de empleo de Data en Latinoamérica.Sobre la base de los hallazgos que ha presentado, se pueden identificar algunas oportunidades y desafíos clave para el crecimiento del sector en la región. | |
Algunas de las principales oportunidades incluyen la creciente demanda de habilidades en Data Science y Machine Learning, la expansión de la adopción de tecnologías de Big Data, y el aumento del interés en la analítica avanzada.Estas tendencias sugieren que hay un mercado creciente para los profesionales de datos en Latinoamérica. | |
Al mismo tiempo, sin embargo, hay algunos desafíos significativos que enfrenta el mercado de empleo de datos en la región.En particular, la falta de habilidades y talento especializado es un problema importante, ya que la mayoría de las empresas no tienen el personal necesario para implementar proyectos de datos complejos.Además, la falta de inversión en tecnologías y herramientas de datos adecuadas y la falta de infraestructura digital suficiente también son barreras para el crecimiento del mercado. | |
Como especialista en Data Analytics, una propuesta de negocio para abordar estos desafíos y aprovechar las oportunidades en el mercado de empleo de datos de Latinoamérica podría ser ofrecer servicios de consultoría y formación para empresas que deseen adoptar tecnologías de Big Data y analítica avanzada.Además, se podría crear una plataforma de datos en línea que brinde acceso a herramientas y recursos de análisis de datos para empresas y profesionales de datos en toda la región.Esta plataforma también podría ofrecer oportunidades de trabajo y proyectos de datos para profesionales de datos en la región. | |
En resumen, el mercado de empleo de datos en Latinoamérica ofrece grandes oportunidades de crecimiento, pero también enfrenta desafíos importantes.Ofrecer servicios de consultoría y formación para empresas que deseen adoptar tecnologías de Big Data y crear una plataforma de datos en línea podría ser una forma de abordar estos desafíos y aprovechar las oportunidades en el mercado de datos de Latinoamérica.''' | |
) | |
st.markdown(''' | |
<br> | |
<h3>Dashboard Solución</h3> | |
<hr> | |
''', unsafe_allow_html=True) | |
st.image(dashboard_ejemplo, width=700) | |
st.markdown(''' | |
<br> | |
<h3>Predicción de nuevos puestos de trabajo con ML</h3> | |
<hr> | |
''', unsafe_allow_html=True) | |
# st.set_page_config(page_title="Predicción de nuevos puestos de trabajo", | |
# page_icon=":bar_chart:", layout="wide") | |
# Cargar los datos | |
# Seleccionar las columnas relevantes | |
df_relevant = df[['job_title', 'work_year']] | |
# Transformar la columna work_year en un tipo date en la columna date | |
df_relevant['date'] = pd.to_datetime(df_relevant['work_year'], format='%Y') | |
# Agregar una columna con el año de creación | |
df_relevant['year'] = pd.DatetimeIndex(df_relevant['date']).year | |
# Contar la cantidad de job_title creados por año | |
job_title_count = df_relevant.groupby('year').count()['job_title'] | |
# Crear un dataframe con la cantidad de job_title creados por año | |
df_job_title_count = pd.DataFrame( | |
{'year': job_title_count.index, | |
'job_title_count': job_title_count.values}) | |
# Crear un modelo de regresión lineal | |
model = LinearRegression() | |
# Entrenar el modelo con los datos históricos | |
X = df_job_title_count[['year']] | |
y = df_job_title_count['job_title_count'] | |
model.fit(X, y) | |
# Obtener el año actual | |
current_year = datetime.datetime.now().year | |
# Predecir la cantidad de nuevos job_title que se crearán este año | |
current_year_input = st.number_input('Ingresa un año:', value=current_year, | |
min_value=current_year, | |
max_value=2050, step=1) | |
if current_year_input < current_year: | |
st.warning('Solo se pueden hacer predicciones para años futuros.') | |
current_year_input = current_year | |
st.write('Se usará el año actual:', current_year_input) | |
with st.spinner('Prediciendo...'): | |
time.sleep(1) | |
job_title_count_pred = model.predict([[current_year_input]]) | |
# Obtener el último año del dataset | |
last_year = df_job_title_count['year'].max() | |
last_year_count = \ | |
df_job_title_count.loc[df_job_title_count['year'] == last_year][ | |
'job_title_count'].values[0] | |
# Mostrar resultados | |
st.write( | |
"Se crearán aproximadamente **{}** nuevos puestos de trabajo este año **{}**.".format( | |
int(job_title_count_pred), current_year_input)) | |
percentage_change = ( | |
job_title_count_pred - last_year_count) / last_year_count * 100 | |
percentage_change = float(percentage_change) | |
if percentage_change >= 0: | |
st.write( | |
"Esto representa un aumento del {:.2f}% con respecto al año {}.".format( | |
percentage_change, last_year)) | |
else: | |
st.write( | |
"Esto representa una disminución del {:.2f}% con respecto al año {}".format( | |
abs(percentage_change), last_year)) | |
# Crear un gráfico de línea | |
line_chart = alt.Chart(df_job_title_count).mark_line().encode( | |
x='year', | |
y='job_title_count' | |
).properties( | |
title='Cantidad de nuevos puestos de trabajo por año', | |
width=300, | |
height=200 | |
).configure_axis( | |
labelFontSize=14, | |
titleFontSize=16 | |
) | |
# Crear un punto para mostrar el valor predicho | |
point = alt.Chart(df_job_title_count.iloc[-1:]).mark_point( | |
color='#5c62ac').encode( | |
x='year', | |
y='job_title_count' | |
) | |
# Mostrar la gráfica actualizada con el valor predicho para el año ingresado | |
# st.altair_chart(line_chart, use_container_width=True) | |
# Crear botón para graficar la predicción | |
if st.button('Mostrar gráfico de predicción'): | |
# Crear dataframe con los años y las predicciones | |
years = list(range(last_year, current_year + current_year_input - 2000)) | |
predictions = model.predict([[year] for year in years]) | |
df_predictions = pd.DataFrame( | |
{'year': years, 'job_title_count_pred': predictions}) | |
# Crear gráfico de línea | |
line_chart = alt.Chart(df_predictions).mark_line().encode( | |
x='year', | |
y='job_title_count_pred' | |
).properties( | |
width=700, | |
height=400 | |
) | |
# Agregar capa con punto violeta en el valor predicho para el año actual | |
current_year_pred = int(model.predict([[current_year_input]])[0]) | |
point_chart = alt.Chart(pd.DataFrame( | |
{'x': [current_year_input], 'y': [current_year_pred]})).mark_point( | |
color='#5c62ac', | |
size=300, | |
stroke='#5c62ac', | |
strokeWidth=5).encode( | |
x='x', | |
y='y' | |
) | |
# # ocultar los títulos de los ejes x e y | |
# line_chart.configure_axis( | |
# x=None, | |
# y=None | |
# ) | |
# Mostrar gráfico con la capa adicional del punto rojo | |
st.altair_chart(line_chart + point_chart) | |
st.markdown(''' | |
<br><br><br> | |
<h2>Gracias por su tiempo y atención!</h2> | |
<hr> | |
<h3>Nuevas Propuestas...</h3> | |
<p>Sí te gusto lo que viste, te invito a ver lo que se vendrá en la | |
sección <span style="font-weight:bold">"New"</span></p> | |
''', unsafe_allow_html=True) | |
# | |
if selected2 == "New": | |
progress_text = "Operation in progress. Please wait." | |
my_bar = st.progress(0, text=progress_text) | |
for percent_complete in range(100): | |
time.sleep(0.05) | |
my_bar.progress(percent_complete + 1, text=progress_text) | |
##### | |
import pandas as pd | |
import streamlit as st | |
from sklearn.feature_extraction.text import CountVectorizer | |
from sklearn.naive_bayes import MultinomialNB | |
# Cargar los datos | |
df = pd.read_csv('./assets/dataset_modelo_1.csv') | |
# Crear una lista con todas las skills disponibles | |
all_skills = set() | |
for skills in df.skills: | |
all_skills.update(skills.split(", ")) | |
# Crear un diccionario que relaciona cada skill con su índice en el vector | |
skill_indices = {skill: i for i, skill in enumerate(all_skills)} | |
# Crear una matriz de características con la frecuencia de cada skill en cada fila | |
vectorizer = CountVectorizer(vocabulary=skill_indices.keys(), | |
lowercase=False) | |
X = vectorizer.fit_transform(df.skills) | |
# Entrenar el modelo | |
clf = MultinomialNB() | |
clf.fit(X, df.Aptitude) | |
# Crear la interfaz de usuario con Streamlit | |
st.title("Predicción de aptitud para un 'NUEVO' trabajo") | |
st.write( | |
"Ingrese el título del 'Nuevo' trabajo para ver que habilidades " | |
"son las más " | |
"importantes.") | |
title = st.multiselect("Título del trabajo", df.job_title.unique()) | |
# Crear una función que encuentra las habilidades más importantes para un título dado | |
def get_top_skills(title, limit): | |
# Filtrar el dataframe por el título dado | |
filtered_df = df[df.job_title == title] | |
# Crear una matriz de características con la frecuencia de cada skill en el dataframe filtrado | |
X_filtered = vectorizer.transform(filtered_df.skills) | |
# Calcular la frecuencia de cada habilidad en el dataframe filtrado | |
skill_frequencies = X_filtered.sum(axis=0).A1 | |
# Obtener los nombres de las habilidades | |
skill_names = vectorizer.vocabulary_.keys() | |
# Crear un diccionario que relaciona cada habilidad con su frecuencia | |
skill_freq_dict = dict(zip(skill_names, skill_frequencies)) | |
# Ordenar las habilidades por frecuencia descendente y devolver las más importantes (según el límite dado) | |
top_skills = sorted(skill_freq_dict, key=skill_freq_dict.get, | |
reverse=True)[:limit] | |
return top_skills | |
if title: | |
limit = st.number_input("Cantidad de habilidades a mostrar", value=5, | |
min_value=1, max_value=len(all_skills)) | |
top_skills = get_top_skills(title[0], limit) | |
st.write( | |
f"Las {limit} habilidades más importantes para el trabajo de '{title[0]}' son:") | |
for skill in top_skills: | |
st.write(f"- {skill}") | |
##### | |
##### | |
if selected2 == "Contact US": | |
st.markdown(''' | |
<h2>Presupuesto</h2> | |
<hr> | |
''', unsafe_allow_html=True) | |
# Define los precios para cada opción | |
precio_analisis = 3500 | |
precio_ML = 5500 | |
precio_app = 3000 | |
precio_mantenimiento = 550 | |
# Define las opciones como un diccionario de la forma {nombre_opción: precio_opción} | |
opciones = { | |
"Opción 1": precio_analisis, | |
"Opción 2": precio_ML, | |
"Opción 3": precio_app, | |
"Opción 4": precio_mantenimiento | |
} | |
# Crea un checkbox para cada opción | |
analisis = st.checkbox("Análisis y Reportes") | |
ML = st.checkbox("Algoritmos de ML aplicado") | |
app = st.checkbox("Creación de una App") | |
# mantenimiento = st.checkbox('Mantenimiento') | |
# Crea un campo numérico para la cantidad | |
cantidad = st.number_input("Meses de mantenimiento:", min_value=0, value=0) | |
mes_mantenimiento = cantidad * precio_mantenimiento | |
# Calcula el total en función de las opciones elegidas | |
total = mes_mantenimiento + sum( | |
[opciones[opcion] for opcion, seleccionada in zip(opciones.keys(), | |
[analisis, ML, | |
app]) if | |
seleccionada]) | |
# Muestra el total | |
st.markdown(f''' | |
Total $: <span style="background:#5c62ac;\ | |
border-radius:5px;padding:5px">{total}</span> | |
:rocket: | |
''', unsafe_allow_html=True) | |
st.markdown(''' | |
<br> | |
<h2>Datos de contactos</h2> | |
<hr> | |
''', unsafe_allow_html=True) | |
# Crea campos de entrada para el nombre, correo electrónico y mensaje | |
nombre = st.text_input("Nombre completo") | |
email = st.text_input("Correo electrónico") | |
mensaje = st.text_area("Mensaje") | |
# Crea un botón para enviar el formulario | |
enviar = st.button("Enviar") | |
# Si el botón es presionado, muestra un mensaje de confirmación | |
if enviar: | |
if nombre and email and mensaje: | |
st.write( | |
"¡Gracias por tu mensaje! Nos pondremos en contacto contigo pronto.") | |
else: | |
st.error("Por favor completa todos los campos requeridos.") | |