data_world_jobs / app.py
perezcatriel's picture
archivo
5606168
raw
history blame
22.9 kB
import datetime
import time
from streamlit import components
import altair as alt
import pandas as pd
import streamlit as st
from PIL import Image
from sklearn.linear_model import LinearRegression
from streamlit_option_menu import option_menu
import plotly.express as px
# from streamlit.components.v1 import IFrame
image = Image.open('./assets/logo_latam_brain.png')
logo = Image.open('./assets/LatamBrainlogo.png')
scrum = Image.open("./assets/Scrum'ProcessLB.png")
dashboard_ejemplo = Image.open('./assets/dashboard_ejemplo.png')
df = pd.read_csv('./ML/ds_salaries.csv')
st.markdown("""<link href="https://cdn.jsdelivr.net/npm/bootstrap@5.3.0-alpha3/dist/css/bootstrap.min.css" rel="stylesheet" integrity="sha384-KK94CHFLLe+nY2dmCWGMq91rCGa5gtU4mk92HdvYe+M/SXH301p5ILy+dN9+nJOZ" crossorigin="anonymous">
<script src="https://cdn.jsdelivr.net/npm/bootstrap@5.3.0-alpha3/dist/js/bootstrap.bundle.min.js" integrity="sha384-ENjdO4Dr2bkBIFxQpeoTz1HIcje39Wm4jDKdf19U8gI4ddQ3GYNS7NTKfAdVQSZe" crossorigin="anonymous"></script>""",
unsafe_allow_html=True)
# Menu horizontal
selected2 = option_menu(None, ["Home", "Projects", "New", "Contact US"],
icons=['house', 'bi-archive',
"bi-arrow-up-right-square", "bi-envelope"],
menu_icon="cast", default_index=0,
orientation="horizontal",
)
# Pagina HOME
if selected2 == "Home":
col1, col2 = st.columns(2)
col1.markdown("""
<br/>
<br/>
<br/>
<h1 style="text-align:center; font-weight:bold;
text-shadow:0px 0px 10px #5c62ac;font-size:3rem">LatamBrain</h1>
<h5 style="text-align:center;color:#5c62ac">tú cerebro tecnológico</h5>
<br />
""", unsafe_allow_html=True)
col2.image(image, width=300)
st.markdown('''
<br>
<h2>Quienes somos?</h2>
<hr>
<p>LatamBrain es una startup latinoamericana altamente innovadora y
tecnológica que está aprovechando las últimas tendencias en tecnología
para brindar soluciones personalizadas, seguras y eficientes a sus
clientes.
Si busca soluciones que lo preparen para el futuro,
no dude en contactar a LatamBrain.
</p>
<p>LatamBrain, tú cerebro tecnológico!</p>
''', unsafe_allow_html=True)
st.markdown('''
<br>
<h2>Servicios</h2>
<hr>
''', unsafe_allow_html=True)
col1, col2, col3 = st.columns(3)
col1.markdown('''
<li>Data Análisis
<li>Reportes financieros
<li>KPI's personalizados
<li>Asesoramientos y Plan de Ejecución
<li>Y más..
''', unsafe_allow_html=True)
col2.markdown('''
<li>Machine Learning
<li>Deep Learning
<li>Automatización de con ML
<li>ChatBot
<li>Y más...
''', unsafe_allow_html=True)
col3.markdown('''
<li>Cloud AWS
<li>Máxima seguridad en tús datos
<li>Disponibilidad y velocidad de datos
<li>Y más...
''', unsafe_allow_html=True)
st.markdown('''
<br>
<h2>Nosotros y Como Trabajamos</h2>
<hr>
''', unsafe_allow_html=True)
st.image(scrum)
# st.image(logo, width=700)
st.markdown('''
<br>
<h2>Opiniones</h2>
<hr>
''', unsafe_allow_html=True)
col1, col2, col3 = st.columns(3)
catriel = '''
<h4>Catriel Pérez</h4>
<p style="margin-top:-20px">Data Engineer</p>
<p>Ha sido una experiencia increíble trabajar con este equipo. Todos
han sido muy profesionales y comprometidos con el éxito del proyecto. Me siento agradecido de haber formado parte de este equipo y haber aprendido tanto en el proceso. Y esto... recién comienza!</p>
<a href="mailto:perezcatriel@gmail.com">Contactame...</a>
<p>24 de abril del 2023</p>
'''
mati = '''
<h4>Matias Benitez</h4>
<p style="margin-top:-20px">Machine Learning</p>
<p>Trabajar en este proyecto ha sido una verdadera aventura. He enfrentado muchos desafíos y he aprendido cosas nuevas todos los días. El equipo con el que he trabajado ha sido excepcional, siempre dispuesto a ayudar y colaborar en todo momento. Me llevo una experiencia enriquecedora y valiosa.</p>
<a href="mailto:matiasbenitezcarrizo@gmail.com">Contactame...</a>
<p>24 de abril del 2023</p>
'''
luis = '''
<h4>Luis Rascón</h4>
<p style="margin-top:-20px">Data Analyst</p>
<p>No tengo más que palabras de agradecimiento por esta experiencia. He tenido la oportunidad de trabajar con gente talentosa y apasionada por su trabajo, lo que ha hecho que el proyecto sea un éxito rotundo. Me llevo muchas lecciones aprendidas y nuevas habilidades que me servirán en mi carrera profesional. Ha sido una experiencia inolvidable.</p>
<a href="mailto:luis.francisco.rc@gmail.com">Contactame...</a>
<p>24 de abril del 2023</p>
'''
col1.markdown(luis, unsafe_allow_html=True)
col2.markdown(mati, unsafe_allow_html=True)
col3.markdown(catriel, unsafe_allow_html=True)
# Pagina Projects
if selected2 == "Projects":
st.markdown('''
<h1 style="text-shadow:0 0 10px #5c62ac;font-weight:bold">Data
World Jobs</h1>
''', unsafe_allow_html=True)
st.markdown('''
<h2>Situación actual</h2>
<hr>
''', unsafe_allow_html=True)
st.write('''
Primero, es importante tener en cuenta que la demanda de trabajos relacionados con la tecnología y la analítica de datos ha aumentado significativamente en los últimos años, lo que ha llevado a que muchos trabajos de data analyst y data scientist se hayan convertido en algunas de las posiciones más populares y mejor remuneradas en el mercado laboral.
En Latinoamérica, el crecimiento de la industria tecnológica y de la analítica de datos se ha ido acelerando en los últimos años, especialmente en países como México, Brasil, Argentina, Colombia y Chile. Estos países han experimentado una demanda creciente de profesionales en el área de la tecnología y la analítica de datos, lo que ha llevado a que la mayoría de los empleos en estas áreas se concentren en las grandes ciudades de estos países.
Según los informes de los portales de empleo en línea, las posiciones de data analyst en Latinoamérica tienen un salario promedio anual de alrededor de $ 25,000 a $ 40,000 dólares. Sin embargo, es importante tener en cuenta que el salario puede variar dependiendo del país, la ciudad, la experiencia del profesional y la empresa.
Además, hay una serie de habilidades que son muy importantes para los profesionales que buscan trabajar en el área de data. Algunas de las habilidades más importantes para un data analyst son:
Conocimientos avanzados en Excel y otras herramientas de análisis de datos como Python, R, SQL, entre otras.
Habilidad para trabajar con grandes volúmenes de datos y bases de datos complejas.
Conocimientos de estadística y análisis de datos.
Habilidad para presentar los resultados de los análisis de datos en informes y presentaciones claras y precisas.
Habilidad para trabajar en equipo y colaborar con otros profesionales.
En resumen, la industria de la tecnología y la analítica de datos está en constante crecimiento en Latinoamérica, lo que ha llevado a una alta demanda de profesionales en el área de data. Los salarios en este campo son competitivos y las habilidades requeridas para ser un buen data analyst incluyen una combinación de conocimientos técnicos y habilidades blandas.
''', unsafe_allow_html=True)
st.write("Este es mi dashboard de Tableau:")
#######
st.markdown('''<iframe src="https://public.tableau.com/views/latam_brain_mvp/General?:language=es-ES&publish=yes&:display_count=n&:origin=viz_share_link" width="100%" height="800"></iframe>''', unsafe_allow_html=True)
tableau_url = "https://public.tableau.com/views/latam_brain_mvp/DashboardGeneralDataJobs?:language=es-ES&:display_count=n&:origin=viz_share_link"
# Incruste el dashboard de Tableau utilizando components.html
st.components.v1.html(
f'<iframe src="{tableau_url}" width="100%" height="800"></iframe>',
height=800)
#########
st.markdown('''
<br>
<h3>Dashboard contexto actual</h3>
<hr>
''', unsafe_allow_html=True)
st.image(dashboard_ejemplo, width=700)
# Crea un gráfico
st.bar_chart(df['salary'])
st.title('Ejemplo de gráfico de barras apiladas')
chart = alt.Chart(df).mark_bar().encode(
x='work_year:N',
y='salary:Q',
color='categoria:N'
).properties(
width=700,
height=400
)
st.altair_chart(chart, use_container_width=True)
st.title('Ejemplo de gráfico de líneas')
chart = alt.Chart(df).mark_line().encode(
x='work_year:N',
y='salary:Q',
color='categoria:N'
).properties(
width=700,
height=400
)
st.altair_chart(chart, use_container_width=True)
st.title('Ejemplo de gráfico de dispersión')
chart = alt.Chart(df).mark_point().encode(
x='work_year:Q',
y='salary:Q',
color='genero:N'
).properties(
width=700,
height=400
)
st.altair_chart(chart, use_container_width=True)
st.title('Ejemplo de gráfico de pastel')
fig = px.pie(df, values='work_year', names='salary')
st.plotly_chart(fig, use_container_width=True)
st.markdown('''
<br>
<h2>Nuestra Solución</h2>
<hr>
''', unsafe_allow_html=True)
st.write('''
Gracias por compartir su análisis sobre el mercado de empleo de Data en Latinoamérica.Sobre la base de los hallazgos que ha presentado, se pueden identificar algunas oportunidades y desafíos clave para el crecimiento del sector en la región.
Algunas de las principales oportunidades incluyen la creciente demanda de habilidades en Data Science y Machine Learning, la expansión de la adopción de tecnologías de Big Data, y el aumento del interés en la analítica avanzada.Estas tendencias sugieren que hay un mercado creciente para los profesionales de datos en Latinoamérica.
Al mismo tiempo, sin embargo, hay algunos desafíos significativos que enfrenta el mercado de empleo de datos en la región.En particular, la falta de habilidades y talento especializado es un problema importante, ya que la mayoría de las empresas no tienen el personal necesario para implementar proyectos de datos complejos.Además, la falta de inversión en tecnologías y herramientas de datos adecuadas y la falta de infraestructura digital suficiente también son barreras para el crecimiento del mercado.
Como especialista en Data Analytics, una propuesta de negocio para abordar estos desafíos y aprovechar las oportunidades en el mercado de empleo de datos de Latinoamérica podría ser ofrecer servicios de consultoría y formación para empresas que deseen adoptar tecnologías de Big Data y analítica avanzada.Además, se podría crear una plataforma de datos en línea que brinde acceso a herramientas y recursos de análisis de datos para empresas y profesionales de datos en toda la región.Esta plataforma también podría ofrecer oportunidades de trabajo y proyectos de datos para profesionales de datos en la región.
En resumen, el mercado de empleo de datos en Latinoamérica ofrece grandes oportunidades de crecimiento, pero también enfrenta desafíos importantes.Ofrecer servicios de consultoría y formación para empresas que deseen adoptar tecnologías de Big Data y crear una plataforma de datos en línea podría ser una forma de abordar estos desafíos y aprovechar las oportunidades en el mercado de datos de Latinoamérica.'''
)
st.markdown('''
<br>
<h3>Dashboard Solución</h3>
<hr>
''', unsafe_allow_html=True)
st.image(dashboard_ejemplo, width=700)
st.markdown('''
<br>
<h3>Predicción de nuevos puestos de trabajo con ML</h3>
<hr>
''', unsafe_allow_html=True)
# st.set_page_config(page_title="Predicción de nuevos puestos de trabajo",
# page_icon=":bar_chart:", layout="wide")
# Cargar los datos
# Seleccionar las columnas relevantes
df_relevant = df[['job_title', 'work_year']]
# Transformar la columna work_year en un tipo date en la columna date
df_relevant['date'] = pd.to_datetime(df_relevant['work_year'], format='%Y')
# Agregar una columna con el año de creación
df_relevant['year'] = pd.DatetimeIndex(df_relevant['date']).year
# Contar la cantidad de job_title creados por año
job_title_count = df_relevant.groupby('year').count()['job_title']
# Crear un dataframe con la cantidad de job_title creados por año
df_job_title_count = pd.DataFrame(
{'year': job_title_count.index,
'job_title_count': job_title_count.values})
# Crear un modelo de regresión lineal
model = LinearRegression()
# Entrenar el modelo con los datos históricos
X = df_job_title_count[['year']]
y = df_job_title_count['job_title_count']
model.fit(X, y)
# Obtener el año actual
current_year = datetime.datetime.now().year
# Predecir la cantidad de nuevos job_title que se crearán este año
current_year_input = st.number_input('Ingresa un año:', value=current_year,
min_value=current_year,
max_value=2050, step=1)
if current_year_input < current_year:
st.warning('Solo se pueden hacer predicciones para años futuros.')
current_year_input = current_year
st.write('Se usará el año actual:', current_year_input)
with st.spinner('Prediciendo...'):
time.sleep(1)
job_title_count_pred = model.predict([[current_year_input]])
# Obtener el último año del dataset
last_year = df_job_title_count['year'].max()
last_year_count = \
df_job_title_count.loc[df_job_title_count['year'] == last_year][
'job_title_count'].values[0]
# Mostrar resultados
st.write(
"Se crearán aproximadamente **{}** nuevos puestos de trabajo este año **{}**.".format(
int(job_title_count_pred), current_year_input))
percentage_change = (
job_title_count_pred - last_year_count) / last_year_count * 100
percentage_change = float(percentage_change)
if percentage_change >= 0:
st.write(
"Esto representa un aumento del {:.2f}% con respecto al año {}.".format(
percentage_change, last_year))
else:
st.write(
"Esto representa una disminución del {:.2f}% con respecto al año {}".format(
abs(percentage_change), last_year))
# Crear un gráfico de línea
line_chart = alt.Chart(df_job_title_count).mark_line().encode(
x='year',
y='job_title_count'
).properties(
title='Cantidad de nuevos puestos de trabajo por año',
width=300,
height=200
).configure_axis(
labelFontSize=14,
titleFontSize=16
)
# Crear un punto para mostrar el valor predicho
point = alt.Chart(df_job_title_count.iloc[-1:]).mark_point(
color='#5c62ac').encode(
x='year',
y='job_title_count'
)
# Mostrar la gráfica actualizada con el valor predicho para el año ingresado
# st.altair_chart(line_chart, use_container_width=True)
# Crear botón para graficar la predicción
if st.button('Mostrar gráfico de predicción'):
# Crear dataframe con los años y las predicciones
years = list(range(last_year, current_year + current_year_input - 2000))
predictions = model.predict([[year] for year in years])
df_predictions = pd.DataFrame(
{'year': years, 'job_title_count_pred': predictions})
# Crear gráfico de línea
line_chart = alt.Chart(df_predictions).mark_line().encode(
x='year',
y='job_title_count_pred'
).properties(
width=700,
height=400
)
# Agregar capa con punto violeta en el valor predicho para el año actual
current_year_pred = int(model.predict([[current_year_input]])[0])
point_chart = alt.Chart(pd.DataFrame(
{'x': [current_year_input], 'y': [current_year_pred]})).mark_point(
color='#5c62ac',
size=300,
stroke='#5c62ac',
strokeWidth=5).encode(
x='x',
y='y'
)
# # ocultar los títulos de los ejes x e y
# line_chart.configure_axis(
# x=None,
# y=None
# )
# Mostrar gráfico con la capa adicional del punto rojo
st.altair_chart(line_chart + point_chart)
st.markdown('''
<br><br><br>
<h2>Gracias por su tiempo y atención!</h2>
<hr>
<h3>Nuevas Propuestas...</h3>
<p>Sí te gusto lo que viste, te invito a ver lo que se vendrá en la
sección <span style="font-weight:bold">"New"</span></p>
''', unsafe_allow_html=True)
#
if selected2 == "New":
progress_text = "Operation in progress. Please wait."
my_bar = st.progress(0, text=progress_text)
for percent_complete in range(100):
time.sleep(0.05)
my_bar.progress(percent_complete + 1, text=progress_text)
#####
import pandas as pd
import streamlit as st
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# Cargar los datos
df = pd.read_csv('./assets/dataset_modelo_1.csv')
# Crear una lista con todas las skills disponibles
all_skills = set()
for skills in df.skills:
all_skills.update(skills.split(", "))
# Crear un diccionario que relaciona cada skill con su índice en el vector
skill_indices = {skill: i for i, skill in enumerate(all_skills)}
# Crear una matriz de características con la frecuencia de cada skill en cada fila
vectorizer = CountVectorizer(vocabulary=skill_indices.keys(),
lowercase=False)
X = vectorizer.fit_transform(df.skills)
# Entrenar el modelo
clf = MultinomialNB()
clf.fit(X, df.Aptitude)
# Crear la interfaz de usuario con Streamlit
st.title("Predicción de aptitud para un 'NUEVO' trabajo")
st.write(
"Ingrese el título del 'Nuevo' trabajo para ver que habilidades "
"son las más "
"importantes.")
title = st.multiselect("Título del trabajo", df.job_title.unique())
# Crear una función que encuentra las habilidades más importantes para un título dado
def get_top_skills(title, limit):
# Filtrar el dataframe por el título dado
filtered_df = df[df.job_title == title]
# Crear una matriz de características con la frecuencia de cada skill en el dataframe filtrado
X_filtered = vectorizer.transform(filtered_df.skills)
# Calcular la frecuencia de cada habilidad en el dataframe filtrado
skill_frequencies = X_filtered.sum(axis=0).A1
# Obtener los nombres de las habilidades
skill_names = vectorizer.vocabulary_.keys()
# Crear un diccionario que relaciona cada habilidad con su frecuencia
skill_freq_dict = dict(zip(skill_names, skill_frequencies))
# Ordenar las habilidades por frecuencia descendente y devolver las más importantes (según el límite dado)
top_skills = sorted(skill_freq_dict, key=skill_freq_dict.get,
reverse=True)[:limit]
return top_skills
if title:
limit = st.number_input("Cantidad de habilidades a mostrar", value=5,
min_value=1, max_value=len(all_skills))
top_skills = get_top_skills(title[0], limit)
st.write(
f"Las {limit} habilidades más importantes para el trabajo de '{title[0]}' son:")
for skill in top_skills:
st.write(f"- {skill}")
#####
#####
if selected2 == "Contact US":
st.markdown('''
<h2>Presupuesto</h2>
<hr>
''', unsafe_allow_html=True)
# Define los precios para cada opción
precio_analisis = 3500
precio_ML = 5500
precio_app = 3000
precio_mantenimiento = 550
# Define las opciones como un diccionario de la forma {nombre_opción: precio_opción}
opciones = {
"Opción 1": precio_analisis,
"Opción 2": precio_ML,
"Opción 3": precio_app,
"Opción 4": precio_mantenimiento
}
# Crea un checkbox para cada opción
analisis = st.checkbox("Análisis y Reportes")
ML = st.checkbox("Algoritmos de ML aplicado")
app = st.checkbox("Creación de una App")
# mantenimiento = st.checkbox('Mantenimiento')
# Crea un campo numérico para la cantidad
cantidad = st.number_input("Meses de mantenimiento:", min_value=0, value=0)
mes_mantenimiento = cantidad * precio_mantenimiento
# Calcula el total en función de las opciones elegidas
total = mes_mantenimiento + sum(
[opciones[opcion] for opcion, seleccionada in zip(opciones.keys(),
[analisis, ML,
app]) if
seleccionada])
# Muestra el total
st.markdown(f'''
Total $: <span style="background:#5c62ac;\
border-radius:5px;padding:5px">{total}</span>
:rocket:
''', unsafe_allow_html=True)
st.markdown('''
<br>
<h2>Datos de contactos</h2>
<hr>
''', unsafe_allow_html=True)
# Crea campos de entrada para el nombre, correo electrónico y mensaje
nombre = st.text_input("Nombre completo")
email = st.text_input("Correo electrónico")
mensaje = st.text_area("Mensaje")
# Crea un botón para enviar el formulario
enviar = st.button("Enviar")
# Si el botón es presionado, muestra un mensaje de confirmación
if enviar:
if nombre and email and mensaje:
st.write(
"¡Gracias por tu mensaje! Nos pondremos en contacto contigo pronto.")
else:
st.error("Por favor completa todos los campos requeridos.")