Diplomado en Ciencia de Datos.
Detalles.
- Modalidad: Presencial
- Duración: 80 horas
¿Por qué tomar este programa?.
La cantidad de datos que tanto la sociedad como las organizaciones están generando, requiere del desarrollo de nuevas habilidades en las personas, para que, de manera metódica, y con herramientas eficientes, apoyen a las organizaciones para la toma de decisiones, tratando de disminuir la incertidumbre y basándolas en evidencias. Es por esto que aprender a manipular los datos de forma científica permitirá desarrollar modelos de datos que favorezcan el análisis y que se puedan volver modelos aplicados a la necesidad de las organizaciones.
Objetivo.
Desarrollar herramientas y metodologías para el tratamiento avanzado de datos que permitan apoyar la toma de decisiones en las organizaciones.
Metodología.
Aprendizaje basado en problemas, con clases magistrales para afianzar los conceptos técnicos.
Público Objetivo.
Personas interesadas en aprender del tema y que cuenten con conocimientos básicos de programación.
Plan de estudios.
Módulos
Módulo 1: Introducción
- Introducción
- Introducción a Python para la Ciencia de datos.
- Operaciones con arreglos y tablas.
Módulo 2: Exploración de datos
- Mecanismos de exploración de datos (EDA). Introducción a estadística descriptiva, Análisis univariado, análisis bivariado y análisis multivariado.
- Gestión de datos nulos. Identificación, eliminación e imputación.
- Preparación de datos para el modelamiento. Estandarización y codificación. Reducción de dimensionalidad. Ingeniería de características. Separación de conjunto de datos.
Módulo 3: Modelación de datos basado en Machine Learning (ML)
- Modelos de aprendizaje no supervisados. KMeans, jerárquica. Mecanismos de ajuste (codo y silhouette).
- Modelos de aprendizaje supervisado – clasificación. Mecanismos de ajuste (accuracy, matriz de confusión, precisión, recall y f1score). Técnicas de ajuste Regresión logística, KNN, SVM, árboles de decisión y métodos de ensamble.
- Modelos de aprendizaje supervisado – Regresión. Mecanismos de ajuste (R2, RMSE, MAE, MAPE). Técnicas de ajuste Regresión lineal, KNN, SVM, Árboles de decisión y métodos de ensamble.
Módulo 4: Redes neuronales
- Aproximación por serie de tiempos. Forecasting
- Introducción a las redes neuronales. ANN, RNN, CNN y LSTM.