Contenido
Curso de Data Science.
Adquiere sólidos conocimientos en la aplicación de modelos de aprendizaje automático (Machine Learning) para el análisis profundo de datos. Aprende a entrenar, validar y poner en marcha estos modelos para descubrir nuevos conocimientos y resolver una gran variedad de problemas de negocio complejo.
Duración: 7 meses
Modalidad: Intensivo a distancia
Dedicación estimada: 15 horas semanales (incluye horas de cursada en vivo y práctica obligatoria)
REQUISITOS.
- Nociones de programación imperativa, preferentemente en Python 3.
- Conocimientos sólidos de estadística descriptiva.
- Conocimientos de estadística inferencial.
- Nociones de probabilidad clásica.
- Lecto-comprensión media del idioma Inglés.
A QUIÉN ESTÁ DIRIGIDO.
El curso está dirigido a todos aquellos que quieran aprender a trabajar con modelos de Machine Learning, la base sobre la que se construyen las implementaciones tecnológicas más modernas (detección de fraude, sistemas de recomendación, clasificación de imágenes/texto, entre muchas otras). La ciencia de datos tiene que ver con ser curioso: hacer nuevas preguntas, hacer nuevos descubrimientos y aprender cosas nuevas.
CRITERIO Y CLASIFICACIÓN.
Comprende en profundidad los problemas de clasificación y regresión, junto a los algoritmos comúnmente utilizados para resolverlos.
¿Por qué Data science?
METODOLOGÍAS CIENTÍFICAS
Complejidad algorítmica: cómo utilizar las nuevas tecnologías para enfrentar grandes conjuntos de datos y trabajar con algoritmos complejos.
Cómo utilizar las nuevas tecnologías para obtener conocimientos claves para tu análisis.
ORIENTACIÓN A TÉCNICAS
Puesta en producción, evaluación y optimización de modelos.
Probabilidad e inferencia estadística.
Visualización de datos, técnicas de aprendizaje supervisado y no supervisado.
Problemas de regresión y clasificación.
Clasificación de texto, análisis de series de tiempo y árboles de decisión.
HERRAMIENTAS
Lenguaje de programación Python.
Librerías de Python: Pandas, Numpy, Matplotlib, Seaborn, Plotly, Bokeh, SciPy, Scikit-Learn, Statsmodel, Pickle, Flask.
Es necesaria la instalación de Anaconda y Jupyter Lab.
Aprendizaje basado en proyectos.
En el programa de Data Science, los estudiantes trabajan en grupos para resolver 3 desafíos prácticos. Cada desafío requiere aplicar progresivamente el conocimiento y las herramientas adquiridas durante el curso. Sumado a esto, los estudiantes trabajan en un proyecto final donde aplican diferentes algoritmos de Machine Learning en un escenario práctico propuesto por los estudiantes y guiado por los profesores.