Imprimir

Programa

CURSO:INTRODUCCION A LA CIENCIA DE DATOS
TRADUCCION:INTRODUCTION TO DATA SCIENCE
SIGLA:IMT2200
CREDITOS:10 UC 
MODULOS:03 
CARACTER:MINIMO
TIPO:CATEDRA
CALIFICACION:ESTANDAR 
DISCIPLINA:CIENCIA DE DATOS
PALABRAS CLAVE:CIENCIA DE DATOS, RECOLECCION, ANALISIS DE DATOS 
NIVEL FORMATIVO:PREGRADO


I.DESCRIPCIÓN DEL CURSO 

Las organizaciones utilizan sus datos para apoyar la toma de decisiones, y para desarrollar productos y servicios intensivos en datos. El conjunto de competencias requeridas para apoyar estas funciones se ha agrupado bajo el termino Ciencia de Datos.  En este curso los estudiantes analizaran la importancia de este campo y su crecimiento exponencial, describiendo sus principios basicos y las principales tecnicas y herramientas utilizadas. Los estudiantes aprenderan sobre recoleccion e integracion de datos, analisis exploratorio de datos, analisis descriptivo y predictivo, y creacion de productos de informacion.


II.RESULTADOS DE APRENDIZAJE

1.Describir lo que es la ciencia de datos, y su importancia para la ciencia, sociedad y negocios.

2.Identificar los conjuntos de habilidades necesarios para ser un cientifico de datos.

3.Identificar problemas eticos y de privacidad que emergen en ciencia de datos.

4.Explicar las etapas y tareas que forman parte del ciclo de vida de un proyecto de ciencia de datos.

5.Reconocer distintos tipos y formatos de datos estructurados y no estructurados.

6.Desarrollar el proceso de extraccion, transformacion y carga de datos para un proyecto sencillo de ciencia de datos. 

7.Identificar los fundamentos matematicos y estadisticos para el analisis exploratorio y modelamiento estadistico en un proyecto de ciencia de datos.

8.Utilizar tecnicas de analisis exploratorio y modelamiento apropiados para problemas sencillos de ciencia de datos.

9.Aplicar algoritmos basicos de aprendizaje de maquina para el analisis descriptivo y predictivo en proyectos sencillos de ciencia de datos.

10.Comunicar efectivamente los resultados de un proyecto de ciencia de datos.


III.CONTENIDOS

1.Introduccion
1.1.?Que es la ciencia de datos? Definiciones y aplicaciones. 
1.2.Herramientas fundamentales para la ciencia de datos. 
1.3.Tipos de datos.
1.4.Etica y gobernanza de datos.

2.Extraccion, transformacion y carga de datos.
2.1.Fuentes y tipos de datos.
2.2.Limpieza y preparacion de datos.
2.3.Combinacion y estructuracion de conjuntos de datos.

3.Fundamentos matematicos y estadisticos para el analisis de datos.
3.1.Vectores y matrices.
3.2.Distribuciones de probabilidad.
3.3.Hipotesis e inferencia estadistica.

4.Analisis Exploratorio de Datos.
4.1.Analisis grafico.
4.2.Analisis cuantitativo.
4.3.Estadisticas y correlaciones.

5.Modelamiento estadistico.
5.1.Regresion lineal simple.
5.2.Regresion multiple.
5.3.Estimacion de parametros.

6.Introduccion a algoritmos de aprendizaje de maquinas.
6.1.Aprendizaje supervisado y no supervisado.
6.2.Algoritmos basicos de aprendizaje de maquina.
6.3.Visualizacion y comunicacion de datos y resultados.


IV.ESTRATEGIAS METODOLOGICAS 

-Clases expositivas. 

-Ayudantias. 

-Talleres practicos.

-Tareas.

-Proyecto. 

-Expertos invitados.

-Analisis de casos.

-Nota: en este curso se utilizara el lenguaje de programacion Python.


V.ESTRATEGIAS EVALUATIVAS 

-Controles: 20% 

-Tareas: 50%

-Proyecto: 30% 


VI.BIBLIOGRAFIA

Minima

Cathy O'Neil and Rachel Schutt. "Doing Data Science, Straight Talk from the Frontline". O'Reilly Media, 2013.

Wes McKinney. "Python for data analysis: Data wrangling with Pandas, NumPy, and IPython". O'Reilly Media, 2da edicion, 2017.


Complementaria

Joel Grus. "Data Science from Scratch: First Principles with Python". O'Reilly, 2? edicion, 2019.

Foster Provost and Tom Fawcett. "Data Science for Business: What you need to know about data mining and data-analytic thinking". O'Reilly Media, 2013.


PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE, 
INSTITUTO DE INGENIERIA MATEMATICA Y COMPUTACIONAL / SEPTIEMBRE 2020