Imprimir

Programa

CURSO			:	INTRODUCCIÓN AL MANEJO Y EXPLORACIÓN DE DATOS
TRADUCCIÓN		:	INTRODUCCTION TO DATA MANAGEMENT AND EXPLORATION
SIGLA			:	EYP1707
CRÉDITOS 		:	15 
MÓDULOS			:	3 (2 CATEDRAS, 2 AYUDANTÍAS) 
CARÁCTER		:	MÍNIMO
TIPO			:	CATEDRA
CALIFICACIÓN		:	ESTÁNDAR
DISCIPLINA		:	ESTADÍSTICA
PALABRAS CLAVE		:	ANÁLISIS EXPLORATORIO DE DATOS, BODEGAS DE DATOS, BASES DE DATOS, MANEJO DE DATOS



I.	DESCRIPCIÓN DEL CURSO

El curso estudiará las principales técnicas de manejo analítico de bases de datos, desde una introducción a sus sistemas de almacenamiento, hasta la revisión de técnicas de análisis exploratorio y automático de los datos.


II.	OBJETIVOS DE APRENDIZAJE

1.	Distinguir la arquitectura de las bodegas de datos
2.	Aplicar técnicas de pre procesamiento de bases a datos
3.	Emplear herramientas computacionales especializadas para el manejo y exploración de grandes volúmenes de datos
4.	Interpretar la información contenida en un conjunto de datos
5.	Utilizar sistemas OLAP para la toma de decisiones en Inteligencia de Negocios
6.	Aplicar técnicas de clasificación en el ámbito de la minería de datos y de análisis estadísticos
7.	Aplicar técnicas de agrupamiento en el ámbito de la minería de datos y de análisis estadísticos
8.	Dominar el programa Excel a nivel de avanzado para la edición y gestión de bases de datos 


III.	CONTENIDOS
	
1.	Análisis descriptivo de datos
1.1.	 Medidas numéricas de resumen
1.2. 	Representaciones gráficas básicas
1.3. 	Visualización de datos
1.4. 	Medidas de similitud.

2.	Pre procesamiento de datos
2.1	Manejo de datos ruidosos y datos faltantes
2.2	Discretización
2.3	Selección y transformación de variables
2.4	Reducción de dimensionalidad (análisis de componentes principales).

3.	Grandes bases de datos y bodegas de datos (data warehouses).

4.	Introducción a sistemas OLAP
4.1	Bases de datos 
4.2	Lenguajes de consultas 
4.3	Extracción de la información.

5.	Clasificación: 
5.1	Árboles de decisión
5.2	Naive Bayes
5.3	Evaluación y selección de modelos
5.4	Métodos conjuntos.

6.	Conglomerados: 
6.1	K-medias
6.2	K-medoides
6.3	Métodos jerárquicos.

7.	Uso de Excel
7.1	Funciones avanzadas en Excel: fórmulas avanzadas, fórmulas de referencia, rastreo, evaluación fórmulas, cálculos.
7.2	Gráficos en Excel: gráficos básicos, interactivos, con varios ejes, creación de plantillas para gráficos.
7.3	Manejo de bases de datos en Excel: eliminación de duplicados, filtros y validación de datos.
7.4	Gestión y análisis de datos: tablas dinámicas, gráficos dinámicos, obtención de datos externos

8.	Access
8.1	Elementos básicos de Access
8.2	Importación y exportación de base de datos
8.3	Creación de tablas de datos
8.4	Propiedades de los campos
8.5	Relaciones
8.6	Consultas
8.7	Consultas de resumen


IV.	METODOLOGÍA PARA EL APRENDIZAJE

-	Clases expositivas
-	Clases de ejercicios
-	Laboratorios computacionales

V.	EVALUACIÓN DE APRENDIZAJES

-	Pruebas escritas		
-	Desarrollo de laboratorios computacionales
-	Examen final escrito


VI.	BIBLIOGRAFÍA

Mínima

Han, J. and Kamber, M. Data Mining: concepts and techniques. Morgan Kaufmann, 2006.

Complementaria

Tan, P.N., Steinbach, M. and Kumar, V. Pearson Education Limited, 2014.
Mitchell, T. Machine Learning. McGraw-Hill. 1997.




PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE
FACULTAD DE MATEMÁTICAS / Noviembre 2017