Imprimir

Programa

CURSO		:	Métodos Exploratorios y Computacionales para Estadística
TRADUCCIÓN	:	Computational and exploratory methods in statistics
SIGLA		:	EPG3730
CRÉDITOS	:	10 UC / 6 SCT
MÓDULOS		:	2 Clases de Cátedra y 1 Ayudantía
REQUISITOS	:	Admisión Doctorado en Estadística
RESTRICCIONES	:	No aplica
CARÁCTER	:	Mínimo
TIPO		:	Cátedra
CALIFICACIÓN	:	Estándar (calificación de 1.0 a 7.0) 
PROFESOR	:	


I.	DESCRIPCIÓN

En este curso se definen formalmente una serie de métodos de visualización de información,  ilustrando  su aplicación en el análisis exploratorio de datos y en la comunicación de un análisis estadístico. 

II.	OBJETIVOS

Preparar el alumno para: buscar por evidencia de estructura y patrones; comprender rigurosamente conceptos claves de visualización; interpretar dichos métodos gráficos; comunicar ideas y conceptos a través de métodos gráficos.

III.	CONTENIDOS

1.	Introducción a la teoría y aplicaciones de métodos de visualización
1.1.	Motivación 
1.2.	El análisis gráfico como forma de explorar y comunicar
1.3.	Definición matemática de gráfico
1.4.	Principios de representación gráfica (Cleveland 1993, 1994)
1.5.	R: Parámetros gráficos (R: lwd, col,…)
1.6.	R: Notación matemática (Murrell y Ihaka 2000)
1.7.	R: Introducción al paquete ggplot2 (Wickham 2016)
2.	Visualización de datos continuos
2.1.	Estimador del histograma (definición matemática; reglas de Sturges, Scott y Freedman–Diaconis)
2.2.	Boxplot
2.3.	Estimador de kernel (R: density, paquete stats)
2.4.	Density plot y ‘rug’(R: density, plot y rug) 
2.5.	Violin plot (R: vioplot package)
3.	Visualización de datos categóricos 
3.1.	Ejemplos de datos categóricos
3.2.	Mosaic plot (Hartigan y Kleiner 1984; Friendly 1994; R: mosaicplot, paquete graphics)
4.	Visualización y comparación de poblaciones
4.1.	QQ-plot 
4.2.	Curva ROC 
5.	Visualización de datos continuos bivariados
5.1.	Scatterplot y suavizador del scatterplot (loess, paquete stats)
5.2.	Reducción de dimensión a través de componentes principales
5.3.	Biplot (Jolliffe 2002, §5.3; Gower y Hand 1996; biplot, paquete stats)
6.	Visualización de datos composicionales
6.1.	Ejemplos de datos composicionales
6.2.	El simplex unitario
6.3.	La distribución de Dirichlet
6.4.	Density contour plot en el simplex
7.	Visualización de series de tiempo
7.1.	Gráfico de series de tiempo (ts, paquete stats)
7.2.	Correlograma (acf, paquete stats)
7.3.	Periodograma (spectrum, paquete stats)
7.4.	Gráfico STL (Cleveland et al 1990; stl, paquete stats)
8.	Visualización de datos funcionales
8.1.	Curvas aleatorias como datos: Ejemplos
8.2.	El proceso estocástico como modelo para funciones aleatorias
8.3.	Medidas de profundidad para datos funcionales (Sun y Genton 2011)
8.4.	Boxplot funcional (fbplot, paquete fda)

IV.	METODOLOGÍA

-	Clases expositivas.
-	Lecturas recomendadas por el profesor incluyendo, por ejemplo, un artículo reciente del Journal of Computational and Graphical Statistics o algunos artículos en la Bibliografía (VI). 

V.	EVALUACIÓN

	-	La evaluación del curso consistirá en 3 interrogaciones (70%) y un examen final (30%).

VI.	BIBLIOGRAFÍA
 
•	Cleveland, W. S. (1993), Visualizing Data, New Jersey: Hobart Press.
•	—— (1994), The Elements of Graphing Data, Revised edition, New Jersey: Hobart Press.
•	Cleveland, R. B. Cleveland, W. S. McRae, J. E. y Terpenning, I.  (1990), “STL: A Seasonal-Trend Decomposition Procedure Based on Loess,” Journal of Official Statistics, 6, 3–73.
•	Cleveland, W. S. Grosse, E. y Shyu, W. M.  (1992), “Local Regression Models,” Chapter 8 of Statistical Models in S Eds J. M. Chambers y T. J. Hastie, Wadsworth & Brooks/Cole.
•	Friendly, M. (1994), “Mosaic Displays for Multi-Way Contingency Tables,” Journal of the American Statistical Association, 89, 190–200.
•	Gower, J. C. y Hand, D. J. (1996). Biplots. Boca Raton: Chapman & Hall/CRC.
•	Hartigan, J. A. y Kleiner, B. (1984), “A Mosaic of Television Ratings,” The American Statistician, 38, 32–35.
•	Keen, K. J. (2010), Graphics for Statistics and Data Analysis with R, Boca Raton: Chapman & Hall/CRC.
•	Jolliffe, I. (2002), Principal Component Analysis, Springer: New York. 
•	Murrell, P. (2005), R Graphics. Chapman & Hall/CRC Press. 
•	Murrell, P. y Ihaka, R. (2000), “An Approach to Providing Mathematical Annotation in Plots,” Journal of Computational and Graphical Statistics, 9, 582–599. 
•	Sun, Y. y Genton, M. G. (2011), “Functional Boxplots,” Journal of Computational and Graphical Statistics, 20, 316–334. 
•	Wickham, H. (2016), ggplot2: Elegant Graphics for Data Analysis, 2nd Edition, New York: Springer.
•	Unwin, A. (2015), Graphical Data Analysis with R, Boca Raton: Chapman & Hall/CRC.