CURSO:INTRODUCCION A LA CIENCIA DE DATOS SOCIALES TRADUCCION:INTRODUCTION TO SOCIAL DATA SCIENCE SIGLA:SOL508 CREDITOS:10 UC MODULOS:03 CARACTER:MINIMO TIPO:CATEDRA CALIFICACION:ESTANDAR (1,0 A 7,0) PALABRAS CLAVE:CIENCIA DE DATOS,ESTADISTICA DESCRIPTIVA NIVEL FORMATIVO:PREGRADO I.DESCRIPCIÓN DEL CURSO Este curso cubre herramientas fundamentales de manipulacion, descripcion y visualizacion de datos usando software estadistico y programacion. En el curso los y las estudiantes trabajaran con datos de diferentes tipos (ej. encuestas, datos administrativos, series de tiempo, datos textuales, etc.) y aprenderan a manipularlos y analizarlos usando herramientas de programacion. Especificamente, a usar herramientas de visualizacion de datos y estadistica descriptiva para responder preguntas empiricas de relevancia para las ciencias sociales. El curso dara especial atencion al aprendizaje de buenas practicas de trabajo con datos y codigo, favoreciendo procedimientos eficientes y reproducibles. Se cubrira tambien la integracion entre software estadistico y herramientas automatizas para el reporte de resultados. II.RESULTADOS DE APRENDIZAJE 1.Manipular datos sociales en distintos formatos usando herramientas de programacion. 2.Describir patrones presentes en los datos usando herramientas de visualizacion y estadistica descriptiva. 3.Construir un flujo de trabajo ("workflow") eficiente y reproducible para el trabajo con datos sociales. 4.Aplicar conocimientos de manejo de datos sociales para responder preguntas empiricas de relevancia para las ciencias sociales. 5.Comunicar resultados de manera clara, visualmente clara y replicable en ciencia de datos sociales. III.CONTENIDOS 1.Introduccion 1.1.Introduccion al lenguaje de programacion: operaciones, objetos, vectores, paquetes 1.2.Estructuras de datos: matrices, bases de datos y listas 1.3.Funciones y loops 1.4.Descripcion visual de una variable: barras, tortas, histogramas. 1.5.Descripcion estadistica de una variable: distribucion, rango, promedio, desviacion estandar, moda y cuantiles. 1.6.Workflow 2.Manipulacion y descripcion de datos 2.1.Creacion y transformacion de variables 2.2.Resumen de datos y datos agrupados 2.3.Datos relacionales 2.4.Transformacion de datos largos y anchos 2.5.Tratamiento de datos faltantes 3.Asociacion entre variables 3.1.Visualizacion de relacion entre variables 3.2.Correlacion de Pearson 3.3.Diferencia de medias y proporciones 3.4.Tablas de contingencia 4.Comunicacion de resultados y replicabilidad 4.1.Reportes automatizados 4.2.Workflow avanzado IV.ESTRATEGIAS METODOLOGICAS -Catedra. -Lectura y analisis de textos. -Producciones escritas. -Ejercicios practicos. V.ESTRATEGIAS EVALUATIVAS -Tareas: 56% -Trabajos practicos: 44% VI.BIBLIOGRAFIA Minima Whickham, Hardley; Grolemund(2017), Garrett. R for Data Science. O?Reilly. Version online en espa?ol disponible aqui: https://es.r4ds.hadley.nz Imai, Kosuke.(2018). Quantitative Social Science: An Introduction in tidyverse. Princeton University Press. Healy, Kieran(2018); Data Visualization: a Practical Introduction. Princeton University Press. Complementaria Li, Quan(2019). Using R for Data Analysis in Social Sciences. Oxford University Press. PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE INSTITUTO DE SOCIOLOGIA / OCTUBRE 2023