CURSO:CIENCIA DE DATOS:QUE, COMO Y POR QUE TRADUCCION:DATA SCIENCE:WHAT, HOW AND WHY SIGLA:IMT2000 CREDITOS:10 MODULOS:03 CARACTER:FORMACION GENERAL TIPO:CATEDRA CALIFICACION:ESTANDAR PALABRAS CLAVES:CIENCIA DE DATOS, PROGRAMACION, ANALISIS DE DATOS, MACHINE LEARNING, INTELIGENCIA ARTIFICIAL NIVEL FORMATIVO:PREGRADO AREA FG:PENSAMIENTO MATEMATICO HABILIDADES FG:RESOLUCION DE PROBLEMAS; CREATIVIDAD E INNOVACION I.INTEGRIDAD ACADEMICA Y CODIGO DE HONOR Este curso se compromete con la construccion de una cultura de respeto e integridad, por lo que se adscribe al Codigo de Honor UC, declarando que, ?Como miembro de la comunidad de la Pontificia Universidad Catolica de Chile, me comprometo a respetar los principios y normativas que la rigen. Asimismo, me comprometo a actuar con rectitud y honestidad en las relaciones con los demas integrantes de la comunidad y en la realizacion de todo trabajo, particularmente en aquellas actividades vinculadas a la docencia, al aprendizaje y la creacion, difusion y transferencia del conocimiento. Ademas, me comprometo a velar por la dignidad e integridad de las personas, evitando incurrir en y, rechazando, toda conducta abusiva de caracter fisico, verbal, psicologico y de violencia sexual. Del mismo modo, asumo el compromiso de cuidar los bienes de la Universidad?. Asi mismo, este curso se compromete con aportar a la construccion de una cultura de Integridad Academica, reconociendola como uno de los pilares de la formacion de los y las estudiantes, promoviendo en las metodologias de ense?anza-aprendizaje los valores de: honestidad, veracidad, confianza, justicia, respeto y responsabilidad. II.DESCRIPCIÓN DEL CURSO Durante los ultimos a?os la manera de solucionar algunos problemas en la sociedad, se ha revolucionado a traves del uso inteligente de los datos. El desarrollo de la matematica y las ciencias de la computacion han permitido crear tecnologias que automatizan procesos en diversas industrias y ciencias. En este curso los estudiantes adquiriran los conocimientos y habilidades necesarias para comprender y aplicar herramientas basadas en datos: sus ventajas, limitaciones e implicaciones eticas. Para lograr esto, se presentaran las distintas tecnicas y enfoques que se utilizan en proyectos de ciencia de datos y al mismo tiempo se pondran en practica mediante el desarrollo de un proyecto final que comprende llevar a cabo una solucion de ciencia de datos desde inicio a fin. III.RESULTADOS DE APRENDIZAJE 1.Ejecutar un proyecto sencillo de ciencia de datos, incorporando las distintas tecnicas aprendidas durante el curso, incluida carga de datos, analisis exploratorio, analisis predictivo y visualizacion. 2.Analizar criticamente los beneficios y limitaciones de una herramienta computacional basada en datos. 3.Reconocer oportunidades en las cuales se puede llevar a cabo un proyecto de Ciencia de Datos. 4.Distinguir las implicancias eticas del uso de tecnologias de ciencia de datos en la sociedad actual. IV.CONTENIDOS 1.Introduccion a la ciencia de datos 1.1.?Que es la ciencia de datos? 1.2.Consideraciones eticas de la ciencia de datos 1.3.Limitaciones de la ciencia de datos 1.4.Habilidades y herramientas para la ciencia de datos 2.Conceptos basicos de programacion 2.1.Introduccion a Python y uso de Google Colab 2.2.Variables y tipos de datos 2.3.Operaciones logicas y aritmeticas 2.4.Condiciones If-Else 2.5.Ciclos For y While 2.6.Definicion de funciones 3.Procesamiento de datos 3.1.Fuentes y tipos de datos 3.2.Lectura de datos 3.3.Limpieza y procesamiento de datos 4.Analisis exploratorio y descriptivo de datos 4.1.Medidas estadisticas y distribuciones 4.2.Metricas de correlacion 4.3.Tests y confiabilidad estadistica 4.4.Visualizacion de informacion 5.Aplicaciones de ciencia de datos en la academia e industria 5.1.Tipos de proyectos de ciencia de datos 5.2.Referentes mundiales de ciencia de datos (Google, Facebook, Netflix, etc.) 5.3.Ciencia de datos responsable: revision de casos polemicos 5.4.Ciencia de datos en Chile V.ESTRATEGIAS METODOLOGICAS -Clases expositivas. -Laboratorios practicos (computacionales) guiados. -Analisis de casos de distintas areas y tematicas. -Exposiciones de expertos y expertas de la industria y/o academia. VI.ESTRATEGIAS EVALUATIVAS -Evaluacion diagnostica. -Controles escritos: 30% -Laboratorios practicos computacionales: 10% Proyecto: 60%: -Pre-entregas: 30% -Informe final: 30% -Autoevaluacion y evaluacion de pares (formativa). VII.BIBLIOGRAFIA Minima VanderPlas, Jake. Python data science handbook: Essential tools for working with data."O'Reilly Media, Inc.",2016. McKinney, Wes. Python for data analysis: Data wrangling with Pandas, NumPy, and IPython."O'Reilly Media, Inc.",2012. A.Geron, Aprende Machine Learning con Scikit-Learn, Keras y TensorFlow,2da ed.O?Reilly Media Inc.,2020. Complementaria Grus, Joel. Data science from scratch: first principles with python.O'Reilly Media,2019. Guido, Sarah, and Andreas C.Muller.Introduction to Machine Learning with Python A Guide for Data Scientists.O'Reilly,2021. PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE ESCUELA DE INGENIERIA / FORMACION GENERAL / DICIEMBRE 2021