Imprimir

Programa

CURSO:PLATAFORMAS DE BIG DATA PARA DATA SCIENCE	 
TRADUCCIÓN:BIG DATA PLATFORMS FOR DATA SCIENCE 
SIGLA:INF3862
CRÉDITOS:05 
MÓDULOS:02	
CARÁCTER:MÍNIMO
TIPO:CÁTEDRA,LABORATORIO
CALIFICACIÓN:ESTÁNDAR
DISCIPLINA:INGENIERÍA,COMPUTACIÓN
PALABRAS CLAVE:COMPUTACIÓN,INTELIGENCIA,ARTIFICIAL,CIENCIA,DATOS,PLATAFORMAS,BIG,DATA,SCIENCE
PROFESOR:IVÁN LILLO


I.DESCRIPCIÓN DEL CURSO 

En este curso los estudiantes analizarán el framework Hadoop como base explicativa y práctica de un ecosistema de Big Data. Además, verán otras plataformas comunes para el procesamiento de grandes volúmenes de datos. Este curso proveerá de técnicas para almacenar, extraer y procesar información, extrayendo valor desde fuentes de datos existentes y descubriendo nuevas fuentes.


II.RESULTADOS DE APRENDIZAJE 

1.Distinguir distintos elementos de datos relacionados con Big Data en su propio entorno o en problemas del día a día.

2.Analizar la necesidad de contar con un plan de infraestructura de Big Data y un diseño adecuado de Sistemas de Información en el contexto de una organización.

3.Diferenciar entre un sistema de manejo de datos tradicional y un sistema de manejo de Big Data.

4.Diseñar un sistema de información para el manejo de un gran volumen de datos, con una visión integradora de las múltiples herramientas existentes.

5.Aplicar las bases del diseño de arquitectura y modelos de programación existentes para grandes volúmenes de datos. 

6.Proponer soluciones a problemas que generan grandes volúmenes de información usando herramientas pensadas en Big Data.

7.Describir problemas éticos y de privacidad en el manejo de datos.


III.CONTENIDOS

1.Introducción al paradigma de Big Data y plataformas comunes.

2.Hadoop (MapReduce, HDFS, Yarn, Tez).

3.Hadoop Ecosystem (Sqoop, Hive, Hbase, Pig, Flume, Oozie).

4.Apache Spark.

5.Plataformas de software y servicios.

6.Solvers de Optimización.


IV.ESTRATEGIAS METODOLÓGICAS 

-Clases expositivas

-Talleres prácticos de laboratorio


V.EVALUACIÓN DEL APRENDIZAJE

-Controles: 30%

-Actividades prácticas en laboratorio: 30%

-Proyecto: 40%


VI.BIBLIOGRAFÍA 

Mínima

Este curso no requiere bibliografía mínima.


Complementaria

J. R. Owens, B. Femiano, and J. Lentz, Hadoop Real World Solutions Cookbook. Packt Publishing, 2013.

Documentación web actualizada

Apache Hadoop http://hadoop.apache.org/docs/current/

Apache Spark https://spark.apache.org/docs/latest/


PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE 
ESCUELA DE INGENIERÍA / ENERO 2020