Imprimir

Programa

CURSO:PLATAFORMAS DE BIG DATA PARA DATA SCIENCE	 
TRADUCCION:BIG DATA PLATFORMS FOR DATA SCIENCE 
SIGLA:INF3862
CREDITOS:05 
MODULOS:02	
CARACTER:MINIMO
TIPO:CATEDRA,LABORATORIO
CALIFICACION:ESTANDAR
DISCIPLINA:INGENIERIA,COMPUTACION
PALABRAS CLAVE:COMPUTACION,INTELIGENCIA,ARTIFICIAL,CIENCIA,DATOS,PLATAFORMAS,BIG,DATA,SCIENCE
PROFESOR:IVAN LILLO


I.DESCRIPCIÓN DEL CURSO 

En este curso los estudiantes analizaran el framework Hadoop como base explicativa y practica de un ecosistema de Big Data. Ademas, veran otras plataformas comunes para el procesamiento de grandes volumenes de datos. Este curso proveera de tecnicas para almacenar, extraer y procesar informacion, extrayendo valor desde fuentes de datos existentes y descubriendo nuevas fuentes.


II.RESULTADOS DE APRENDIZAJE 

1.Distinguir distintos elementos de datos relacionados con Big Data en su propio entorno o en problemas del dia a dia.

2.Analizar la necesidad de contar con un plan de infraestructura de Big Data y un dise?o adecuado de Sistemas de Informacion en el contexto de una organizacion.

3.Diferenciar entre un sistema de manejo de datos tradicional y un sistema de manejo de Big Data.

4.Dise?ar un sistema de informacion para el manejo de un gran volumen de datos, con una vision integradora de las multiples herramientas existentes.

5.Aplicar las bases del dise?o de arquitectura y modelos de programacion existentes para grandes volumenes de datos. 

6.Proponer soluciones a problemas que generan grandes volumenes de informacion usando herramientas pensadas en Big Data.

7.Describir problemas eticos y de privacidad en el manejo de datos.


III.CONTENIDOS

1.Introduccion al paradigma de Big Data y plataformas comunes.

2.Hadoop (MapReduce, HDFS, Yarn, Tez).

3.Hadoop Ecosystem (Sqoop, Hive, Hbase, Pig, Flume, Oozie).

4.Apache Spark.

5.Plataformas de software y servicios.

6.Solvers de Optimizacion.


IV.ESTRATEGIAS METODOLOGICAS 

-Clases expositivas

-Talleres practicos de laboratorio


V.EVALUACION DEL APRENDIZAJE

-Controles: 30%

-Actividades practicas en laboratorio: 30%

-Proyecto: 40%


VI.BIBLIOGRAFIA 

Minima

Este curso no requiere bibliografia minima.


Complementaria

J. R. Owens, B. Femiano, and J. Lentz, Hadoop Real World Solutions Cookbook. Packt Publishing, 2013.

Documentacion web actualizada

Apache Hadoop http://hadoop.apache.org/docs/current/

Apache Spark https://spark.apache.org/docs/latest/


PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE 
ESCUELA DE INGENIERIA / ENERO 2020