Imprimir

Programa

CURSO:PROCESAMIENTO Y ENTENDIMIENTO DE LENGUAJE NATURAL
TRADUCCION:NATURAL LANGUAGE PROCESSING AND UNDERSTANDING
SIGLA:INF3820
CREDITOS:05
MODULOS:02		
CARACTER:OPTATIVO
TIPO:CATEDRA	
CALIFICACION:ESTANDAR 
PALABRAS CLAVE:CIENCIA DE DATOS,LENGUAJE NATURAL,MODELOS GENERATIVOS,GRANDES MODELOS DE LENGUAJE
NIVEL FORMATIVO:MAGISTER


I.DESCRIPCIÓN DEL CURSO

En este curso los y las estudiantes podran conocer el estado del arte de las tecnicas y modelos de tratamiento, procesamiento, entendimiento de lenguaje natural, desde tecnicas de pre-procesamiento, vectorizacion de texto, hasta las caracteristicas de los grandes modelos generativos de lenguaje. Las principales metodologias de este curso son el estudio de casos y los talleres.


II.RESULTADOS DE APRENDIZAJE

1.Reconocer los desafios del tratamiento de lenguaje natural, desde la diversidad de lenguaje, hasta la escritura empirica, con errores de diverso tipo.

2.Describir los diferentes objetivos en NLP, como clasificacion de texto, extraccion de entidades, comparacion de texto, generacion de texto en contextos de valor de negocio, como es el caso de estudios legales, seleccion de RRHH, evaluacion de conocimiento, entre otros posibles ambitos.

3.Reconocer los desafios de recolectar y gestionar grandes conjuntos de datos de referencia para entrenamiento, ademas de la gestion de etiquetado y de validacion de calidad. 

4.Analizar los modelos y las herramientas mas usadas actualmente para la gestion, procesamiento, entendimiento y generacion de lenguaje, desde modelos de Machine Learning mas tradicionales, hasta Redes Neuronales Profundas.


III.CONTENIDOS

1.Desafios del Procesamiento de Lenguaje Natural
1.1.Posibles fuentes de texto relevantes en casos de negocio.
1.2.Desafios de la calidad de los ejemplos.
1.3.Enfrentando la diversidad linguistica.

2.Preprocesamiento y Normalizacion de Texto
2.1.Desafios de la diversidad linguistica.
2.2.Tecnicas de Normalizacion.
2.3.Representaciones vectoriales.
2.4.Reduccion dimensional.
2.5.Word Embedding.

3.Clasificacion de Texto
3.1.Modelos de Prediccion Categorica en Machine Learning.
3.2.Metricas y Rendimiento.

4.Extraccion de Entidades
4.1.Named-Entity Recognition.
4.2.Entrenamiento y ajustes.

5.Modelos Generativos
5.1.Secuencia de Redes Neuronales. Modelos RNN, LSTM, GRU.
5.2.Arquitectura Transformer.
5.3.Desafios en Entendimiento de Lenguaje Natural.


IV.ESTRATEGIAS METODOLOGICAS

-Clases teoricas.

-Analisis interactivo de casos.

-Talleres practicos de aplicacion.


V.ESTRATEGIAS EVALUATIVAS

-Actividades practicas en grupo (promedio): 50%

-Control de conocimientos individual: 20%

-Examen de conocimientos individual: 30%


VI.BIBLIOGRAFIA

Minima

Leskovec, J., et. al(2014). Mining of Massive Datasets. Stanford University.

Taher, M, R.S.(2022). Embeddings in Natural Language Processing. Morgan & Claypool Publishers.


Complementaria

Rothman, D.(2021). Transformers for Natural Language Processing. Packt.


PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
ESCUELA DE INGENIERIA / MAYO 2024