Dominar técnicas más comunes de pre-procesamiento de texto para castellano e inglés.
Lograr identificar ventajas y desventajas de técnicas de etiquetado de texto.
Aplicar métodos generales de machine learning a problemas de procesamiento de lenguaje natural.
Contenidos
Pre-procesamiento de texto inglés, castellano (lematización, negaciones).
Métodos clásicos para el etiquetado (expresiones regulares, bayesianos, n-gramas, hmm).
Aplicaciones al etiquetado de texto: SPAM, sentimientos.
Técnicas de representación de texto (vectorización de texto).
Métodos de reducción de dimensionalidad y clasificación (isomap, t-SNE, SVM, regresiones).
Aplicaciones en salud a la detección de patologías críticas.
Generación de lenguaje natural.
Métodos de redes neuronales (DeepNN, RNN, LSTM).
Aplicaciones a la generación de captions y traducción.
Bibliografía
[Bishop] Christopher M. Bishop, “Pattern Recognition and Machine Learning”, Springer Verlag Gmbh, 2010.
[Bird] Stephen Bird,Ewan Klein, Edward Loper, “Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit”, O’Reilly Media, 2009.
[Ganegedara] Thushan Ganegedara,“Natural Language Processing with TensorFlow: Teach language to machines using Python's deep learning library”, Packt Publishing, 2018.
Bibliografía
[Bishop] Christopher M. Bishop, “Pattern Recognition and Machine Learning”, Springer Verlag Gmbh, 2010.
[Bird] Stephen Bird,Ewan Klein, Edward Loper, “Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit”, O’Reilly Media, 2009.
[Ganegedara] Thushan Ganegedara,“Natural Language Processing with TensorFlow: Teach language to machines using Python's deep learning library”, Packt Publishing, 2018.