Código

CC66T

Créditos

Duración

24 HORAS

Valor Individual

30 UF

Objetivos

En los últimos años, hemos visto significativos avances en el área de Inteligencia Artificial, particularmente sobre la base de Deep Learning. Este hecho ha permitido el desarrollo de una gran cantidad de aplicaciones en diversos campos industriales. Por otro lado, también hemos visto una explosión en la generación de datos debido a la proliferación de dispositivos móviles, así como a la masificación de las redes sociales. Uno de estos datos son las imágenes, sobre las que se hace necesario aplicar métodos automáticos para interpretarlas. En este curso, analizaremos el estado del arte en reconocimiento visual bajo el enfoque de deep learning. Al término del ramo, el estudiante será capaz de entender y analizar modelos en clasificación, recuperación, detección, segmentación y generación de imágenes. Asimismo, estará capacitado para proponer nuevos modelos y mover las fronteras de la práctica en esta área. La metodología de trabajo estará soportada por un 40% de cátedra online para sentar los fundamentos en el área, un 20% de lectura y análisis de trabajos actuales (de CVPR, ICCV, NeuriIPS, IJCV, etc.), y finalmente un 40% de trabajos computacionales.

Contenidos

Fundamentos en Deep Learning en Visión Computacional

Redes Neuronales.
Redes Convolucionales.
Funciones de Activación.
Inicialización de Pesos y Regularización.
Métodos de Optimización basados en GD.
Redes Residuales y sus variantes.
Métodos de SelfAttention: Squeeze&Excitation, Non-Local Features.

Búsqueda por Similitud

ConvNet como extractor de características.
Redes Siamesas, Tripletas y Cuadrupletas.
Generación de representaciones binarias (DeepHashing).
Reducción de Dimensión, PCA, tSNE, UMAP.

Detección de objetos en imágenes

Faster RCNN y Anchors.
YOLO.
Retina Net.
TridentNet y convoluciones dilatadas (atrous convolution).
Modelos libres de anchors (FCOS).
Otros modelos de detección: CornerNet, CenterNet.
One-shot detection.

Segmentación de Imágenes

FCN.
U-Net.
Mask R-CNN.
DeepLab y sus variantes.
Modelos débilmente supervisados para segmentación semántica.

Modelos Generativos.

Variational AutoEncoders (VAE).
Generative Adversarial Networks (GANs).
Conditional GANs.
Cycle GAN.
GauGAN.
GAN + self-attention

Bibliografía

R. González, R. Woods, “Digital Image Processing”, 3rd Ed, Prentice Hall, 2008.
M. Sonka, V. Hlavac, R. Boyle, “Image Processing, Analysis and Machine Vision”, 3rd. Ed., Thomson, 2008.
R. Szeliski, “Computer Vision, Algorithms and Applications”, Springer, 2011.
Deep Learning. Ian Goodfellow, Yoshua Bengio, Aaron Courville. 2016. ISBN: 9780262035613. http://www.deeplearningbook.org/
Deep Learning:
Artículos de Conferencias tipo CVPR, ICCV, ICML, ECCV, NIPS, ICLR, EMNLP.
Artículos de Revistas tipo IJCV, PAMI.

Bibliografía

R. González, R. Woods, “Digital Image Processing”, 3rd Ed, Prentice Hall, 2008.
M. Sonka, V. Hlavac, R. Boyle, “Image Processing, Analysis and Machine Vision”, 3rd. Ed., Thomson, 2008.
R. Szeliski, “Computer Vision, Algorithms and Applications”, Springer, 2011.
Deep Learning. Ian Goodfellow, Yoshua Bengio, Aaron Courville. 2016. ISBN: 9780262035613. http://www.deeplearningbook.org/
Deep Learning:
Artículos de Conferencias tipo CVPR, ICCV, ICML, ECCV, NIPS, ICLR, EMNLP.
Artículos de Revistas tipo IJCV, PAMI.

Profesores

José Saavedra

Ver Malla

Educación Continua

Programa de Curso

Reconocimiento Visual con Deep Learning

Código

Créditos

Duración

Valor Individual

Objetivos

Contenidos

Bibliografía

Bibliografía

Profesores

Cursos Relacionados

Contacto

Departamento de Ciencias de la Computación
FCFM, Universidad de Chile

Nosotros

Pregrado

Postgrado

Educación Continua

Investigación

Difusión

Educación Continua

Código

Créditos

Duración

Valor Individual

Objetivos

Contenidos

Bibliografía

Bibliografía

Profesores

Cursos Relacionados

Contacto

Departamento de Ciencias de la Computación FCFM, Universidad de Chile

Departamento de Ciencias de la Computación
FCFM, Universidad de Chile