Close
Twitter Instagram LinkedIn Facebook YouTube Spotify
DCC | Programa de Curso: Reconocimiento Visual con Deep Learning

Programa de Curso

Reconocimiento Visual con Deep Learning

Código del Curso

CC66T

Créditos

3

Créditos

3

Duración

24 HORAS

Valor Individual

30 UF

Objetivos

En los últimos años hemos visto significativos avances en el área de Inteligencia Artificial, particularmente sobre la base de Deep Learning. Este hecho ha permitido el desarrollo de una gran cantidad de aplicaciones en diversos campos industriales. Por otro lado, también hemos visto una explosión en la generación de datos debido a la proliferación de dispositivos móviles, así como a la masificación de las redes sociales. Uno de estos datos son las imágenes, sobre las que se hace necesario aplicar métodos automáticos para interpretarlas. En este curso, analizaremos el estado del arte en reconocimiento visual bajo el enfoque de deep learning. Al término del ramo, el estudiante será capaz de entender y analizar modelos en clasificación, recuperación, detección, segmentación y generación de imágenes. Asimismo, estará capacitado para proponer nuevos modelos y mover las fronteras de la práctica en esta área. La metodología de trabajo estará soportada por un 40% de cátedra online para sentar los fundamentos en el área, un 20% de lectura y análisis de trabajos actuales (de CVPR, ICCV, NeuriIPS, IJCV, etc.), y finalmente un 40% de trabajos computacionales.

Contenidos

Fundamentos en Deep Learning en Visión Computacional

  • Redes Neuronales.
  • Redes Convolucionales.
  • Funciones de Activación.
  • Inicialización de Pesos y Regularización.
  • Métodos de Optimización basados en GD.
  • Redes Residuales y sus variantes.
  • Métodos de SelfAttention: Squeeze&Excitation, Non-Local Features.

Búsqueda por Similitud

  • ConvNet como extractor de características.
  • Redes Siamesas, Tripletas y Cuadrupletas.
  • Generación de representaciones binarias (DeepHashing).
  • Reducción de Dimensión, PCA, tSNE, UMAP.

Detección de objetos en imágenes

  • Faster RCNN y Anchors.
  • YOLO.
  • Retina Net.
  • TridentNet y convoluciones dilatadas (atrous convolution).
  • Modelos libres de anchors (FCOS).
  • Otros modelos de detección: CornerNet, CenterNet.
  • One-shot detection.

Segmentación de Imágenes

  • FCN.
  • U-Net.
  • Mask R-CNN.
  • DeepLab y sus variantes.
  • Modelos débilmente supervisados para segmentación semántica.

Modelos Generativos.

  • Variational AutoEncoders (VAE).
  • Generative Adversarial Networks (GANs).
  • Conditional GANs.
  • Cycle GAN.
  • GauGAN.
  • GAN + self-attention

Bibliografía

  • R. González, R. Woods, “Digital Image Processing”, 3rd Ed, Prentice Hall, 2008.
  • M. Sonka, V. Hlavac, R. Boyle, “Image Processing, Analysis and Machine Vision”, 3rd. Ed., Thomson, 2008.
  • R. Szeliski, “Computer Vision, Algorithms and Applications”, Springer, 2011.
  • Deep Learning. Ian Goodfellow, Yoshua Bengio, Aaron Courville. 2016. ISBN: 9780262035613. http://www.deeplearningbook.org/
  • Deep Learning:
    Artículos de Conferencias tipo CVPR, ICCV, ICML, ECCV, NIPS, ICLR, EMNLP.
  • Artículos de Revistas tipo IJCV, PAMI.

Bibliografía

  • R. González, R. Woods, “Digital Image Processing”, 3rd Ed, Prentice Hall, 2008.
  • M. Sonka, V. Hlavac, R. Boyle, “Image Processing, Analysis and Machine Vision”, 3rd. Ed., Thomson, 2008.
  • R. Szeliski, “Computer Vision, Algorithms and Applications”, Springer, 2011.
  • Deep Learning. Ian Goodfellow, Yoshua Bengio, Aaron Courville. 2016. ISBN: 9780262035613. http://www.deeplearningbook.org/
  • Deep Learning:
    Artículos de Conferencias tipo CVPR, ICCV, ICML, ECCV, NIPS, ICLR, EMNLP.
  • Artículos de Revistas tipo IJCV, PAMI.

Profesores

José Saavedra

José Saavedra

Cursos Relacionados

Contacto

Ubicación

Departamento de Ciencias de la Computación
FCFM, Universidad de Chile

Beauchef #851, Edificio Norte, tercer piso, oficinas 326-327. Santiago

© 2022 Departamento de Ciencias de la Computación, Universidad de Chile
🔐