Close
DCC | Programa del Curso: Manejo y Extracción de Datos en Python

Programa de Curso

Manejo y Extracción de Datos en Python

Código

DEDCCPYAC02

Créditos

3

Duración

21 HORAS

Valor Individual

30 UF

Objetivos

  • Familiarizarse con las bibliotecas numpy y pandas para representar y manipular datos tabulares.
  • Aprender a extraer datos de diversas fuentes, limpiarlos y relacionarlos entre sí.

Contenidos

  • Manipulación de datos matriciales en numpy.
  • Manipulación de datos tabulares a través de dataframes en pandas.
  • Carga de datos desde diversas fuentes (CSV, Excel, JSON, Bases de datos relacionales).
  • Limpieza y homogeneización de datos: remover duplicados, manejo de datos faltantes, filtrado y detección de outliers.
  • Transformación de los datos: mapeos de datos discretos, discretización de datos numéricos, variables dummy.
  • Combinación de datos provenientes de múltiples fuentes: merge y concatenaciones.
  • Agregación y sumarización de datos.
  • Pivoteo de tablas.
  • Visualizaciones y modelos estadísticos.

Bibliografía

  • Wes McKinney. 2017. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly Media; 2nd edición.
  • Jake VanderPlas. 2016. Python Data Science Handbook. O'Reilly Media.

Bibliografía

  • Wes McKinney. 2017. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython. O'Reilly Media; 2nd edición.
  • Jake VanderPlas. 2016. Python Data Science Handbook. O'Reilly Media.

Profesores

Pablo Badilla T.

Pablo Badilla T.

Cursos Relacionados

Contacto

Ubicación

Departamento de Ciencias de la Computación
FCFM, Universidad de Chile

Beauchef #851, Edificio Norte, tercer piso, oficinas 326-327. Santiago

© 2022 - 2024 Departamento de Ciencias de la Computación, Universidad de Chile