INSTITUTO JIMÉNEZ

Este curso es el primer paso de un programa Técnico para Formación en Analítica de Datos. Se desarrollarán los principios básicos de análisis y visualización de datos desde el área científica para todas las áreas de las empresas.
Contenido de Fundamentos de R para Ciencia de Datos
Introducción.
  • Análisis de Datos VS Ciencia de Datos VS Inteligencia de Negocios.
  • Entorno de trabajo de R.
  • Instalación y Configuración.
  • Interacción con la interface.
  • Utilización de las opciones de Ayuda de R.
Conceptos de variables, tipos de datos y clasificación.
  • Tipos de Datos (numéricos, lógicos, alfanuméricos, fecha, factores, coerción).
  • Estructuras de Datos (Variables, constantes, vectores, matrices y listas).
  • Clasificación de los tipos de variables.
Automatización de Procesos.
  • Funciones definidas por el usuario.
  • Estructuras de control (if, else, while, repeat, for, break, next).
Administración de Fuentes de Datos.
  • Configuración de carga de archivos.
  • Instalación de componentes de R.
  • Importar archivos csv, tsv, psv, Excel (una o varias hojas).
Exploración de Datos.
  • Dataframes, conjuntos y subconjuntos de datos.
  • Tablas de datos.
  • Identificación y administración de valores Nulos o inconsistentes.
  • Identificación y administración de valores atípicos.
  • Técnicas de Limpieza de Datos.
Visualización de Datos con R.
  • Creación de Graficas Base.
  • Creación de Gráficas con GGPLOT2 (barras, boxplot y violín)
  • Creación de Gráficas con GGPLOT2 (histogramas y gráficas de densidad)
  • Creación de Gráficas con GGPLOT2 (dispersión, correlogramas).