INSTITUTO JIMÉNEZ
Este curso es el primer paso de un programa Técnico para Formación en Analítica de Datos. Se desarrollarán los principios básicos de análisis y visualización de datos desde el área científica para todas las áreas de las empresas.
Contenido de Fundamentos de R para Ciencia de Datos
Introducción.
Análisis de Datos VS Ciencia de Datos VS Inteligencia de Negocios.
Entorno de trabajo de R.
Instalación y Configuración.
Interacción con la interface.
Utilización de las opciones de Ayuda de R.
Conceptos de variables, tipos de datos y clasificación.
Tipos de Datos (numéricos, lógicos, alfanuméricos, fecha, factores, coerción).
Estructuras de Datos (Variables, constantes, vectores, matrices y listas).
Clasificación de los tipos de variables.
Automatización de Procesos.
Funciones definidas por el usuario.
Estructuras de control (if, else, while, repeat, for, break, next).
Administración de Fuentes de Datos.
Configuración de carga de archivos.
Instalación de componentes de R.
Importar archivos csv, tsv, psv, Excel (una o varias hojas).
Exploración de Datos.
Dataframes, conjuntos y subconjuntos de datos.
Tablas de datos.
Identificación y administración de valores Nulos o inconsistentes.
Identificación y administración de valores atípicos.
Técnicas de Limpieza de Datos.
Visualización de Datos con R.
Creación de Graficas Base.
Creación de Gráficas con GGPLOT2 (barras, boxplot y violín)
Creación de Gráficas con GGPLOT2 (histogramas y gráficas de densidad)
Creación de Gráficas con GGPLOT2 (dispersión, correlogramas).