UNIDAD DIDÁCTICA 1. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO
- Introducción a la minería de datos y el aprendizaje automático
- – Proceso KDD
- – Modelos y Técnicas de Data Mining
- – Áreas de aplicación
- – Minería de textos y Web Mining
- – Data mining y marketing
UNIDAD DIDÁCTICA 2. R COMO HERRAMIENTA PARA BIG DATA
- Instalación de R y RStudio
- – Introducción al lenguaje
- – Historia e Introducción a R
- – Operaciones Básicas y Números
- – Atributos, Entrada y Coerción
- – Matrices
- – Precedencia Operaciones Vectoriales
- – Manejo de fechas y tiempo
- – Listas, Factores, Valores Faltantes y Dataframes
- – Subconjuntos de Datos
- – Leer y Escribir Datos
- Uso del lenguaje
- – Estructuras de Control
- – Funciones
- – Reglas de Alcance
- Sistema de gráficos
- – Funciones *apply: apply
- – Funciones *apply: lapply / sappy
- – Funciones *apply: mapply / rep
- – Graficación con el Sistema de Base de Gráficos
- – Algunas Funciones Gráficas de Alto Nivel
- – Parámetros en el Sistema de Gráficos
- – Colores en el Sistema de Gráficos
- – Graficación con Notación Matemática
- – Graficación con texto y notación matemática
- – Creación de Gráficas en 3D
- Expresiones regulares. Gráficas con ggplot2 y Simulación
- – Expresiones Regulares
- – Paquete de gráficos ggplot2
- – Simulación
- R en el mundo real
- – Estadística Descriptiva y Predictiva con R
- – Integración de R en Hadoop
UNIDAD DIDÁCTICA 3. PRE-PROCESAMIENTO &, PROCESAMIENTO DE DATOS
- Obtención y limpieza de los datos (ETL)
- Inferencia estadística
- Pruebas de hipótesis
- Modelos de regresión
- Árboles de Decisión
- Algoritmos de Clasificación / Regresión (J48/C5.0, M5P)
- Normalización, Tipos de distancia, Correlación
- Machine Learning
- Comparar Artículos (k-NN)
- Modelo predictivo de profit (k-NN, M5P…)
- Modelo predictivo de clasificación (J48, k-NN)
UNIDAD DIDÁCTICA 4. ANÁLISIS DE LOS DATOS
- Inteligencia Analítica de negocios
- La teoría de grafos y el análisis de redes sociales
- Presentación de resultados
UNIDAD DIDÁCTICA 5. PROCESAMIENTO DISTRIBUIDO DE DATOS CON HADOOP
- ¿Qué es Hadoop?
- El sistema de archivos HDFS
- Algunos comandos de referencia
- Procesamiento MapReduce con Hadoop
- El concepto de los clusters en Hadoop
UNIDAD DIDÁCTICA 6. WEKA Y DATA MINING
- ¿Qué es Weka?
- Técnicas de Data Mining en Weka
- Interfaces de Weka
- Selección de atributos
Características del curso
- Conferencias 0
- Cuestionarios 0
- Duración 80 Horas
- Nivel de habilidad Todos los niveles
- Idioma Español
- Estudiantes 0
- Certificado No
- Evaluaciones Si