OBJETIVO
Facilitar al personal perteneciente a las áreas de Planeación, Facturación, Cartera, y Tecnología de la Información, el conocimiento y puesta en práctica de las principales herramientas Estadísticas para análisis de información y la toma de decisiones, utilizando para tal efecto un software que agilice el tratamiento de los datos.
CONTENIDO
MÓDULO I. FUNDAMENTOS DEL SOFTWARE R-PROYECT Y SU APLICACIÓN PRACTICA EN ESTADÍSTICA DESCRIPTIVA.
Duración 15 horas
- 1. Estructuras de datos en R
- a. Vectores, Matrices, Arreglos de datos
- b. Captura de datos
- 2. Revisión de elementos básicos de Estadística descriptiva con R
- a. Generación de reportes: listados, formas tabulares y formas gráficas. Análisis e interpretación.
- b. Producción e interpretación de los principales indicadores unidimensionales y bidimensionales.
NOTA: se utiliza el software R dado el potencial que ofrece, la facilidad de manejo, y la economía que brinda al usuario puesto que es un software libre, además de otras características.
MÓDULO II. ELEMENTOS DE PROBABILIDAD E INFERENCIA ESTADÍSTICA. PRÁCTICA CON R
Duración 16 horas
- 1. Elementos básicos de Probabilidad
- a. La medida de probabilidad
- b. Variables aleatorias. Algunas características importantes
- c. Modelos de probabilidad más importantes
- d. Practicas con R
- 2. Elementos de Inferencia Estadística
- a. Muestras aleatorias. Estimadores. Distribuciones muéstrales.
- b. Métodos de Confirmación
- c. Métodos de Estimación
- d. Aplicación práctica de algunas funciones de R
MÓDULO III. MODELOS DE REGRESIÓN. PRÁCTICA CON R
Duración 16 horas
- 1. Análisis de Regresión lineal
- 2. No lineal
- a. Polinomial
- b. Logístico
- 3. Soluciones de la construcción de modelos con funciones de R
MÓDULO IV. INTRODUCCIÓN A LA MINERÍA DE DATOS
Duración 1 horas
- 1. Big data. Bodegas de datos.
- 2. Minería de datos
MÓDULO V.
Duración 12 horas
- 1. Introducción a KDD y la Minería de Datos
- 2. Proceso ETL (Extraer, Transformar y Cargar) y Almacenamiento
- 3. Tareas y Técnicas de data Mining
- 4. Modelos y Patrones en Data Mining
- 5. Evaluación e Implementación
- 6. Aplicación Práctica
METODOLOGÍA
- El curso se desarrolla teniendo en cuenta los elementos teóricos necesarios de cada módulo, haciendo énfasis en la aplicación correcta de los métodos, proporcionando un manejo adecuado de los datos a través del software R, y realizando los análisis pertinentes de los resultados suministrados como reportes o salidas del sistema empleado.