Programa

Primera parte: Miércoles 19 de agosto, de 8:30 am a 12:00 md

Profesor: Dr. Oldemar Rodríguez, Universidad de Costa Rica

  1. ¿Qué es “Big Data”?
    • Historia de Big Data.
    • Los datos (la vida) en la nube: Big data y cloud computing.
    • Volumen, Variedad y Velocidad (las3V’s).
    • Big Data – Big Analytics.
    • Plataforma de código abierto “Hadoop”
  2. Big Data en R
    • Paquetes biglm, party, ff, bigmemory, bigtabulate, snow.
    • R Hadoop.
    • Computación paralela.
    • Paralelizando el proceso de calibración de las K-Medias.
    • Paralelizando los procesos de Validación Cruzada y selección de modelos predictivos
  3. Introducción a los datos simbólicos como modo de enfrentar los problemas con datos masivos
    • Tablas simbólicas.
    • Definición de objeto simbólico.
    • De las bases de datos relacionales a los datos simbólicos.
    • Estadísticas básicas sobre datos simbólicos, media, varianza, mediana, covarianza, correlación, entre otros.
    • Análisis en Componentes Principales para datos de tipo intervalo.
    • Uso del paquete de R: RSDA.

Segunda parte: Miércoles 19 de agosto, de 1:30 am a 5 pm

Profesor: Dr. Edwin Diday, Université Paris Dauphine

Título de la lección: Análisis de datos simbólicos para Big Data y para estructuras de datos complejos: Pensando según clases en la Ciencia de los Datos.

  1. Introducción: El paradigma SDA
    • ¿Cuál es la falla real y el cambio que ha producido el dominio SDA?
    • ¿Qué son variables simbólicas?
    • Variables simbólicas,  numéricas, categóricas o de intervalo modal
  2. ¿Qué es lo que se observa y escrudiña?
    • De dónde pueden ser obtenidas las clases y sus descripciones
    • Las clases de individuos y su descripción simbólica construida a partir de los “datos complejos”
    • ¿Qué distingue el estudio de clases del estudio de individuos?
  3. ¿Qué tipo de preguntas y cómo son estructuradas?
    • ¿Cómo pasar de datos estándar a datos simbólicos?
    • ¿Cómo medir la calidad de una tabla de datos simbólicos?
    • ¿Cómo analizar las tablas de datos simbólicos?
  4. ¿Cuáles son los principios y el desarrollo teórico?
    • El principio de generalización de la herramienta SDA
    • Desarrollo teórico
  5. Cuál es el dominio de aplicabilidad de SDA
    1. Aplicación a tablas de datos estándar transformadas en tablas de datos simbólicos
    2. Aplicación a datos complejos

Tercera parte: Jueves 20 de agosto de 8:30 a 12 md.

Profesor: Dr. Derek Ruths, Universidad de McGuill, Canadá

Título de la lección: De los Tweets a los resultados: Cómo obtener, minar y analizar datos de Twitter

  1. ¿Qué es Twitter?
    • ¿Por qué estudiar Twitter?
    • Revisión básica de la plataforma  Twitter
    • Explicación de rasgos arquitectónicos clave de la plataforma (sistemas de almacenamiento (DB, mecanismos de acceso de datos)
  2. Recolectando tweets
    • Recolección de datos a través del API de streaming
    • Recolección de datos a través  de API REST – ful
    • Recolección de datos por “raspado”
    • Trabajando con datos JSON
    • Sugerencias para almacenar datos de Twitter
    • Infiriendo redes sociales
  3. Analizando datos de Twitter
    • Filtrado de palabras claves
    • Modelación de tópicos
    • Análisis de redes sociales

Cuarta parte: Jueves 20 de agosto de 1:30 a 5 pm

Aplicaciones de Big Data en Costa Rica y reflexiones sobre la enseñanza de este tema

1:30 a 3 pm:
Yersinio Jiménez: Aplicaciones de Big Data utilizando MATLAB
Samuel Muñoz y Paula García: Arboles de decisión aplicados a riesgo financiero

3:30 pm a 4:30 pm Mesa Redonda: Reflexiones sobre la enseñanza de Big Data en la Escuela de Estadística

4:30 a 5 pm Entrega de certificados y cierre

Un Comentario

  1. Pingback:Realizan primera escuela de Big data en Costa Rica | Surcos

Comentarios cerrados