Lab 2: Exploración avanzada y comparación de modelos
Día 1. Exploración de datos de satisfacción democrática en América Latina. Feature engineering, comparación de regresión logística, árboles de decisión y KNN con tidymodels.
Día 2. Clasificación avanzada con datos simulados de Latinobarómetro. Random Forest con tuning de hiperparámetros, XGBoost, interpretación con VIP y Partial Dependence Plots.
Día 2. Regresión lineal, LASSO, Ridge y Elastic Net con glmnet. Selección de variables, comparación de modelos de regresión y predicción con datos de Latinobarómetro.
Día 3, sesión 1. Segmentación de países latinoamericanos por indicadores socioeconómicos del Banco Mundial usando K-means, clustering jerárquico y PCA.
Código (próximamente)
Lab 6: Análisis de texto
Día 3, sesión 2. Tokenización, TF-IDF, nube de palabras y extracción de tópicos (LDA) en discursos políticos latinoamericanos con tidytext y topicmodels.
Código (próximamente)
Lab 7: Primeros pasos con ellmer
Día 4, sesión 1. Uso de ellmer para interactuar con modelos de lenguaje desde R. Clasificación automática de textos y extracción de datos estructurados.
Código (próximamente)
Lab 8: Aplicaciones avanzadas de LLMs
Día 4, sesión 2. Análisis de sentimiento con LLMs, generación de datos sintéticos y auditoría de sesgos algorítmicos.
Código (próximamente)
Lab 9: Auditoría de sesgo algorítmico
Día 5. Métricas de equidad, detección de sesgo en modelos de ML y propuestas de investigación.
Código (próximamente)
Requisitos de software
Antes del primer día, asegurarse de tener instalado: