Contexto
Dataset de vuelos comerciales en 2024, con información de aerolíneas, aeropuertos, retrasos, cancelaciones y motivos asociados. Objetivo: analizar los patrones de retrasos y cancelaciones, identificar aerolíneas y aeropuertos más afectados y explorar factores que impactan la eficiencia de los vuelos.
Objetivos del análisis
- Limpiar y transformar un dataset de más de 7 millones de filas usando R y
fread
para mayor velocidad. - Analizar retrasos y cancelaciones por aerolínea, aeropuerto y mes.
- Identificar las causas principales de cancelaciones y retrasos.
- Evaluar la eficiencia de aeropuertos y aerolíneas.
- Publicar insights en un dashboard interactivo en Tableau Cloud.
Estructura del Dashboard
- Limpieza y transformación en R: lectura con
fread
, tratamiento de nulos e inconsistencias, creación de variables agregadas. - Análisis descriptivo: distribución por aerolíneas y aeropuertos, retrasos por motivo, tasas de cancelación.
- Visualización: preparación de extracts y vistas para Tableau, construcción del dashboard interactivo.
Técnicas y herramientas
- R: data.table (fread), dplyr, lubridate, ggplot2
- Visualización: Tableau Cloud
- Análisis: agregaciones por aerolínea, aeropuerto, motivo y mes
Dataset
Fuente: Kaggle
Principales insights
- American Airlines: 15.050 vuelos cancelados.
- Frontier Airlines: mayor tasa de cancelación, 2,32%.
- Southwest Airlines: 1.419.419 vuelos en el año; más retrasos relacionados con avión y compañía (199.913 y 169.751).
- Aeropuerto de Texas: más retrasos y tiempo en pista elevado.
- 55,48% de las cancelaciones provocadas por causas meteorológicas.
Principales visualizaciones
Dashboard Proyecto Vuelos
