Este proyecto fue desarrollado como parte del reto FP20, con el objetivo de construir un flujo de análisis de datos end-to-end utilizando la plataforma Microsoft Fabric, desde la ingesta hasta la visualización con Power BI, pasando por un modelo dimensional robusto.
- Microsoft Fabric (Dataflow Gen2, Lakehouse, Semantic Model)
- Power BI
- Power Query
- DAX
- Excel
Analizar rutas, distancias, tiempos de entrega y proveedores con demoras, utilizando un enfoque de arquitectura moderna basada en capas Bronce, Plata y Oro, y generar visualizaciones que permitan tomar decisiones logísticas basadas en datos.
En esta etapa se cargan los datos sin transformaciones, tal como vienen del archivo fuente. Esta capa sirve como respaldo histórico e inmutable, garantizando trazabilidad.
🔍 Se almacenan:
- Reservas de envío
- Información de rutas
- Fechas y horarios
📌 Propósito:
- Guardar la fuente original
- Auditar la calidad de datos futura
📸 Imagen de artefactos creados en Fabric
Aquí se realiza la transformación de datos, limpiando duplicados, valores nulos y ajustando nombres de columnas. También se ajusta la estructura para facilitar el modelado.
📌 Incluye:
- Normalización de nombres
- Eliminación de datos inconsistentes
- Conversión de tipos
- Unión y relación de datasets
Se construye el modelo dimensional, separando tablas de hechos y dimensiones. Esta capa está optimizada para la consulta y análisis en Power BI.
📌 Se modelan:
- Hechos de transporte (distancia, tiempos)
- Dimensiones: Proveedor, Cliente, Transporte, Origen, Destino, Material, Calendario
En Power BI se construyó un panel interactivo con indicadores clave como:
- Total de registros
- Proveedores con más entregas tardías
- Distancia total recorrida
- Rutas frecuentes
Se utilizaron fórmulas DAX para calcular tiempos de entrega, identificar proveedores con demoras y analizar distancias promedio por ruta.
- Carga de dataset original en Lakehouse (Capa Bronce)
- Transformaciones en Dataflow Gen2 (Capa Plata)
- Modelado dimensional (Capa Oro)
- Publicación del modelo semántico
- Diseño de dashboard en Power BI
- El modelo permitió identificar rutas críticas y proveedores con mayor incidencia en retrasos.
- Se aprovechó todo el ecosistema de Microsoft Fabric de manera integrada.
- La arquitectura en capas garantiza escalabilidad y gobernanza de datos.
Vicente Antonio Juan Magallanes
🔗 LinkedIn | 📧 Email | 🎓 Certificación Microsoft
Te invito a ver el recorrido completo de este proyecto y otros análisis en mi canal:
🎥 YouTube - Vicente Magallanes
⭐ Si este proyecto te pareció interesante, ¡agrégale una estrella y sígueme para más contenido de análisis de datos con Power BI y Microsoft Fabric!