Una empresa logística con operaciones en múltiples regiones dependía de reportes que llegaban con casi dos días de retraso. Migramos su infraestructura de datos a Snowflake en 12 semanas sin interrumpir las operaciones.
El desafío
La empresa gestionaba una flota de vehículos y centros de distribución repartidos en varias regiones del país. Para operar necesitaban responder preguntas concretas: ¿cuántos despachos están pendientes hoy?, ¿qué rutas tienen retraso?, ¿qué clientes corren riesgo de incumplimiento de SLA? Pero los reportes que respondían esas preguntas solo estaban disponibles al día siguiente, en el mejor de los casos.
El sistema legado era un Data Warehouse on-premise con más de ocho años, alimentado por procesos batch nocturnos. Las consultas sobre datos históricos podían tardar horas. El servidor estaba en el límite de su capacidad y cualquier consulta pesada bloqueaba los reportes de otros usuarios. Ampliar la infraestructura física implicaba costos de hardware y tiempo de administración que el equipo de TI no podía asumir.
El negocio había crecido: más rutas, más clientes, más volumen. La infraestructura de datos no había crecido al mismo ritmo. El equipo de operaciones tomaba decisiones sobre la base de lo que pasó ayer, cuando necesitaba saber qué está pasando ahora.
La solución
Definimos una estrategia de migración en tres fases para garantizar continuidad operativa. En la fase inicial, levantamos el ambiente Snowflake en paralelo al sistema legacy y comenzamos a replicar los datos históricos con Airbyte. El negocio siguió operando sobre el sistema existente mientras construíamos la nueva capa.
En la fase central, reconstruimos todos los modelos de datos con dbt, documentando cada tabla y métrica. Esto fue un trabajo de ingeniería y también de colaboración con el negocio: muchas transformaciones heredadas nadie sabía exactamente para qué servían. Al forzar la documentación encontramos y eliminamos decenas de tablas obsoletas que nadie consumía.
Para los datos operacionales que necesitaban latencia baja, configuramos replicación continua con Airbyte. Los reportes críticos —estado de flota, despachos del día, alertas de SLA— pasaron a tener datos con máximo 15 minutos de antigüedad, una mejora de 192 veces respecto al sistema anterior.
En la fase final apagamos el sistema legacy, migramos las visualizaciones de Power BI a las nuevas fuentes y configuramos el pipeline de CI/CD para que los cambios en modelos dbt pasen por revisión de código antes de ir a producción. Todo el código de infraestructura vive en Terraform y es reproducible.
Los resultados
El resultado más visible fue el tiempo de reporte: de 48 horas a 15 minutos. El equipo de operaciones comenzó a tomar decisiones durante el día con información del día. Las alertas de riesgo de incumplimiento de SLA permiten ahora reaccionar antes de que ocurran, en lugar de explicarlos al día siguiente.
La migración se completó en 12 semanas con cero cortes operativos. El negocio nunca perdió acceso a sus datos durante la transición. Al finalizar, el equipo de datos opera Snowflake y dbt de forma autónoma, con un stack moderno, documentado y versionado en Git.
El costo mensual de infraestructura de datos se redujo significativamente al eliminar el servidor on-premise y aprovechar la elasticidad de Snowflake: se paga por lo que se usa, no por la capacidad máxima posible. La plataforma puede escalar en minutos si el volumen de datos crece.
Tecnologías usadas
¿Tus reportes llegan tarde?
Cuéntanos tu stack actual. Evaluamos la complejidad de tu migración y te damos un plan de proyecto con plazos reales.