Caso de Estudio Banca: Detección de Fraude con ML — 40% menos falsos positivos

El desafío

Un sistema que protegía el banco bloqueando a sus propios clientes

La institución financiera contaba con un sistema de detección de fraude basado en reglas estáticas: umbrales fijos de monto, listas negras de comercios y patrones predefinidos. Con los años, estas reglas se habían vuelto conservadoras en exceso. El resultado era una tasa de falsos positivos elevada que afectaba directamente la experiencia de sus clientes.

Clientes legítimos veían sus transacciones bloqueadas durante viajes al extranjero, compras en nuevos comercios o pagos de montos inusuales pero completamente válidos. El equipo de atención recibía un volumen significativo de reclamos diarios relacionados con bloqueos injustificados, y la resolución manual de cada caso consumía recursos considerables. Esto, además de generar fricción, erosionaba la confianza en el banco.

El sistema tampoco evolucionaba al ritmo de las tácticas de fraude. Los patrones detectados eran siempre los mismos, mientras que el fraude real adoptaba formas nuevas. Se necesitaba un modelo que aprendiera de los datos y se actualizara continuamente, sin requerir intervención manual en cada cambio.

La solución

Modelo de scoring en tiempo real con reentrenamiento continuo

El primer paso fue construir el conjunto de entrenamiento correcto. Trabajamos con el equipo de fraude de la institución para etiquetar históricamente miles de transacciones, construyendo features que capturaban contexto: comportamiento del usuario en los últimos 30, 7 y 1 días, patrón geográfico histórico, velocidad de transacciones, y señales del comercio de destino.

Desarrollamos un ensemble de modelos —XGBoost y LightGBM— entrenado para maximizar la separación entre fraude real y transacciones legítimas inusuales. El modelo produce un score de riesgo continuo en lugar de una decisión binaria, permitiendo al equipo configurar umbrales diferenciados según tipo de transacción, canal y perfil de cliente.

Para el scoring en tiempo real construimos una API con FastAPI que recibe las transacciones desde el sistema core del banco vía Kafka y devuelve el score en menos de un segundo. El modelo vive en MLflow, con versionado completo y posibilidad de rollback inmediato.

El ciclo de reentrenamiento semanal, orquestado con Airflow, toma las transacciones de los últimos 90 días —con las nuevas etiquetas confirmadas por el equipo de fraude— y genera automáticamente una nueva versión del modelo. Si las métricas de evaluación mejoran o se mantienen, el modelo nuevo pasa a producción sin intervención manual.

Los resultados

Menos fricción para el cliente, mejor protección para el banco

La reducción de falsos positivos en más del 40% tuvo un efecto inmediato y medible: el volumen de reclamos por bloqueos injustificados cayó de forma proporcional, liberando al equipo de atención para resolver casos que realmente lo requerían. Los clientes que viajan o tienen patrones de gasto variables dejaron de ver interrupciones en sus transacciones.

La detección de fraude real se mantuvo y mejoró: el modelo captura patrones emergentes que el sistema de reglas no podía detectar. El equipo de fraude ahora trabaja con una cola de alertas más pequeña pero de mayor calidad, enfocando su tiempo en casos de mayor riesgo real.

El ciclo semanal de reentrenamiento garantiza que el modelo se adapte a las tácticas de fraude en evolución sin intervención manual. El equipo de datos del banco opera el pipeline de forma autónoma, con visibilidad completa sobre el rendimiento del modelo en MLflow.

Tecnologías usadas

Python / scikit-learn

Desarrollo del modelo ML

XGBoost / LightGBM

Algoritmos de clasificación

MLflow

Tracking de experimentos y registro de modelos

Apache Kafka

Streaming de transacciones en tiempo real

FastAPI

API de scoring en tiempo real

Airflow

Orquestación del reentrenamiento semanal

Reducción del 40% en falsos positivos de fraude bancario

Un sistema que protegía el banco bloqueando a sus propios clientes

Modelo de scoring en tiempo real con reentrenamiento continuo

Menos fricción para el cliente, mejor protección para el banco

Construimos modelos que aprenden, no solo que detectan