BancaInteligencia Artificial

Reducción del 40% en falsos positivos de fraude bancario

Una institución financiera tenía un sistema de detección de fraude que bloqueaba demasiadas transacciones legítimas. Construimos un modelo de ML que mejoró la precisión sin sacrificar la velocidad.

>40%Reducción de falsos positivosMenos bloqueos innecesarios de transacciones legítimas, mejorando la experiencia del cliente
<1 sLatencia de scoringCada transacción recibe una puntuación de riesgo en tiempo real sin impactar el flujo del pago
SemanalCiclo de reentrenamientoEl modelo se actualiza automáticamente con los patrones de fraude más recientes cada semana
3 mesesTiempo a producciónDesde el primer análisis de datos hasta el modelo en producción procesando transacciones reales

El desafío

Un sistema que protegía el banco bloqueando a sus propios clientes

La institución financiera contaba con un sistema de detección de fraude basado en reglas estáticas: umbrales fijos de monto, listas negras de comercios y patrones predefinidos. Con los años, estas reglas se habían vuelto conservadoras en exceso. El resultado era una tasa de falsos positivos elevada que afectaba directamente la experiencia de sus clientes.

Clientes legítimos veían sus transacciones bloqueadas durante viajes al extranjero, compras en nuevos comercios o pagos de montos inusuales pero completamente válidos. El equipo de atención recibía un volumen significativo de reclamos diarios relacionados con bloqueos injustificados, y la resolución manual de cada caso consumía recursos considerables. Esto, además de generar fricción, erosionaba la confianza en el banco.

El sistema tampoco evolucionaba al ritmo de las tácticas de fraude. Los patrones detectados eran siempre los mismos, mientras que el fraude real adoptaba formas nuevas. Se necesitaba un modelo que aprendiera de los datos y se actualizara continuamente, sin requerir intervención manual en cada cambio.

La solución

Modelo de scoring en tiempo real con reentrenamiento continuo

El primer paso fue construir el conjunto de entrenamiento correcto. Trabajamos con el equipo de fraude de la institución para etiquetar históricamente miles de transacciones, construyendo features que capturaban contexto: comportamiento del usuario en los últimos 30, 7 y 1 días, patrón geográfico histórico, velocidad de transacciones, y señales del comercio de destino.

Desarrollamos un ensemble de modelos —XGBoost y LightGBM— entrenado para maximizar la separación entre fraude real y transacciones legítimas inusuales. El modelo produce un score de riesgo continuo en lugar de una decisión binaria, permitiendo al equipo configurar umbrales diferenciados según tipo de transacción, canal y perfil de cliente.

Para el scoring en tiempo real construimos una API con FastAPI que recibe las transacciones desde el sistema core del banco vía Kafka y devuelve el score en menos de un segundo. El modelo vive en MLflow, con versionado completo y posibilidad de rollback inmediato.

El ciclo de reentrenamiento semanal, orquestado con Airflow, toma las transacciones de los últimos 90 días —con las nuevas etiquetas confirmadas por el equipo de fraude— y genera automáticamente una nueva versión del modelo. Si las métricas de evaluación mejoran o se mantienen, el modelo nuevo pasa a producción sin intervención manual.

Los resultados

Menos fricción para el cliente, mejor protección para el banco

La reducción de falsos positivos en más del 40% tuvo un efecto inmediato y medible: el volumen de reclamos por bloqueos injustificados cayó de forma proporcional, liberando al equipo de atención para resolver casos que realmente lo requerían. Los clientes que viajan o tienen patrones de gasto variables dejaron de ver interrupciones en sus transacciones.

La detección de fraude real se mantuvo y mejoró: el modelo captura patrones emergentes que el sistema de reglas no podía detectar. El equipo de fraude ahora trabaja con una cola de alertas más pequeña pero de mayor calidad, enfocando su tiempo en casos de mayor riesgo real.

El ciclo semanal de reentrenamiento garantiza que el modelo se adapte a las tácticas de fraude en evolución sin intervención manual. El equipo de datos del banco opera el pipeline de forma autónoma, con visibilidad completa sobre el rendimiento del modelo en MLflow.

Tecnologías usadas

Python / scikit-learn
Desarrollo del modelo ML
XGBoost / LightGBM
Algoritmos de clasificación
MLflow
Tracking de experimentos y registro de modelos
Apache Kafka
Streaming de transacciones en tiempo real
FastAPI
API de scoring en tiempo real
Airflow
Orquestación del reentrenamiento semanal

¿Tu modelo de fraude necesita evolucionar?

Construimos modelos que aprenden, no solo que detectan

Cuéntanos tu situación actual. Evaluamos si un modelo de ML puede mejorar tus métricas de fraude sin impactar la experiencia de tus clientes.

Conversar con un especialista →Ver más casos