
Internacionalización: ¿cómo escalar su modelo de datos?
Imagínese una empresa que conceda créditos en Francia, pero que busque expandirse a otros países, principalmente en Europa. Se dará cuenta de inmediato de que no es tan fácil. Incluso dentro de la Unión Europea, los contextos varían mucho. Datos sin homologar, sistemas de crédito que funcionan de formas diferentes… La empresa puede llevarse una sorpresa muy desagradable y verse obligada a reconstruir su modelo de calificación desde cero.
Lejos de ser hipotética, esta situación era bastante común hasta hace poco tiempo. Concebir un modelo de datos que se pueda aplicar a todos los países es altamente complicado, pero no imposible. Especialmente con la disponibilidad actual de un poderoso recurso: los datos de Open Banking.
En Algoan, nos hemos esforzado desde el primer día en crear un modelo de Credit Scoring para API, escalable a nivel internacional, con el respaldo de esos datos. ¿Cómo lo hemos hecho? Camille Charreaux, jefa del departamento de Ciencia de datos, nos ha hecho ver nuestras opciones en materia de datos para crear un producto adecuado para todas las geografías, sin convertirlo en un rompecabezas.
Datos accesibles, pero heterogéneos.
¿Recuerda su última experiencia solicitando un crédito? Si hace más de 5 años, será algo parecido a esto:
«Tradicionalmente, en Francia, las entidades de crédito piden a aquellos consumidores que solicitan un préstamo que rellenen un formulario en línea. Entre 10 y 20 preguntas a las que hay que responder declarando su situación familiar, ingresos, gastos, otros préstamos pendientes, etc.»
Y si ha contactado con bancos o entidades de crédito, lo sabe: esos cuestionarios varían de unos a otros… al igual que las decisiones de concesión de créditos. (¡Imagínese cómo será entre países distintos!)
Un enfoque no exento de problemas:
- Los datos son declarativos. Esto significa que puede haber errores, olvidos u omisiones.
A menudo, existe una discrepancia entre los ingresos, que son sobreestimados, y los gastos, que se subestiman. Y hay una tendencia a no declarar otros créditos pendientes para optimizar las posibilidades. - Los datos no son financieros. No sólo eso; una gran parte son datos demográficos y socioprofesionales (edad, situación familiar, categoría laboral, etc.). No obstante, los datos financieros son los más fiables para saber si una persona podrá devolver su préstamo.
Ya sea por la recopilación de datos o por la naturaleza de los mismos, este modelo de calificación crediticia no es óptimo. Y a esto se añade una capa adicional de complejidad: las diferentes formas de operar de los países, con la presencia de agencias de crédito (Credit Bureaus).
«Se trata de un enfoque que no es conocido en Francia, pero que es habitual en muchos países. Las agencias de crédito son organismos que recogen información sobre los créditos que ya tienen los consumidores. Proporcionan esta información, sobre todo, a las entidades de crédito, que obtienen una visión global de la situación del ciudadano».
Los datos ya no son exclusivamente declarativos, lo que resuelve parte del problema. Y, pese a ello, surgen otros:
- Los datos recopilados varían de un país a otro, incluso con las agencias de crédito presentes en varios países.
- Dependiendo del país, no todos los créditos se registran en las agencias de crédito, y eso crea disparidades.
- Los datos recopilados no son tan granulares como los datos bancarios.
- En las bases de datos solo aparecen aquellos que ya hayan contratado un crédito. Para quien hace su primera solicitud, puede ser complicado tener una calificación crediticia y, por tanto, conseguir acceso al crédito. En los Estados Unidos, por ejemplo, sin la calificación FICO es difícil conseguir un préstamo.
Las propias entidades de crédito, cuando recurren a las agencias de crédito, tienen que adaptar sus modelos de calificación en función de los datos recogidos por cada una de ellas.
Pero hay buenas noticias: este funcionamiento ha evolucionado con el paso de los años.
- Para empezar, la aparición en la década de 2010 de agregadores que recogen los datos bancarios de los consumidores. Utilizando el raspado web, un método que consiste en recopilar datos financieros para evaluar el potencial de una persona para reembolsar su crédito.
- Un enfoque que carecía de seguridad hasta que, en 2019, entró en vigor la DSP2, la segunda directiva europea sobre servicios de pagos. Esto asegura el acceso a los datos bancarios, requiriendo que los bancos implementen API seguras, con estrictos mecanismos de autenticación. Es el famoso “Open Banking”. Esto ha permitido a los agregadores desarrollar conexiones seguras y fiables, proporcionando datos bancarios universales y granulares.
Esos datos obtenidos gracias al Open Banking crean una base sólida para crear modelos escalables a nivel internacional.
Open Banking: una oportunidad indiscutible para el tratamiento de datos
¿Por qué los datos de Open Banking cambian radicalmente la situación del tratamiento de datos?
«Los datos del Open Banking se presentan en formatos bien conocidos en el mundo de la ciencia de datos. Son numéricos (importes de las transacciones) y textuales. Tenemos una idea de los tipos de modelos y arquitecturas que funcionan con estas categorías de datos».
Su propia naturaleza resuelve muchos de los problemas que surgen en la calificación crediticia tradicional:
- Son siempre los mismos datos, en un formato similar.
- La fuente de los datos es única y no se puede falsificar. Ya no son declarativos; los datos se obtienen directamente de las cuentas bancarias de los usuarios.
En definitiva, estos datos son representativos de la situación financiera de los solicitantes de préstamos. Son una base perfecta para construir un modelo de datos que pueda reproducirse a nivel internacional.
El Open Banking, lejos de ser un nicho, está cambiando profundamente la forma de conceder créditos. En Algoan, hemos optado por trabajar con varios agregadores, que se conectan directamente a las API bancarias para recopilar los datos. Así, no necesitamos desarrollar nuestros propios conectores; nos podemos concentrar en el desarrollo de nuestra API de Credit Scoring».
El Open Banking es un cambio del paradigma para las vías de crédito y abre posibilidades para desarrollar productos escalables a nivel internacional.
¿Cómo escalar un producto basado en los datos?
Los datos obtenidos por Open Banking son un poderoso recurso. Pero aún hay que crear los modelos de datos que puedan utilizarlo para un buen escalado de datos.
«Desde el principio supimos que queríamos proponer un producto mundial. Esto es importante porque esa idea se ha integrado de forma nativa en la creación de nuestros modelos de datos: cómo se recopilan, cómo se procesan, etc.»
Este es el método que hemos adoptado en Algoan:
Paso 1→diseñar las funciones:
El objetivo de esta primera fase es inventariar las funciones necesarias para saber qué datos hay que recopilar. En nuestro caso, ya conocíamos los diferentes pasos que conducen a la concesión del crédito. Por lo tanto, revisamos cada paso de la decisión crediticia para decidir qué variables son las más relevantes. Estas variables son las que permitirán establecer el perfil bancario preciso de los consumidores (ingresos, volatilidad del gasto, uso del descubierto bancario, incidencias…).
Paso 2→crear el esqueleto del algoritmo genérico:
El objetivo es construir un esqueleto que se adapte a todos los contextos, lo que es administrable para los datos bancarios. Una vez definida esta arquitectura, el trabajo principal se centra en los datos, la estrategia de su recopilación y etiquetado. Con los datos de Open Banking, el procesamiento previo es similar en todos los países (limpieza y simplificación de los datos para inyectarlos en los algoritmos).
Después, hay que entrenar a los algoritmos, que aprenden gracias a las etiquetas que se les han proporcionado. Su objetivo es adivinar por sí solos estas etiquetas en los datos futuros.
Paso 3→ personalizar el producto con datos específicos:
Una vez creada la capa básica y universal, podemos examinar los datos más específicos en el contexto de cada país (costumbres, hábitos sociales, estilo de vida, etc.) y establecer una estrategia de etiquetado complementaria.
«Para el escalado de un producto basado en datos, es casi ineludible tener una visión internacional desde el principio. Eso permite ganar un tiempo precioso, ya que los algoritmos fueron diseñados para ello. Hay que pensar, desde el principio, en lo universal, que será una base duplicable para todos los países, y después añadir una capa de especialización para responder con precisión al contexto local».
La buena noticia es que, en el mundo de los datos, las mejoras son constantes. Los algoritmos se están mejorando de forma permanente. Cuantos más datos haya, mejor se hará y cuanto mejor se haga, más datos habrá. Este círculo virtuoso solo es posible si se aplican las estrategias adecuadas de recopilación, además del escalado, de datos.
En el mundo del crédito, esto es ahora más fácil gracias al Open Banking. Son unos cimientos sólidos para la propuesta de valor desarrollada por Algoan: mejorar el acceso al crédito. Con los datos de Open Banking, podemos ofrecer un producto que funciona mejor y que funciona en todas partes.