Internacionalización: ¿cómo escalar su modelo de datos?

Internacionalización: ¿cómo escalar su modelo de datos?

Imagínese una empresa que concede préstamos en Francia, pero que ahora quiere expandirse a otros países, sobre todo en Europa. De lo que se da cuenta inmediatamente es de que no es tan sencillo. Incluso dentro de la Unión Europea, los contextos varían mucho. La empresa puede llevarse una sorpresa desagradable y tener que reconstruir su modelo de puntuación desde cero.

Lejos de ser hipotética, esta situación era habitual hasta hace poco. Diseñar un modelo de datos aplicable a todos los países es complicado, pero no imposible. Sobre todo ahora que se dispone de un poderoso recurso: los datos de Open Banking.

En Algoan, hemos estado trabajando desde el primer día para construir un modelo de Credit Scoring basado en API, escalable internacionalmente, basado en estos datos de Open Banking. ¿Cómo lo hemos hecho? Camille Charreaux, nuestra Responsable de Ciencia de Datos, levanta el telón de nuestras elecciones de datos para crear un producto apto para todas las geografías, sin ser una fábrica de gas.

Datos accesibles pero dispares

¿Recuerdas la última vez que solicitaste un crédito? Si fue hace más de 5 años, probablemente tenía este aspecto:

"Tradicionalmente, en Francia, las entidades de crédito piden a los consumidores que solicitan un préstamo que rellenen un formulario en línea. Tienen que responder a entre 10 y 20 preguntas, declarando su situación familiar, ingresos, gastos, otros préstamos pendientes, etc.".

Y si ha contactado con varios bancos o entidades de crédito, sabrá que los cuestionarios varían de unos a otros... al igual que las decisiones de concesión de crédito. (¡Imagínese entre distintos países!)

Este enfoque no está exento de problemas:

  • Los datos son declarativos. Esto significa que puede haber errores, omisiones y descuidos. Suele haber discrepancias entre los ingresos, que se sobrestiman, y los gastos, que se infravaloran. También existe la tendencia a no declarar otros préstamos pendientes para optimizar sus posibilidades.
  • Los datos no son financieros. Al menos no exclusivamente: gran parte son datos demográficos y socioprofesionales (edad, situación familiar, categoría laboral, etc.). Pero cuando se trata de saber si alguien va a poder devolver su préstamo, los datos financieros son los más fiables.

Ya sea por la recogida de datos o por la naturaleza de los mismos, este modelo de calificación crediticia no es óptimo. A esto se añade una capa adicional de complejidad: diferentes sistemas en diferentes países, con la presencia de agencias de crédito.

"Se trata de un planteamiento que no conocemos en Francia, pero que es habitual en muchos países. Las oficinas de crédito son agencias que recopilan información sobre el crédito que tienen los consumidores. Proporcionan esta información a las entidades de crédito, que así tienen una visión global de la situación de un ciudadano.

Los datos ya no son puramente declarativos, lo que resuelve parte del problema. Sin embargo, están surgiendo otros:

  • Los datos recogidos varían de un país a otro, incluso con agencias de crédito que operan en varios países.
  • Dependiendo del país, no todos los préstamos se registran en las agencias de crédito, lo que crea disparidades.
  • Los datos recogidos no son tan granulares como los datos bancarios.
  • Sólo se incluyen en las bases de datos las personas que ya han solicitado un préstamo. Puede resultar difícil obtener una puntuación crediticia -y, por tanto, acceso al crédito- para una solicitud inicial. En Estados Unidos, por ejemplo, es difícil obtener un préstamo sin una puntuación FICO.

Incluso cuando las entidades de crédito utilizan agencias de crédito, tienen que adaptar sus modelos de puntuación en función de los datos recopilados por cada una de ellas.

La buena noticia es que esto ha ido cambiando en los últimos años.

  • En primer lugar, con la aparición en la década de 2010 de agregadores que recopilan datos bancarios de los consumidores. Mediante el web scraping, este método consiste en recopilar datos financieros para evaluar el potencial de una persona para reembolsar su crédito.
  • Este enfoque carecía de seguridad hasta que en 2019 entró en vigor la PSD2, la segunda directiva europea sobre pagos. Esta directiva asegura el acceso a los datos bancarios exigiendo a los bancos que establezcan API seguras con mecanismos de autenticación estrictos. Es lo que se conoce como "Open Banking". Esto ha permitido a los agregadores desarrollar conexiones seguras y fiables, proporcionando datos bancarios universales y granulares.

Estos datos de Open Banking crean una base sólida para construir modelos internacionales escalables .

Banca abierta: una oportunidad innegable para el tratamiento de datos

¿Por qué la banca abierta está cambiando radicalmente la forma de procesar los datos?

"Los datos de Open Banking se presentan en formatos bien conocidos en el mundo de la ciencia de datos. Son numéricos (importes de las transacciones) y textuales. Tenemos experiencia en los tipos de modelos y arquitecturas que funcionan con estas categorías de datos.

Su propia naturaleza resuelve muchos de los problemas que plantea la calificación crediticia tradicional:

  • Siempre son los mismos datos, en un formato similar.
  • La fuente de datos es única y a prueba de manipulaciones. Ya no es declarativa: los datos se obtienen directamente de las cuentas bancarias de los usuarios.

En resumen, estos datos son representativos de la situación financiera de las personas que solicitan un préstamo. Son una base perfecta para construir un modelo de datos que pueda reproducirse a escala internacional.

"La banca abierta, lejos de ser un nicho, está cambiando profundamente la forma de conceder créditos. En Algoan, hemos optado por trabajar con varios agregadores, que se conectan directamente a las API bancarias para recopilar los datos. De este modo, evitamos desarrollar nuestros propios conectores. Nos concentramos en el desarrollo de nuestra API de calificación crediticia.

La banca abierta representa un cambio de paradigma para la gestión del crédito y abre la posibilidad de desarrollar productos escalables a escala internacional.

¿Cómo se amplía un producto basado en datos?

Los datos de banca abierta son un poderoso recurso. El siguiente paso es construir modelos de datos que puedan escalarse basándose en ellos.

"Desde el primer día supimos que queríamos ofrecer un producto global. Esto es importante porque se integró de forma nativa en la construcción de nuestros modelos de datos: la forma en que los recopilamos, la forma en que los procesamos, etc.".

Este es el método que hemos adoptado en Algoan:

Tiempo 0 diseñar las funcionalidades:

El objetivo de esta primera fase es hacer un inventario de las funcionalidades que se necesitan, para saber qué datos hay que recopilar. En nuestro caso, conocíamos las distintas etapas que conducen a la concesión de un crédito. Por lo tanto, revisamos cada etapa de la decisión de crédito para decidir cuáles son las variables más pertinentes que debemos seleccionar. Éstas son las variables que nos permiten establecer el perfil bancario preciso de los consumidores (ingresos, volatilidad del gasto, utilización del descubierto bancario, incidencias, etc.).

Paso 1→ Construir el esqueleto del algoritmo genérico:

El objetivo es construir un esqueleto adaptado a todos los contextos. Esto es manejable para los datos bancarios. Una vez definida esta arquitectura, el grueso del trabajo se realiza sobre los datos y su estrategia de recogida y etiquetado. Con los datos de Open Banking, el tratamiento previo es similar en todos los países (limpieza y simplificación de los datos que se inyectarán en los algoritmos).

Los algoritmos tienen que ser entrenados, aprendiendo de las etiquetas que se les dan. Su objetivo es adivinar estas etiquetas por sí mismos en datos futuros.

Paso 2→ Personalizar el producto con datos específicos:

Una vez construida la capa básica y universal, podemos examinar los datos más específicos del contexto de cada país (costumbres, hábitos sociales, estilo de vida, etc.) y poner en marcha una estrategia complementaria de etiquetado.

"Para ampliar un producto basado en datos, es casi esencial tener una visión internacional desde el principio. Ahorra un tiempo precioso más adelante, porque los algoritmos se han diseñado para ello. Así que primero hay que pensar en lo universal, que será una base duplicable para todos los países, y luego añadir una capa de especialización, para responder con precisión al contexto local".

La buena noticia es que, en datos, la mejora es continua. Los algoritmos se perfeccionan constantemente. Cuantos más datos tenemos, mejor lo hacemos. Cuanto mejor lo hacemos, más datos tenemos. Este círculo virtuoso sólo es posible si se han puesto en marcha las estrategias adecuadas de recopilación y escalado de datos.

En crédito, esto es más fácil gracias a Open Banking. Es una base sólida para toda la propuesta de valor desarrollada por Algoan: mejorar el acceso al crédito. Gracias a los datos de Open Banking, podemos ofrecer un producto que funciona mejor y que funciona en todas partes.

¿Tiene un proyecto? ¿Tiene alguna pregunta?

¿Desea cambiar la forma en que toma sus decisiones de crédito? ¡Hablemos de ello!'