Comment Algoan industrialise les modèles de risque de crédit fondés sur l’Open Banking grâce aux Large Language Models

Du chaos transactionnel à l’insight structuré
Chez Algoan, nous avons passé ces dernières années à développer des outils de pointe pour aider les prêteurs à prendre des décisions plus intelligentes et équitables, en s’appuyant sur les données d’Open Banking (c’est-à-dire les données de transactions bancaires partagées avec le consentement du demandeur de crédit).
L’un de nos produits phares, Credit Insights, transforme les données brutes des transactions bancaires en indicateurs de risque exploitables : estimation des revenus, évaluation de la capacité financière, détection d’incidents sur les comptes, etc. En catégorisant automatiquement les revenus, dépenses, charges de crédit et comportements financiers, Credit Insights offre aux prêteurs une vue actualisée et extrêmement détaillée de la situation financière d’un emprunteur, leur permettant ainsi d’évaluer sa capacité de remboursement, de détecter des signaux précoces de stress financier et de disposer d’une image plus précise et en temps réel de sa solvabilité.
À mesure que l’Open Banking transforme l’industrie du crédit, l’accès aux données brutes n’est plus le principal obstacle. Le véritable défi aujourd’hui réside dans l’interprétation de ces données. Ce n’est pas une tâche triviale : les transactions bancaires ne sont pas conçues pour un traitement automatique. Les libellés sont souvent tronqués, incohérents, remplis d’abréviations, de fautes de frappe ou de conventions propres aux banques. Le même commerçant ou type de paiement peut apparaître sous des dizaines de libellés différents. Deux transactions similaires en apparence peuvent en réalité refléter des comportements financiers très différents selon leur contexte. Qui plus est, chaque pays, banque et segment de clientèle présente ses propres particularités. Extraire des caractéristiques cohérentes et de haute qualité à partir de ces données brutes désordonnées est l’un des plus grands défis pour construire des systèmes de décision de crédit robustes et fiables.
Depuis des années, notre objectif est de construire des modèles de catégorisation précis, scalables, nuancés, capables de s’adapter aux marchés et d’apprendre rapidement de nouvelles données, tout en restant économes en ressources. C’est là que les Large Language Models (LLMs) entrent en jeu.
L’amélioration continue sans explosion des ressources
Pour la catégorisation des transactions, nous n’utilisons pas les LLMs directement en production. Bien qu’ils soient flexibles, ils sont coûteux à servir à grande échelle et introduisent de la variabilité dans les résultats. Nos modèles de production restent donc supervisés et spécialement conçus pour les données transactionnelles. Cela nous garantit un contrôle total sur les coûts, la stabilité des résultats et l’explicabilité – éléments essentiels pour la conformité réglementaire et la prise de décision en matière de crédit.
Ces modèles spécialisés offrent une excellente précision sur les catégories clés que nous suivons, ce qui est indispensable pour instaurer la confiance avec les prêteurs et les régulateurs.
Néanmoins, nos algorithmes ont besoin de données annotées pour l'entraînement et le suivi. Et produire des annotations de qualité reste un goulot d’étranglement majeur quand on travaille avec des données transactionnelles bruyantes. L’annotation de transactions financières est à la fois très chronophage et sujette à interprétation. C’est là que les LLMs interviennent : nous les utilisons pour annoter les transactions.

Les LLMs nous permettent de passer à l’échelle sans augmenter linéairement la taille de notre équipe. Notre processus d’annotation repose désormais sur plusieurs étapes combinées :
- Étiquetage automatique via des règles de détection de patterns : surtout utile pour les premiers modèles. Quand les modèles deviennent matures, ces patterns sont peu utilisés (réservés aux nouvelles banques ou conventions).
- Annotation automatique par LLMs verticalisés sur les données transactionnelles, en incluant de la génération augmentée par récupération (RAG), particulièrement pour le vocabulaire rare ou les petites structures qu'on retrouve dans les transactions. Les annotations ne sont acceptées que si la confiance du LLM dépasse un seuil élevé.
- Retour des clients.
- Intervention humaine sur un volume bien plus faible qu’auparavant grâce aux LLMs : nous avons divisé par 3 le volume d’annotations manuelles.
En bout de chaîne, des techniques de clustering conçues pour les données transactionnelles sont utilisées, regroupant les transactions par similarité de libellé, montant et date, afin de détecter des groupes homogènes. Ces clusters permettent d’ identifier les incohérences entre annotations humaines et automatiques. Des mécanismes de consensus ou des relectures humaines valident ensuite les cas litigieux résiduels.
Nous disposons désormais d’un pipeline semi-automatisé et auto-correctif, où les humains valident les cas limites pendant que les machines traitent le gros du flux. Les LLMs accélèrent notre annotation des données, mais les modèles finaux restent optimisés pour la précision, la cohérence et l’auditabilité.
Ce pipeline nous permet de garantir un apprentissage continu à partir de nouvelles données. Nous ne nous contentons pas de livrer un modèle : nous le surveillons, le réentraînons et l’adaptons. Grâce à ces pipelines enrichis par les LLMs, nous détectons mieux les anomalies et expliquons mieux les prédictions. Par exemple, un écart significatif entre un LLM et notre modèle de production déclenche une revue, ce qui nous permet de repérer les dérives plus tôt et d’éviter une dégradation des performances.
Les LLMs ne remplacent pas nos modèles, ils amplifient notre capacité à les construire. En combinant automatisation intelligente et expertise humaine, nous scalons plus vite, améliorons la qualité, tout en gardant le contrôle.
Camille Charreaux, Head of Data Science chez Algoan.
Ça peut aussi vous intéresser
Un projet ? Une question ?
Vous souhaitez changer votre manière de prendre vos décisions de crédit ? Discutons-en !
