La décision d'accorder un crédit est en train d'être transformée par la notation de crédit pilotée par l'IA. Cela pourrait changer la vie des emprunteurs à dossier léger et de ceux qui sont dans l'informelLa décision d'accorder un crédit est en train d'être transformée par la notation de crédit pilotée par l'IA. Cela pourrait changer la vie des emprunteurs à dossier léger et de ceux qui sont dans l'informel

Scoring de Crédit Alimenté par l'IA pour les Dossiers Légers et l'Économie Informelle

L'un des aspects les plus conservateurs de la finance, la décision d'accorder un crédit à quelqu'un, est transformé par la notation de crédit pilotée par l'IA. Il s'agit d'un changement progressif pour les personnes dont l'historique de crédit est riche et qui sont avec les banques depuis longtemps. Cela pourrait cependant changer la vie des emprunteurs à dossier léger et de ceux qui appartiennent à l'économie informelle. Ils peuvent enfin être détectés au lieu d'être invisibles pour le système. Cet article traite de l'application de données alternatives pour créer des scores de crédit basés sur l'IA pour les particuliers et les petites entreprises qui n'ont pas d'antécédents de crédit traditionnels, du risque d'injustice et de biais lorsque les données des bureaux ne sont pas disponibles, et de l'impulsion réglementaire visant à créer une IA explicable dans la souscription des populations sous-bancarisées.

Problème du dossier léger et de l'économie informelle

Les notations de crédit conventionnelles présupposent une certaine existence financière. Elles supposent qu'un individu dispose d'un compte bancaire, de produits financiers formels, et qu'il a emprunté un prêt ou utilisé une carte de crédit auparavant. Elles présupposent que les employeurs gèrent les salaires de manière formelle et que les commerçants travaillent dans la partie visible de l'économie — la partie documentée. Pratiquement, une proportion colossale du monde n'est pas ainsi. Les jeunes adultes n'ont souvent ni prêts ni cartes. Les migrants peuvent posséder de bons antécédents de crédit dans leur pays d'origine et rien dans leur nouveau pays. La plupart de leurs transactions se font en espèces ou sur des plateformes numériques qui ne font pas de rapport aux bureaux : travailleurs à la demande, vendeurs de rue, commerçants informels et un grand nombre de micro-entrepreneurs. Là où il existe des bureaux, même leur couverture peut être superficielle ou biaisée en faveur des populations urbaines formellement employées. Le dossier de bureau de ces demandeurs apparaît vide ou presque vide aux prêteurs. Comme les équipes de risque sont formées pour faire confiance aux données des bureaux, elles font des erreurs par prudence. Le résultat est prévisible : augmentation des rejets, réduction des limites, augmentation des prix ou exclusion totale.

Ces emprunteurs ne sont pas nécessairement plus risqués ; c'est juste que le système est sourd et aveugle aux signaux qui caractérisent réellement leur vie financière. Le concept de base de l'application de l'IA à la notation de crédit ici est simple. Là où les statistiques des bureaux font défaut ou sont trop rares, cherchez ailleurs. Il existe de nombreuses empreintes numériques dans la vie moderne. Lorsque ces empreintes sont collectées de manière responsable avec consentement et converties en signaux plus organisés, elles peuvent en dire beaucoup sur la stabilité d'une personne, son potentiel de revenus et ses chances de rembourser. L'une des premières sources les plus précieuses est souvent les données de télécommunications. Les opérateurs mobiles comprennent comment quelqu'un recharge les soldes prépayés régulièrement, s'il utilise le même numéro pendant des années ou change fréquemment, s'il est régulier ou aléatoire dans son activité, et s'il acquiert des forfaits de données de la même taille. Un individu qui conserve un numéro au fil du temps, le recharge et présente des modèles d'utilisation cohérents est généralement plus profondément ancré dans une communauté et plus cohérent dans son comportement par rapport à quelqu'un qui abandonne ou oscille dans l'utilisation. La stabilité est associée à un risque de crédit réduit.

Une autre source de pouvoir est le commerce électronique et les données des plateformes numériques. Peu de choses peuvent être contenues dans le dossier de bureau d'un chauffeur de VTC, mais une plateforme peut accéder au nombre de trajets, aux revenus par semaine, aux données d'annulation, aux avis des clients et à la durée d'activité du chauffeur. Un micro-commerçant en tant que vendeur sur un marché laisse derrière lui un historique de commandes complétées, de remboursements effectués, de plaintes soulevées, de ruptures de stock et de modèles de croissance. Dans le cas des entreprises informelles, les données de plateforme peuvent être utilisées comme l'équivalent le plus proche des états financiers officiels. Ensuite, il y a le compte bancaire, le portefeuille numérique et les données de flux de trésorerie des API de banque ouverte. Bien qu'un emprunteur puisse manquer d'un long historique de crédit, il a également tendance à avoir un compte où le salaire, les revenus à la demande, les transferts de fonds ou les revenus d'entreprise sont déposés. Grâce à l'analyse des entrées et sorties basées sur le temps, les prêteurs peuvent estimer le revenu commun, sa variabilité, s'il dispose de réserves ou non, et quelle portion du revenu a déjà été allouée à des dépenses récurrentes comme le loyer, les services publics et les dettes existantes. Dans le cas de l'emprunteur sous-bancarisé, la souscription basée sur les flux de trésorerie est souvent plus fiable que la grille de notation traditionnelle, qui repose tellement sur les prêts passés. Une couche supplémentaire est fournie par les API de paie et d'emploi.

Dans les situations où les employeurs sont connectés à des services de paie, les prêteurs peuvent confirmer l'emploi, les revenus mensuels, la durée d'emploi et les changements de rémunération. Pour ceux qui ont plusieurs emplois à temps partiel, cette image composite sera beaucoup plus informative qu'une seule fiche de paie. Enfin, avec une utilisation appropriée, les données comportementales et au niveau de l'appareil peuvent être utilisées pour aider à la fois à l'estimation de la fraude et du risque. La durée pendant laquelle un individu a utilisé le même appareil, la régularité de ses emplacements de connexion, la façon dont il utilise l'application au fil des mois, ainsi que l'heure de la journée où il effectue généralement les transactions, peuvent fournir des indicateurs d'authenticité et de régularité. Ces signaux doivent être manipulés avec soin afin d'éviter la discrimination par procuration, bien qu'ils puissent être d'un soutien utile. Toutes ces sources sont liées par le fait qu'elles racontent la vie réelle d'une personne et comment elle vit, comment elle gagne et paie même quand il est clair qu'elle n'a jamais posé son doigt sur une carte de crédit de sa vie.

\

Comment l'IA transforme des signaux désordonnés en score ?

Ces autres sources de données sont densément peuplées et non structurées. La structure des journaux de télécommunications, des événements de plateforme, des transactions bancaires et de la télémétrie des appareils n'est pas celle d'un rapport de bureau traditionnel. Elles sont bruyantes, dimensionnelles et remplies de modèles d'idiosyncrasie. À ce stade, l'IA, en particulier l'apprentissage automatique moderne, est nécessaire. Le cycle de vie commun commence par l'agrégation de données. Les prêteurs ont accès à des partenaires de télécommunications, à des flux de banque ouverte, à des API de paie et à des partenaires de plateforme sous réserve des lois sur la protection des données et du consentement direct des clients.

Ils absorbent les données brutes dans des environnements sûrs et les normalisent. Les activités de recharge téléphonique, le crédit de portefeuille et les commandes de commerce électronique sont convertis en séries temporelles qui ont des formats réguliers. Les anomalies et les doublons inutiles sont éliminés et les valeurs manquantes sont traitées. À partir de cela, des caractéristiques sont construites par les data scientists. Ils créent des variables récapitulatives plutôt que de simplement alimenter toutes les transactions brutes dans un modèle : flux de trésorerie net mensuel moyen ; la part des mois où l'épargne est positive ; la plus longue période consécutive sans paiements aux créanciers ; les mois de sous-revenus ; croissance ou décroissance des revenus de plateforme ; variabilité des heures de travail ; permanence de l'emplacement semaine après semaine.

Ces attributs tentent de compresser la vie économique d'un individu en chiffres qui peuvent être digérés par le modèle. Les arbres de gradient boosting, les forêts aléatoires et les réseaux de neurones sont ensuite des algorithmes d'apprentissage automatique qui sont entraînés sur des données historiques où le résultat est déjà connu. Dans le cas de la notation de crédit, le résultat est généralement un défaut de l'emprunteur sur une période déterminée, disons six ou douze mois. Le modèle apprend à connaître les combinaisons de caractéristiques qui indiquent plus ou moins de risque. Des modèles trouvés parmi les souscripteurs humains n'auraient pas été identifiés par le discernement humain, comme des interactions mineures entre les volatilités des flux de trésorerie et la durée sur la plateforme. La validation est essentielle. Le modèle est appliqué à des données sur lesquelles il n'a pas été formé afin que sa performance soit réelle et non le résultat d'un surajustement.

Des mesures telles que l'AUC, le coefficient de Gini et les statistiques de Kolmogorov-Smirnov sont utilisées pour mesurer le pouvoir de discrimination, tandis que les graphiques de calibrage indiquent si les probabilités prédites sont identiques aux taux de défaut réels. En plus des chiffres principaux, les prêteurs doivent examiner les performances par segment : nouveaux emprunteurs par rapport aux emprunteurs expérimentés, diverses professions, régions et tranches de revenus. Lors du déploiement, le modèle notera ensuite les nouveaux demandeurs à la volée, et une réponse sera fournie en quelques secondes. Le processus ne peut pas s'arrêter là. Les statistiques changent avec le temps, les plateformes font évoluer leurs politiques et la macroéconomie évolue.

\

:::tip Cette histoire a été distribuée en tant que communiqué par Sanya Kapoor dans le cadre du Programme de blog d'affaires de HackerNoon.

:::

\

Opportunité de marché
Logo de null
Cours null(null)
--
----
USD
Graphique du prix de null (null) en temps réel
Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter service@support.mexc.com pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.