Le boom de l'intelligence artificielle
L’intelligence artificielle (IA) a désormais fait son entrée dans tous les secteurs d’activité. Si l’on en croit Forbes, 80% des entreprises investissent aujourd’hui dans l’IA avec dans le viseur des perspectives de gains considérables à réaliser au niveau de toutes les fonctions. Pour préserver leur positionnement face aux acteurs émergents, introduire l’intelligence artificielle dans les processus mais aussi dans les produits et offres proposées semble nécessaire. IBM estime avoir économisé près d’un milliard de dollars depuis 2011 en introduisant des algorithmes de Machine learning au niveau des ressources humaines pour trier les milliers de candidatures reçues tous les jours (Fortune).
Cet engouement des entreprises engendre un foisonnement d’expérimentations autour de cas d’usage d’IA. France Digitale a ainsi cartographié près de 450 startups travaillant sur l’intelligence artificielle en France, qui ont toutes réalisé des dizaines de POC (proof of concept) dans le cadre de partenariats avec les grandes entreprises de nombreux secteurs d’activités (industrie, agriculture, santé, finance, etc.).
Très peu de cas d’usage IA industrialisés
Un POC vise principalement à démontrer l’adéquation d’un besoin ou la faisabilité technique d’un concept, d’une idée. Un POC peut être poussé un cran plus loin, avec un POV (proof of value), afin de prouver ou mesurer quantitativement la valeur du produit en l’appliquant en condition réelle sur un périmètre limité. Aujourd’hui, de plus en plus d’entreprises parlent de cas d’usage « production ready » pour désigner leurs expérimentations, ce qui laisse entendre une réflexion en amont sur l’industrialisation potentielle du produit.
Dans le cadre de l’IA, si beaucoup de POC et de POV sont lancés dans les entreprises, bien peu arrivent au stade final de l’industrialisation dans les outils. Quels sont les problèmes les plus fréquemment rencontrés dans le cadre d’un passage à l’industrialisation d’un cas d’usage d’intelligence artificielle et quelles sont les pistes de solutions à envisager pour les éviter ?
La culture de l’échec : un frein à la bonne gestion des expérimentations dans l’entreprise
L’innovation passe forcément par des expérimentations. Cela est d’autant plus vrai pour l’IA qui peut être par nature exploratoire. Ceci implique donc des réussites et des échecs nécessaires de cas d’usages. Le contexte professionnel tend à ne pas valoriser ces types d’échecs, encore vécus comme quelque chose de négatif, alors qu’ils sont sources d’apprentissage. De fait, des biais font que les acteurs ont plus facilement tendance à sous-estimer les difficultés et à valider une expérimentation, plutôt qu’à assumer un échec.
Une culture est à instaurer pour faire prendre conscience qu’un cas d’usage qui « échoue » est en réalité très vertueux. Une pratique facile à mettre en œuvre est d’adapter le vocabulaire, ne plus parler « d’échec » mais plutôt « d’apprentissage » ou « d’enseignement ».
D’autre part, favoriser une approche portefeuille de cas d’usage permet de prendre du recul et de mieux accepter les tentatives non concluantes. En effet, dans un foisonnement parallèle de lancement de projets, certaines expérimentations seront réussies et aboutiront à une industrialisation qui génèrera des gains, tandis que d’autres ne le seront pas et permettrons de tirer des enseignements. Le pilotage de la performance des expérimentations peut se faire par le ratio du nombre de celles qui délivrent de la valeur et celles qui délivrent un enseignement Ce ratio n’est pas uniquement un indicateur de suivi, mais représente aussi une ambition et un choix délibéré d’orienter l’exploration vers une génération de gains ou de l’innovation, selon le choix des cas d’usage qu’on décide d’accompagner.
Le changement de vocabulaire peut avoir un impact profond sur la culture, et s’accompagne de bonnes pratiques méthodologiques pour évaluer au plus juste le résultat d’une expérimentation.
De bonnes pratiques pour favoriser l’industrialisation
Les exemples d’industrialisations réussies de cas d’usage IA, dans des environnements matures, nous permettent de lister un ensemble de bonnes pratiques pour réellement juger de la pertinence du cas d’usage et de maximiser les chances d’industrialisation en cas de valeur démontrée.
« L’algorithme avait une fiabilité de 70% alors on a lancé l’industrialisation »
La performance d’un algorithme d’IA se mesure souvent par le taux de fiabilité du résultat qu’il génère. Un algorithme produisant des résultats avec un taux de fiabilité s’élevant à 70% peut paraitre performant et ainsi pousser son auteur à déclarer l’expérimentation réussie et lancer l’industrialisation. Mais on parle de 70% de fiabilité par rapport à quoi ?
Pour comparer efficacement les résultats il faut avoir une référence. Sans celle-ci, il est difficile de juger objectivement les performances du POV. Ainsi, les recommandations d’un algorithme d’aide à la prise de décision doivent par exemple pouvoir être comparées aux recommandations faites par un humain à l’issue du processus existant : des recommandations plus souvent meilleures ou plus rapides impliqueraient une génération de gains. Réciproquement, un scoring de l’algorithme qui semble faible peut en pratique être suffisant pour dégager de la performance. Ainsi, le bon indicateur n’est pas le scoring de l’algorithme mais bien le calcul des gains dans un cas métier donné.
Une phase de « dual-run » est donc à privilégier quand cela est possible pour mesurer, en parallèle et dans les conditions réelles d’utilisation, la performance du processus existant ainsi que celle du nouveau processus renforcé par l’IA, pour vérifier la valeur créée et conduire un changement progressif pour les utilisateurs.
« Le POC a été validé. On lance l’industrialisation et le métier pourra s’en servir comme il l’entend ! »
On peut penser qu’un algorithme d’Intelligence artificielle, une fois industrialisé, sera automatiquement utilisé par les métiers et produira directement des résultats. Cela ne peut être le cas que si deux facteurs sont pris en compte. D’une part, le cas d’usage doit être conçu en amont avec les métiers et pensé dans les processus et outils de travail quotidiens auxquels il doit s’intégrer (geste répétitif, nécessité d’ouvrir une autre application, manipulation de données, etc.). D’autre part, la compréhension du fonctionnement de l’algorithme par les métiers est un facteur clé de son adhésion et de son usage. Ceci passe par des formations et un travail de pédagogie sur l’algorithme, permettant d’expliquer ses capacités mais surtout ses limites. Il convient d’éviter l’effet « boîte noire » car la maîtrise des algorithmes de data science et d’IA sera de plus en plus du ressort des métiers car directement lié aux nouvelles sources de valeur de l’entreprise.
« On va faire réaliser le POC IA par une startup, ça ira plus vite »
Une attention particulière doit être accordée à la sélection des données à partager dans le cadre de partenariats avec des acteurs externes. La constitution des algorithmes d’IA se fait de plus en plus à partir de bibliothèques déjà existantes. Ainsi, l’algorithme n’est pas toujours le principal élément différenciateur pour l’entreprise mais bel et bien les données. L’entreprise doit donc être vigilante afin de ne pas perdre la main sur sa « mine d’or ».
Il convient de définir en amont une stratégie industrielle décrivant les périmètres et la gouvernance des données souhaitées sur trois cas de figure : l’achat de solution, le partenariat ou développer la solution en interne. Des règles strictes de partage de données avec des acteurs externes dans le cadre de partenariats doivent être établies pour éviter la perte du contrôle de leur patrimoine d’information.
Au-delà de la sensibilité des données, le fait de partager des données avec un acteur externe nécessite de pouvoir partager rapidement les données (API, flux, etc.), et que ces données soient de qualité et au bon format. Le temps de récupération et de « nettoyage » des données est couramment sous-estimé, ce qui peut conduire à une perte de l’avantage de rapidité d’une startup ou à une mauvaise utilisation de celle-ci (qui passera son temps à nettoyer les données plutôt qu’à les valoriser).
« On a du mal à estimer les gains que génèrera notre algorithme mais cela s’affinera sûrement avec l’avancement de l’industrialisation »
Un projet d’intelligence artificielle, comme tout autre projet, doit s’inscrire dans la lignée des enjeux et ambitions de l’entreprise. Il doit aussi apporter de la valeur à l’entreprise qui se matérialise sous forme de gains financiers. Sans négliger les autres types de gains non chiffrables (sécurité, image, etc.), un projet n’affichant pas d’objectif clair ou de gains financiers court un risque fort de dépriorisation.
Dans le cas de l’IA, il est souvent difficile d’estimer les gains financiers qu’un cas d’usage pourra générer, en particulier s’il est exploratoire. Cependant, faire une étude exploratoire ne signifie pas « ne pas savoir ce qu’on cherche ». Il est alors d’autant plus important de décrire spécifiquement l’attendu, en mettant en avant les risques et identifier des gains (y compris financiers), quitte à poser des hypothèses. La définition d’un objectif clair, la mise en évidence de gains et la recherche de sponsor (un coté métier et un autre côté DSI) est la seule façon de sécuriser des ressources et le lancement du projet.
« La validation du POC s’est faite comme sur des roulettes, l’industrialisation se passera sans embûches »
En phase d’expérimentation, on réduit souvent la complexité du cas d’usage (périmètre et volume des données restreint, fonctionnalités principales, etc.).
Pour préparer le passage à l’industrialisation de la solution de manière pérenne, un certain nombre de contraintes techniques, doivent être prises en compte. Nous pouvons citer entre autres la capacité de stockage (volume de données, vitesse d’acquisition, type de chargement, structuration des données), l’infrastructure nécessaire au traitement des données (besoin d’accès aux données, fréquence de lecture et d’écriture de l’algorithme) ou encore la compatibilité de langages de programmation et de versions entre l’environnement de test et l’environnement de production. Enfin, la qualité des algorithmes dépendant beaucoup des données reçues en amont, le monitoring des algorithmes et les réentrainements sont nécessaires au risque de constater un « shift » du ROI voire de rendre l’algorithme totalement obsolète.
Afin d’anticiper au mieux ces contraintes techniques, il est indispensable d’intégrer les équipes de build et run au projet dès la phase de POC. Celles-ci seront à même d’identifier les limites du SI legacy et d’affiner, au fur et à mesure de l’avancée des travaux, les besoins en termes d’architecture et d’infrastructures SI pour garantir un planning et un budget réalistes et donc une juste évaluation de l’expérimentation.
Un temps de partage en fin d’expérimentation
En clôture d’une expérimentation, un retour d’expérience, prenant en compte la complexité d’industrialisation, doit être dressé. En cas de « No Go », pour que l’apprentissage puisse véritablement avoir lieu, il convient de prendre le temps d’analyser et de partager les enseignements, c’est un gain apporté à l’entreprise.