Introduction
Dans le sillage de la transformation Digitale, l’Internet of Things (IoT ou Internet des Objets) constitue une nouvelle source de données pour le Big Data. Les estimations prévoient un nombre d’objets connectés en très forte augmentation pouvant atteindre 200 Mlliards d’ici à 2020 en incluant voitures, vêtements, montres, logements, …
De par la valeur des données générées par ces objets, les promesses de l’IoT pour les entreprises sont immenses : nos clients, encore frileux il y a quelques années mettent de plus en plus en avant des services connectés pour se démarquer de la concurrence (exemple du service Pay as you Drive vendu par AXA, ou du service de supervision de la consommation énergétique proposé par Sowee).
Exploiter les données du véhicule connecté : une manne d’opportunité pour les acteurs de la mobilité
L’industrie automobile et son écosystème ont eux-aussi pris conscience des différentes sources de revenus qui émanent de la collecte, du traitement, de l’utilisation et de la restitution organisée des données de leurs véhicules. Ces données vont permettre aux entreprises du secteur de créer de la valeur, autant pour elles-mêmes que pour leurs clients. Plusieurs leviers de création de valeur peuvent être identifiés, avec des gains financiers à plus ou moins long terme, impactant ainsi largement le business model du secteur.
Le premier levier est l’utilisation des données du véhicule afin de délivrer des services in-car et des services de mobilité. Les constructeurs ont en effet pour enjeux de redéfinir leur stratégie commerciale en vendant des packages de services connectés inclus dans la vente du véhicule ou en option via un e-store.
Ils pourront ainsi développer de nouveaux services de mobilité comme l’autopartage ou la location de véhicules entre particuliers pour rivaliser avec la concurrence du secteur.
Au-delà de ces services qui peuvent être délivrés directement au consommateur final, les données récoltées peuvent créer de la valeur, réduire les coûts et améliorer la sécurité dans de nombreux autres cas d’usages (exemple : amélioration et création de nouveaux produits, maintenance prédictive sur les véhicules, mise à disposition des données à tiers partenaires).
La mise en œuvre de ces nouveaux services requiert de continuer les efforts réalisés pour le déploiement des chaines de traitements de la donnée IoT (cf. schéma de la chaine de valeur ci-dessous) :
Si le sujet de l’IoT en entreprise est encore récent, celui du Big Data – et plus généralement de l’exploitation des données – s’est largement imposé. Les Grands Comptes ont pour la plupart déjà fait mûrir leurs réflexions sur cette question : de nombreuses chaines de traitements des données ont été déployées sur de nouveaux socles de production, générant ainsi de la valeur pour le business.
Et pour l’IoT, quoi de nouveau pour en extraire son potentiel ? Peut-on transposer une « démarche Big Data » pour construire une chaine de valorisation des données de l’IoT ? Comment bâtir un socle de traitement de ces données en capitalisant sur les efforts déjà consentis par certains pour la mise en œuvre de « Datahub » ?
I) Les Entreprises profiteront de leur Datahub pour tirer la valeur des objets connectés
Avec l’émergence du Big Data depuis le début des années 2010, les chaines classiques de traitement des données en entreprise (issues du monde de la BI) ont évolué et de nouveaux socles – communément appelés Datahub – se sont créés afin de servir une multitude de nouveaux cas d’usage :
- Usages exploratoires type Datalab aussi appelé Data Discovery à destination de populations data scientists
- Analyses de données avancées basées sur des capacités décisionnelles plus poussées tendant vers le prédictif
- Création de nouveaux services par l’usage de nouvelles données valorisées et exposées par les API de ces nouveaux socles
Ces Datahub combinent usuellement des fonctions de stockage ainsi que des moteurs de calculs avancés. Ils sont alimentés par les données internes de l’entreprise (données des applications métiers, des référentiels, …), mais également par les données externes (données du web, données des partenaires ou encore des données IoT). Le Datalake (lac de données) constitue un des cœurs de ces nouveaux socles de traitement. Il collecte les données des différentes sources, indépendamment de leur format ou de leur usage, favorisant ainsi le croisement des informations.
Les données récoltées peuvent soit alimenter une chaine “chaude”, favorisant le traitement instantané des données avant même leur stockage, soit une chaine “froide” via laquelle un historique de données multi-sources sera constitué puis traité ultérieurement selon les cas d’usage.
Le principal enjeu du Datahub est ainsi de centraliser et mettre à disposition les données en variant leurs modes d’exposition et de proposer des services de traitements, afin de favoriser l’émergence des nouveaux cas d’usage cités ci-dessus.
II) Comment tirer parti de son Datahub pour construire une chaine de valorisation de la donnée IoT ?
Le Datahub, s’il est déjà présent dans le SI de l’entreprise, se prête bien à soutenir la construction d’une chaine de traitement des données : les nombreuses fonctions de stockage et de traitement du Datahub peuvent se révéler être de véritables accélérateurs pour construire une telle chaine de traitement.
Par ailleurs, le Datahub présente l’avantage d’exposer de nombreuses données tierces, qui, une fois croisées aux données IoT, peut permettre de les enrichir et de les valoriser pour servir des cas d’usage innovants.
Les patterns d’architecture Big Data apportés par le Datahub autorisent à imaginer plusieurs scénarios d’intégration de la chaine de traitement IoT :
- Le Datalake peut être alimenté pour constituer un historique large de données brutes des données IoT : ce gisement de données peut servir à être croisée avec d’autres données dans une démarche de Data Discovery
- Les moteurs d’analyses avancées permettent de construire des espaces de données valorisées, structurées et prêtes à l’emploi dans des Datawarehouse, qui serviront les nouveaux usages
L’exemple d’un service connecté de plan d’entretien sur mesure du véhicule.
Le véhicule connecté remonte des informations de conduite (1) telles que : les accélérations, le nombre de kilomètres parcourus, la vitesse, les freinages brusques, etc. La seule analyse de ces données IoT ne suffit pas pour définir un plan d’entretien complet.
Pour l’agrémenter, il est nécessaire d’exploiter (2) :
- Des informations du référentiel véhicule pour connaitre la longévité des pièces en fonction d’un profil de conduite donné,
- Des informations clients sur l’historique des entretiens techniques (changement de pièce par exemple) réalisés en concession,
- Des informations clients sur ses adresses principales (domicile, travail) et ses canaux de communication privilégiés,
- Et enfin des informations sur les garages affiliés et leur stock de pièces.
La cohabitation de ces différentes sources de données permet d’appliquer régulièrement des algorithmes exploratoires de maintenance prédictive sur les données froides du Data Lake.
Dès réception d’une donnée chaude IoT confirmant le pattern de future casse matérielle (3), le plan de maintenance personnalisé sera envoyé au client sur son canal préféré (appel téléphonique, réseau sociaux, notification mobile) (4).
Quelques points d’attention sur la conception d’une telle architecture sont à retenir. En effet, le Datahub n’embarque pas nativement certaines fonctions propres à l’IoT. Il est alors nécessaire de compléter le Datahub des briques afférentes à :
- La connectivité des protocoles de communication IoT avec le SI de l’entreprise
- D’éventuels prétraitements techniques à réaliser sur les messages IoT (décodage de trames, etc.)
- La gestion des flottes et les flux de communication vers les objets (dans le cas de communications descendantes pour par exemple, les mises à jour logicielle des objets)
Cette architecture présente l’avantage de capitaliser sur les efforts réalisés pour la conception du Datahub et de déployer une chaine de traitement cohérente et sur mesure pour répondre aux besoins IoT. La mise en œuvre d’un tel socle peut néanmoins se révéler complexe. Plusieurs solutions sont envisageables, dont :
- La construction on-premise en combinant plusieurs solutions du marché (par exemple, un socle Hadoop pour le Datahub et une solution pure-player IoT en n’utilisant que les services de collecte et de gestion des objets)
- La construction en se basant sur les géants du Cloud (AWS, Azure, …) en composant avec les différents services managés pour mettre en œuvre un tel socle. Les très grands acteurs du Cloud arrivent aujourd’hui à un niveau avancé de conciliation des technologies « IoT » et « Big Data ».
III) Et si je n’ai pas de Datahub ?
Pas de panique, le Datahub ne constitue pas pour autant un prérequis pour construire une chaine de traitement IoT : il est tout à fait envisageable d’engager une telle démarche « from scratch », en s’appuyant notamment sur certains acteurs pure player du marché.
Il est notamment possible de se passer d’une infrastructure Datahub :
- Si le cas d’usage de valorisation des données IoT ne requiert pas de données issues d’autres sources
- Si les traitements de ces données ne requièrent pas un moteur de calcul distribué spécifique, nativement apporté par le Datahub
De tels chaines de traitements peuvent être déployées via des solutions de plateforme IoT éditées par certains acteurs pure player (comme Xively, Docapost, ThingWorx, etc.) et les grands noms du Cloud (Microsoft, Amazon, etc.). Ces plateformes IoT proposent des fonctions permettant de répondre à l’ensemble de la chaine de valorisation des données des objets connectés : connectivité avec les réseaux de transmission LPWAN, collecte, stockage, traitement et exposition des données IoT, administration des objets.
Ces plateformes ne sont pas spécifiques à un cas d’usage ou a un secteur d’activité en particulier. Un paramétrage de ces dernières est nécessaire pour répondre à des enjeux métiers précis.
Ce type de solution se révèle idéal pour réaliser des prototypes ou des expérimentations. Dans certains contextes (cas d’usage nécessitant une remontée seule des données IoT), ce pattern permet également une mise en production rapide d’une chaine de traitement sans investir lourdement dans des infrastructures spécifiques.
Conclusion
La valorisation des données issues de l’IoT est totalement compatible avec la démarche et les outils Big Data comme le montre le pattern d’intégration avec le Datahub. Pour autant, l’industrialisation de l’IoT (déploiement et gestion des flottes, contractualisation avec les fournisseurs de réseaux LPWAN pour assurer la connectivité, gestion des mises à jour logicielles à distance, etc.) demeure un sujet à part entière et capital sur lequel il est nécessaire d’investir de manière décorrélée d’une approche Big Data pour faire atterrir les cas d’usage.
On constate cependant en entreprise des filières distinctes « IoT » et « Big Data » pour traiter chacun de ces projets : il devient primordial que ces dernières se réorganisent afin de concilier les deux approches. La chaine de traitement de la donnée IoT doit être considérée dans son ensemble, de l’objet “communiquant” jusqu’au service mis à disposition et consommé par le client (et donc en principe, via les services dits Big Data). Ainsi, le sujet n’est pas seulement de surmonter les complexités technologiques pour unifier les solutions de traitement mais bien de fusionner les initiatives et les compétences au sein des programmes et des organisations.