Skip to content Skip to footer

T’as pas de data? T’as pas d’IA. De l’importance de loguer ses lecteurs avant de vouloir calculer des probabilités d’abonnement…

Après avoir occupé des fonctions de Directeur Produit dans de grands groupes média, Olivier Martinez accompagne désormais les entreprises dans la recherche de solutions et la mise en œuvre d'outils d'IA et d'IA générative via sa structure 255hex.ai.

Olivier Martinez

L'intelligence artificielle a envahi nos conversations depuis la fin de l'année 2022. ChatGPT, ce phénomène fulgurant, donne des idées à chacun d'entre nous : « Et si on utilisait l'IA ? C'est certain, on va gagner quelque chose ! »

Stop, on se fixe ! De quoi parlons-nous ?

L'IA c'est l'ensemble des techniques et technologies qui ont pour but d'imiter les processus cognitifs humains. Un champ bien plus vaste que celui d'un chatbot conversationnel dopé. Et dans ce champ bien plus vaste, nous allons nous intéresser à l'apprentissage automatique, Machine Learning en anglais. Car c'est grâce au Machine Learning que nous allons apprendre et essayer d'anticiper des choses, par exemple les comportements de nos utilisateurs. L'apprentissage automatique est à la base du développement actuel de l'IA, y compris ChatGPT. C'est une notion si fondamentale qu' est synonyme d'IA dans l'esprit de beaucoup. On peut résumer le Machine Learning comme un ensemble d'algorithmes qui permet à un système d'apprendre et de s'améliorer automatiquement à partir de sa propre expérience, et cela sans être explicitement programmé pour. Un peu magique. 

L'intelligence a besoin de carburant : les datas

Mais pour fonctionner, ces algorithmes ont besoin de carburant. Ce carburant ce sont les données. Grâce à elles, les algorithmes d'apprentissage automatique identifient des tendances, des modèles et des relations. Et cela leur permet de prendre des décisions ou de réaliser des prédictions probabilistes. Oui, des probabilités.

Les données jouent donc un rôle plus que crucial dans la performance et l'efficacité de l'intelligence artificielle. Sans données, ces algorithmes seraient incapables d'apprendre, de prédire et d'adapter leur comportement.

Des données qui doivent être exploitables et pertinentes

Mais  « avoir des données » est-il suffisant ? Vous connaissez déjà la réponse, et elle ne vous fait pas plaisir.  Non, « avoir des données » n'est pas suffisant. Encore faut-il qu'elles soient disponibles, pertinentes, de qualité et exploitables.

Ça semble une évidence dit comme ça, mais la pertinence des données est en fonction des questions que vous voulez résoudre. Il faut se rappeler qu'avant même de choisir des données, il faut comprendre le problème à résoudre et déterminer les objectifs que vous souhaitez assigner à l'apprentissage automatique. Cela permet d'identifier les variables et les caractéristiques les plus pertinentes pour le problème.

Exemple d'application : probabilités d'abonnement d'un lecteur à une offre payante

Pour illustrer, prenons au hasard l'exemple d'un éditeur qui veut lancer son offre payante et se demande si son audience fidèle est prête à dépenser des euros pour un à son contenu. Le problème ici posé en ces termes est de prédire si un lecteur est susceptible d'accepter de payer un abonnement. Les objectifs assignés au Machine Learning pourraient être d'augmenter le taux de des offres d'abonnement, voire d'adapter les offres aux besoins des lecteurs.

Nous allons donc présélectionner des données qui paraissent pertinentes pour ce cas d'usage :

  • du lecteur avec le contenu : nombre d'articles lus, fréquence, partages ;
  • préférences de contenu du lecteur : rubriques les plus lues, auteurs favoris, sujets d'intérêt ;
  • données démographiques du lecteur : âge, sexe, lieu de résidence, profession, revenu estimé ;
  • temporalité : moment de la journée ou de la semaine où le lecteur consulte le plus souvent le contenu ;
  • etc.

Mais patatras ! Où donc trouver ces données ? Quoi, cet éditeur ne demande pas ses lecteurs de se loguer ? Non, il n'a pas d'offre d'abonnement pour le moment. Les seules données dont il dispose sont des données issues de ses outils Analytics. Autant dire que la qualité n'est probablement pas au rendez-vous. Et ce n'est pas avec de la poudre de perlimpinpin que ce problème peut être résolu…

Donc avant même de penser à utiliser de l'intelligence artificielle pour maximiser les taux d'abonnement et de conversion, il va falloir utiliser son intelligence – humaine – pour mettre en place un système d'identification (log-in) qui va permettre de recueillir des données saines et exploitables, dans le but de prédire certains comportements.

Bien entendu cet exemple est totalement caricatural et toute ressemblance serait fortuite… Depuis la sortie de ChatGPT, personne n'a jamais rencontré des professionnels cherchant à introduire de l'intelligence artificielle sans avoir les pré-requis !

Une fois les lecteurs logués, et la data récoltée et structurée, une myriade de cas d'usage

Pour ceux qui disposent déjà de données saines et exploitables, les cas d'usages sont multiples. Vous pouvez par exemple vous attaquer à votre taux d'attrition. Hanaa Gemayel Jabbour l'explique par exemple dans « Comment la data science et l'IA permettent de lutter contre le churn ».

Pour finir, nous en parlerons peut-être plus en détails dans d'autres chroniques à venir, quel que soit le projet utilisant du Machine Learning que vous entamez, n'oubliez pas deux choses :

  • Vous avez besoin de spécialistes des données, les fameux Scientist, en faire l'économie c'est chercher à foncer à grande vitesse dans un mur avec un 38 tonnes.
  • Deuxièmement, ne perdez pas de vue qu'un projet d'intelligence artificielle n'est jamais sûr d'arriver à un résultat exploitable dans le temps imparti, voire même jamais exploitable du tout. Cette probabilité est non nulle

La newsletter The Audiencers : de professionnels, à professionnels

Envoyée toutes les 2 semaines, avec dedans des conseils concrets et applicables, des voix d'experts et des benchmarks inspirants, pour vous aider à mieux engager, convertir et fidéliser vos audiences.