Les algorithmes de recommandation

« Derrière nos écrans de fumée” (“The Social Dilemma”), un documentaire sorti sur Netflix en 2020, lève le voile sur les stratégies mises en place par les géants du numérique pour capter, retenir et exploiter l’attention des utilisateurs. D’anciens ingénieurs de Google, Facebook ou Twitter y racontent comment les algorithmes, initialement conçus pour organiser l’information, sont devenus des outils de manipulation émotionnelle et comportementale omniprésents.

L’un des outils les plus puissants ? Les algorithmes de recommandation.

Internet, un monde saturé d’informations

Chaque minute…

500 heures de vidéos sont postées sur YouTube.

66 000 photos sont postées sur Instagram.

360 000 tweets sont postés sur X.

La quantité croissante de contenus a rendu les algorithmes de recommandation indispensables.

Qu’est-ce qu’un algorithme de recommandation ?

Avant de s’intéresser aux algorithmes de recommandation, commençons par définir ce qu’est un algorithme de manière générale.

Un algorithme est une suite d’instructions précises, organisées de manière logique, qui permet de résoudre un problème ou d’accomplir une tâche.
Une recette de cuisine est un algorithme. Prenons l’exemple de la préparation d’une omelette. Il s’agit d’une suite d’instructions précises à exécuter dans un ordre déterminé :

  • Casser 2 œufs dans un bol.
  • Ajouter une pincée de sel.
  • Battre les œufs avec une fourchette.
  • Faire chauffer une poêle avec un peu d’huile.
  • Verser les œufs battus dans la poêle.
  • Laisser cuire quelques minutes.
  • Plier l’omelette et la servir.

Cette séquence suit un ordre précis et transforme une situation de départ (des œufs crus) en un résultat attendu (une omelette prête à manger).

Mais alors, qu’est-ce qu’un algorithme de recommandation ?

C’est un système automatisé qui trie et hiérarchise les contenus dans le fil d’actualité d’un utilisateur afin de lui présenter ceux qui ont le plus de chances de retenir son attention.

Pour cela, l’algorithme de recommandation analyse en continu les comportements en ligne, tels que :

Les contenus visionnés

Les publications aimées, commentées ou partagées

Le temps passé sur certains types de contenus

Les recherches, les clics ou les achats effectués

À partir de ces données, il dresse un profil personnalisé des préférences de l’utilisateur, qu’il utilise pour proposer des contenus similaires, cohérents ou jugés pertinents. En résumé, l’algorithme de recommandation s’appuie sur les comportements, les interactions passées et les centres d’intérêt identifiés, afin de proposer un fil d’actualité sur mesure, censé être plus engageant, afin de fidéliser l’utilisateur.

Pour en savoir davantage sur le régime de fidélisation, cliquez ici.

Les algorithmes de recommandation sont conçus pour 2 choses :

  • Personnaliser l’expérience utilisateur (UX) et la rendre plus agréable en montrant à l’utilisateur du contenu qui sera plus susceptible de l’intéresser.
  • Maximiser le temps passé sur la plateforme, et collecter toujours plus de données personnelles.

Plus l’utilisateur interagit avec la plateforme, en likant, en partageant, en commentant ou simplement en scrollant, plus il fournit de données sur ses préférences, permettant à l’algorithme de devenir plus performant et de prédire avec une précision accrue ses goûts et ses comportements.

Résumé en 3 phase de ce qui a été décrit plus haut

Pour en savoir davantage sur le rôle des données, cliquez ici.

À vous de jouer ! 

Pour chaque affirmation, décidez si elle est vraie ou fausse. Vous découvrirez ensuite l’explication derrière chaque réponse pour mieux comprendre le principe des algorithmes.

Les algorithmes analysent le contenu des publications qu’ils recommandent.

FAUX

Ils n’analysent pas le sens réel du contenu, mais des signaux de surface (mots-clés, hashtags, temps de visionnage, réactions…).

Les plateformes utilisent les données des autres utilisateurs pour ajuster nos recommandations.

VRAI

Les algorithmes fonctionnent par mise en réseau des profils : si d’autres utilisateurs semblables à vous ont aimé un contenu, il vous sera proposé à votre tour. C’est le filtrage collaboratif.

Les recommandations algorithmiques ne concernent que les réseaux sociaux.

FAUX

C’est une logique économique globale qui ne se limitent pas qu’aux réseaux sociaux : sites de vente en ligne, sites de vidéos à la demande (Netflix), etc.

Aujourd’hui, tous les grands acteurs du numérique s’appuient sur des algorithmes de recommandation pour capter l’attention des utilisateurs. On les retrouve partout :

  • Sur les réseaux sociaux, qui recommandent des publications, des stories ou des amis à ajouter.
  • Sur les sites e-commerce comme Amazon ou Cdiscount, qui suggèrent certains produits en fonction des recherches ou des précédents achats de l’utilisateur.
  • Sur les sites d’information, qui mettent en avant certains articles plutôt que d’autres.
  • Sur les plateformes de voyage comme Booking ou Airbnb, qui adaptent leurs suggestions de destinations, d’activités ou d’hébergements aux préférences supposées de l’utilisateur.

Cependant, les algorithmes de recommandation diffèrent d’une plateforme à une autre : l’algorithme de Facebook est différent de celui de Tiktok par exemple.

Par ailleurs, une même plateforme peut mobiliser plusieurs algorithmes différents, selon le type de contenu à recommander. C’est le cas d’Instagram, qui utilise différents algorithmes pour personnaliser le fil d’actualité, les stories, l’onglet Explorer ou encore les Reels

Internet à ses début : un web neutre et chronologique

Internet n’est pas né avec les algorithmes et le filtrage d’information. À ses débuts, Internet proposait une expérience largement non personnalisée :

  • Les résultats de recherche étaient identiques pour tous, quel que soit l’utilisateur.
  • Les plateformes affichaient les contenus par ordre chronologique, sans tri algorithmique.

Ce mode de fonctionnement permettait une plus grande diversité d’opinions et d’informations accessibles à chacun, sans filtrage préalable.

Néanmoins, à cause de la quantité croissante de contenus, l’information devenait rapidement trop abondante, rendant difficile la navigation sans outils de tri. C’est dans ce contexte que les algorithmes de personnalisation se sont imposés comme une solution.

C’est en 2009 que Google annonce l’introduction de la recherche personnalisée pour l’ensemble de ses utilisateurs. Désormais, les résultats de recherche sont adaptés même pour les personnes non connectées à leur compte, en se basant notamment sur l’historique de navigation et la géolocalisation.
Cette décision marque un changement de paradigme dans la manière d’accéder à l’information en ligne : l’objectif est d’améliorer la pertinence des résultats pour chaque utilisateur.

Facebook introduit ses premiers algorithmes de tri de contenu en 2011, avec EdgeRank. Ce premier modèle attribuait un score à chaque publication en fonction de plusieurs critères, afin de déterminer si elle apparaîtra dans le fil d’un utilisateur.
Il a ensuite été remplacé par des modèles plus complexes et sophistiqués. 

Sur Youtube, 70% des contenus visionnés sont issus des recommandations algorithmiques, provenant de ce que « notre moteur de recommandation offre à vous » disait Neal Mohan, CPO de Youtube.
Cela signifie que la grande majorité du temps passé sur YouTube n’est pas le fruit de recherches actives, mais de suggestions générées par l’algorithme de recommandation.

Une base commune pour tous les systèmes algorithmiques

Comme nous l’avons déjà évoqué, les systèmes de recommandations algorithmiques diffèrent selon les plateformes. Ils reposent néanmoins sur deux piliers fondamentaux : 

  • l’intelligence artificielle (IA) et l’apprentissage automatique,
  • les « signaux de classement ».

Sur les plateformes numériques, l’IA permet d’analyser des volumes massifs de données issues des comportements des utilisateurs. Sans elle, il serait tout simplement impossible de générer des recommandations personnalisées pour des millions de personnes simultanément.

L’IA s’appuie sur des modèles statistiques pour prédire les contenus les plus susceptibles de susciter l’intérêt. En testant continuellement différentes combinaisons de contenus et en observant les réactions des utilisateurs, elle affine progressivement ses recommandations.
L’objectif reste inchangé : maximiser l’engagement en maintenant l’utilisateur actif le plus longtemps possible sur la plateforme.

À noter qu’en plus d’analyser les interactions passées d’un utilisateur pour prédire ce qui pourrait l’intéresser, l’intelligence artificielle prend également en compte le comportement d’utilisateurs au profil similaire. Ce procédé porte un nom : le filtrage collaboratif. Par exemple, si l’utilisateur A et l’utilisateur B ont tous deux aimé l’élément 1 et l’élément 2, et que l’utilisateur A a également aimé l’élément 3, le système recommandera l’élément 3 à l’utilisateur B.

Ces choix ne sont pas prédéfinis manuellement par un humain. Ils sont issus d’un apprentissage automatique (aussi appelé machine learning), basé sur l’analyse continue des comportements. Comme ces comportements évoluent en permanence, l’algorithme s’adapte en temps réel pour maintenir la pertinence de ses suggestions.

Ces comportements sont traduits en “signaux de classement” : des indicateurs utilisés par l’algorithme pour évaluer chaque contenu. C’est en fonction de ces signaux, comme le temps de consultation, la fréquence d’interaction ou les similarités avec d’autres contenus populaires, que l’algorithme décide de l’ordre d’apparition dans le fil d’actualité de chaque utilisateur.
Ce système crée ainsi une hiérarchie invisible des contenus, dictée non pas par des critères éditoriaux humains, mais par les comportements des utilisateurs.

Pour en savoir davantage sur ce sujet, cliquez ici.

L’algorithme de TikTok

TikTok se distingue nettement des autres plateformes. Là où Facebook ou Instagram privilégient généralement les contenus des comptes suivis, TikTok fait l’inverse : il mise tout sur la découverte de contenus nouveaux, issus de comptes que l’utilisateur ne suit pas, mais jugés pertinents.

Le fil Pour Toi (For You Page) est ainsi entièrement personnalisé, construit en fonction des comportements en ligne, et non des abonnements.

Alors que sur YouTube, ce sont plus de 70% des contenus visionnés qui sont issus de recommandations algorithmiques, chez TikTok, c’est la quasi-totalité.

Voici comment TikTok décrit lui-même sa fameuse “For You Page” :
« Un flux de vidéos adaptées à vos centres d’intérêt, facilitant la recherche de contenus et de créateurs que vous aimez… alimenté par un système de recommandation qui propose à chaque utilisateur des contenus susceptibles de l’intéresser. »

À faire avec les élèves

Prenez votre smartphone et ouvrez une plateforme de votre choix.

Observez les contenus qui apparaissent : correspondent-ils à vos centres d’intérêt et/ou à des recherches récentes que vous avez effectuées ?

A votre avis, quels indices la plateforme a-t-elle pu utiliser pour vous les recommander ?

Ces questions constituent une excellente base d’échange avec les élèves.

Concrètement, voici les signaux de classement qui influent sur TikTok  : 

  • Les comptes suivis
  • Les vidéos aimées, partagées, enregistrées,
  • Les commentaires publiés
  • Les contenus marqués “pas intéressé(e) »
  • Les vidéos ignorées ou signalées,
  • Les vidéos longues regardées jusqu’à la fin
  • Les vidéos créées et publiées par l’utilisateur
  • Les centres d’intérêt détectés (à travers l’activité et les publicités),
  • La langue utilisée
  • La localisation géographique
  • Les créateurs ou sons masqués

Chaque interaction, même minime, est minutieusement analysée. C’est son algorithme de recommandation qui fait de TikTok une plateforme redoutablement efficace pour capter et retenir l’attention.
Néanmoins, l’efficacité de TikTok ne repose pas uniquement sur son système de recommandation. Un deuxième levier central complète ce dispositif, commun aux autres plateformes : le scroll infini.

À retenir

  • Les algorithmes de recommandation sont conçus pour trier, hiérarchiser et personnaliser les contenus selon nos comportements et ceux des utilisateurs ayant des profils proches.
  • Chaque interaction compte : un clic, un like, un temps de visionnage deviennent des données utilisées pour prédire nos préférences.
  • Leur objectif est double : améliorer l’expérience utilisateur et maximiser le temps passé sur la plateforme — donc les revenus publicitaires.
  • L’intelligence artificielle permet d’affiner en continu les recommandations.