Les algorithmes de recommandation

The Social Dilemma (Derrière nos écrans de fumée, en français), un documentaire sorti sur Netflix en 2020, lève le voile sur les stratégies mises en place par les géants du numérique pour capter, retenir et exploiter l’attention des utilisateur·rices. D’ancien·nes ingénieur·es de Google, Facebook ou Twitter y racontent comment les algorithmes, initialement conçus pour organiser l’information, sont devenus des outils capables d’influencer les émotions et les comportements à grande échelle.

Parmi ces mécanismes, les systèmes de recommandation occupent une place centrale.

Internet, un monde saturé d’informations

Le développement des plateformes numériques s’inscrit dans un environnement caractérisé par une augmentation continue du volume de contenus mis en ligne. Chaque minute :

500 heures de vidéos sont postées sur YouTube.

66 000 photos sont postées sur Instagram.

360 000 tweets sont postés sur X.

Dans ce contexte, les plateformes ont progressivement mis en place des systèmes automatisés de tri et de hiérarchisation, appelés algorithmes de recommandation, afin d’organiser les contenus proposés et de faciliter la navigation.

Qu’est-ce qu’un algorithme de recommandation ?

Avant de s’intéresser aux algorithmes de recommandation, commençons par définir ce qu’est un algorithme de manière générale.

Un algorithme est une suite d’instructions logiques et ordonnées, permettant de résoudre un problème ou d’accomplir une tâche.

Une recette de cuisine est un algorithme. Prenons l’exemple de la préparation d’une omelette. Il s’agit d’une suite d’instructions précises à exécuter dans un ordre déterminé :

  • Casser 2 œufs dans un bol.
  • Ajouter une pincée de sel.
  • Battre les œufs avec une fourchette.
  • Faire chauffer une poêle avec un peu d’huile.
  • Verser les œufs battus dans la poêle.
  • Laisser cuire quelques minutes.
  • Plier l’omelette et la servir.

Cette succession d’étapes précises transforme des ingrédients bruts en un plat final.
De la même manière, un algorithme informatique traite des données d’entrée (inputs) pour produire un résultat (output), selon des règles définies.

Mais alors, qu’est-ce qu’un algorithme de recommandation ?

Un algorithme de recommandation est un système automatisé qui sélectionne et hiérarchise des contenus afin de proposer à chaque utilisateur et utilisatrice ceux qui ont le plus de probabilité de susciter son intérêt.

Pour fonctionner, les systèmes de recommandation s’appuient sur des données issues des usages en ligne des personnes. Ces données, collectées par la plateforme, portent notamment sur :

Les contenus visionnés

Les interactions (publications aimées, commentées ou partagées)

Le temps passé sur certains contenus

Les recherches, les clics ou les achats effectués

À partir de ces éléments, l’algorithme établit des probabilités, et non des certitudes, afin d’ordonner les contenus affichés.

Les algorithmes de recommandation sont conçus pour 2 choses :

  • Personnaliser « l’expérience utilisateur·rice » et la rendre plus agréable, en proposant des jugés plus pertinents ou intéressants
  • Favoriser l’engagement, en maximisant le temps passé sur la plateforme, ce qui constitue un levier économique majeur pour les services financés par la publicité

Il est important de souligner que ces systèmes n’analysent pas le sens ou la valeur morale des contenus, mais reposent sur des indicateurs mesurables (temps de visionnage, interactions, similarités statistiques).

Résumé en 3 phase de ce qui a été décrit plus haut

À vous de jouer

Pour chaque affirmation, décidez si elle est vraie ou fausse. Vous découvrirez ensuite l’explication derrière chaque réponse pour mieux comprendre le principe des algorithmes.

Les plateformes utilisent les données des autres utilisateur·rices pour ajuster nos recommandations.

a) VRAI

b) FAUX

a) VRAI

Les algorithmes fonctionnent par mise en réseau des profils : si d’autres utilisateur·rices semblables à vous ont aimé un contenu, il vous sera proposé à votre tour. C’est le filtrage collaboratif.

Les recommandations algorithmiques ne concernent que les réseaux sociaux.

a) VRAI

b) FAUX

b) FAUX

C’est une logique économique globale qui ne se limitent pas qu’aux réseaux sociaux : sites de vente en ligne, sites de vidéos à la demande (Netflix), etc.

Une logique commune à de nombreux secteurs du numérique

Les algorithmes de recommandation ne se limitent pas aux réseaux sociaux. On les retrouve dans de nombreux environnements numériques :

  • Plateformes de vidéos et de musique à la demande
  • Sites de commerce en ligne
  • Moteurs de recherche
  • Plateformes de réservation de voyages
  • Sites d’information

À noter que les algorithmes de recommandation diffèrent d’une plateforme à une autre : l’algorithme de Facebook est différent de celui de Tiktok par exemple.

Une même plateforme peut mobiliser plusieurs algorithmes différents, selon le type de contenu à recommander. C’est le cas d’Instagram, qui utilise différents algorithmes pour personnaliser le fil d’actualité, les stories, l’onglet Explorer ou encore les Reels.

Repères historiques

Contrairement à une idée répandue, les premiers outils d’accès à l’information sur Internet n’étaient pas totalement neutres. Les annuaires du web, largement utilisés dans les années 1990, reposaient sur des logiques de classification qui impliquaient déjà des formes de hiérarchisation

A la fin des années 2000, l’augmentation rapide du nombre de contenus oblige les plateformes à trier les contenus différemment selon les utilisateurs. Elles ne montrent plus la même chose à tout le monde, mais s’appuient sur les usages pour décider quel contenu afficher en priorité.

Cette évolution se fait progressivement et conduit aux systèmes de recommandation actuels, qui ne se contentent plus de classer l’information, mais la personnalisent selon chaque utilisateur et utilisatrice.

Facebook introduit son premier système de tri automatisé des contenus en 2011, appelé EdgeRank. Ce premier modèle attribuait un score à chaque publication en fonction de plusieurs critères, afin de déterminer si elle apparaîtra — ou non — dans un fil d’actualité.

Par la suite, EdgeRank a été remplacé par des modèles plus complexes et sophistiqués.

Sur Youtube, 70% des contenus visionnés sont issus des recommandations algorithmiques, provenant de ce que « notre moteur de recommandation offre à vous » disait Neal Mohan, CPO de Youtube.

Cela signifie que, sur YouTube, une large part du temps passé sur la plateforme est guidée par ce que le système de recommandation propose, plutôt que par une recherche volontaire de contenus précis.

Les signaux de classement : principes et limites

Pour organiser les contenus proposés aux utilisateur·rices, les plateformes s’appuient sur ce que l’on appelle des signaux de classement.

Il s’agit d’indicateurs mesurables, issus des usages, qui servent à décider quels contenus afficher en priorité, et dans quel ordre.

Ces signaux ne portent pas sur le sens ou la qualité du contenu, mais sur la manière dont les utilisateur·rices interagissent avec lui.

Parmi les principaux signaux de classement utilisés par les plateformes, on retrouve notamment :

  • le temps passé sur un contenu (lecture, visionnage, écoute)
  • les interactions (likes, commentaires, partages, enregistrements)
  • la fréquence à laquelle un contenu est consulté ou ignoré
  • la relation entre l’utilisateur·rice et le compte ou la source du contenu
  • les similarités avec d’autres contenus appréciés par des utilisateur·rices au profil proche.

Il est essentiel de le souligner : ces signaux de classement ne permettent pas de juger de la fiabilité du contenu, d’évaluer son intrérêt éducatif ou sa qualité informative et de distinguer une fausse information.

Pour en savoir davantage sur ce sujet, cliquez ici

Une base commune pour tous les systèmes algorithmiques

Comme nous l’avons déjà évoqué, les systèmes de recommandations algorithmiques diffèrent selon les plateformes. Ils reposent néanmoins sur deux piliers fondamentaux : 

  • l’intelligence artificielle (IA) et l’apprentissage automatique,
  • les « signaux de classement ».

Sur les plateformes numériques, l’IA permet d’analyser des volumes massifs de données issues des comportements des utilisateurs. Sans elle, il serait tout simplement impossible de générer des recommandations personnalisées pour des millions de personnes simultanément.

L’IA s’appuie sur des modèles statistiques pour prédire les contenus les plus susceptibles de susciter l’intérêt. En testant continuellement différentes combinaisons de contenus et en observant les réactions des utilisateurs, elle affine progressivement ses recommandations.
L’objectif reste inchangé : maximiser l’engagement en maintenant l’utilisateur actif le plus longtemps possible sur la plateforme.

À noter qu’en plus d’analyser les interactions passées d’un utilisateur pour prédire ce qui pourrait l’intéresser, l’intelligence artificielle prend également en compte le comportement d’utilisateurs au profil similaire. Ce procédé porte un nom : le filtrage collaboratif. Par exemple, si l’utilisateur A et l’utilisateur B ont tous deux aimé l’élément 1 et l’élément 2, et que l’utilisateur A a également aimé l’élément 3, le système recommandera l’élément 3 à l’utilisateur B.

Ces choix ne sont pas prédéfinis manuellement par un humain. Ils sont issus d’un apprentissage automatique (aussi appelé machine learning), basé sur l’analyse continue des comportements. Comme ces comportements évoluent en permanence, l’algorithme s’adapte en temps réel pour maintenir la pertinence de ses suggestions.

Ces comportements sont traduits en “signaux de classement” : des indicateurs utilisés par l’algorithme pour évaluer chaque contenu. C’est en fonction de ces signaux, comme le temps de consultation, la fréquence d’interaction ou les similarités avec d’autres contenus populaires, que l’algorithme décide de l’ordre d’apparition dans le fil d’actualité de chaque utilisateur.
Ce système crée ainsi une hiérarchie invisible des contenus, dictée non pas par des critères éditoriaux humains, mais par les comportements des utilisateurs.

Pour en savoir davantage sur ce sujet, cliquez ici.

YouTube a publié une présentation détaillée expliquant les principaux mécanismes utilisés pour proposer des vidéos aux utilisateurs et utilisatrices, notamment l’analyse des habitudes de visionnage, des interactions (likes, commentaires, durée de visionnage) et des centres d’intérêt similaires entre internautes.

Cliquez ici

Exemple : l’algorithme de Tiktok

TikTok se distingue nettement des autres plateformes. Là où Facebook ou Instagram privilégient généralement les contenus des comptes suivis, TikTok fait l’inverse : il mise tout sur la découverte de contenus nouveaux, issus de comptes que l’utilisateur·rice ne suit pas, mais jugés pertinents.

Haut de l’écran d’un smartphone montrant l’onglet « For You » de TikTok entouré en bleu, indiquant un fil de contenus recommandés par la plateforme.

Le fil Pour Toi (For You Page) est ainsi entièrement personnalisé, construit en fonction des comportements en ligne, et non des abonnements.

Alors que sur YouTube, ce sont plus de 70% des contenus visionnés qui sont issus de recommandations algorithmiques, chez TikTok, c’est la quasi-totalité.

Voici comment TikTok décrit lui-même sa fameuse For You Page (Page Pour Toi) :

« Un flux de vidéos adaptées à vos centres d’intérêt, facilitant la recherche de contenus et de créateurs que vous aimez… alimenté par un système de recommandation qui propose à chaque utilisateur des contenus susceptibles de l’intéresser. »

À vous de jouer

Prenez votre smartphone et ouvrez une plateforme de votre choix.

Observez les contenus qui apparaissent : correspondent-ils à vos centres d’intérêt et/ou à des recherches récentes que vous avez effectuées ?

À votre avis, quels indices la plateforme a-t-elle pu utiliser pour vous les recommander.
Ces questions constituent une excellente base d’échange avec les élèves.

Concrètement, voici les signaux de classement qui influent sur Tiktok :

  • Les comptes suivis
  • Les vidéos aimées, partagées, enregistrées,
  • Les commentaires publiés
  • Les contenus marqués « pas intéressé·e »
  • Les vidéos ignorées ou signalées,
  • Les vidéos longues regardées jusqu’à la fin
  • Les vidéos créées et publiées par l’utilisateur·rice
  • Les centres d’intérêt détectés (à travers l’activité et les publicités),
  • La langue utilisée
  • La localisation géographique
  • Les créateurs ou sons masqués

Chaque interaction, même minime, est minutieusement analysée . C’est son algorithme de recommandation qui fait de TikTok une plateforme redoutablement efficace pour capter et retenir l’attention.

Néanmoins, l’efficacité de TikTok ne repose pas uniquement sur son système de recommandation. Un deuxième levier central complète ce dispositif, commun aux autres plateformes : le scroll infini.

À retenir

  • Les algorithmes de recommandation sont conçus pour trier, hiérarchiser et personnaliser les contenus selon nos comportements et ceux des utilisateur·rices ayant des profils proches.
  • Chaque interaction compte : un clic, un like, un temps de visionnage deviennent des données utilisées pour comprendre et prédire nos préférences.
  • Leur objectif est double : améliorer l’expérience utilisateur·rice et maximiser le temps passé sur la plateforme — donc les revenus publicitaires.
  • L’intelligence artificielle permet d’affiner en continu les recommandations.