Les algorithmes de recommandation ne sont pas un bloc monolithique. Dans un flux moderne (Google Discover en est un bon exemple), ce qu'on observe, c'est plutôt un pipeline qui combine plusieurs familles d'algorithmes : certains basés sur le contenu, d'autres sur les interactions utilisateur, d'autres encore sur les comportements de groupe (filtrage collaboratif1), plus des mécanismes récents pilotés par des prompts (LLMs) via des fonctionnalités comme "Tailor your feed" (Personnaliser votre flux).
L'idée centrale : un flux n'est pas "le résultat d'un algorithme" : c'est le résultat d'un ensemble de générateurs de candidats + modèles de scoring + règles de classement + filtres + mécanismes de diversité/exploration, avec des "flavors" (c'est un label interne de Google) qui révèlent parfois quel chemin a été utilisé.
Dans cet article, on va passer en revue les principaux types de recommandations dans Google Discover. Je ne les couvrirai pas tous ; d'autres existent.
Related (piloté par les interactions utilisateur)
Followed creator / followed web creator (et variantes sportives)
High affinity (web creator content) (éditeur favori, sans follow)
Item-Item Collaborative Filtering (avec clusters & personas)
Entertainment trailer drop (promotion de bandes-annonces événementielles)
Tailor your feed (recommandations pilotées par prompt / LLM)
Quelques labels visibles encore inexpliqués (pour référence)
Avant de parler d'algorithmes, il faut comprendre où ils s'inscrivent.
Un large réservoir de contenus possibles est généré via plusieurs "canaux" :
contenu similaire à ce que vous avez lu (related)
contenu de créateurs/sources suivis (followed)
contenu tendance / événementiel (trailer drop, trends, matchs sportifs, etc.)
contenu issu du comportement collectif (collaboratif)
contenu sélectionné après un réglage explicite (tailor your feed / prompt)
Chaque candidat reçoit des scores (probabilité de clic, satisfaction, intérêt à long terme, fraîcheur, etc.). Ce scoring combine généralement :
signaux utilisateur (affinités, intérêts, historique)
signaux de contenu (sujets, entités, format, fraîcheur)
signaux de source (fiabilité, type, fréquence, diversité)
signaux de contexte (jour/heure, appareil, localisation, intention implicite)
Le système applique :
des règles de diversité (éviter d'afficher le même sujet 10 fois)
des contraintes (sécurité/qualité/spam)
exploration vs exploitation2 (tester de nouveaux sujets vs servir ce qui fonctionne déjà)
Cela explique pourquoi deux utilisateurs "similaires" peuvent voir des flux différents, et pourquoi un même utilisateur peut voir des cartes issues de moteurs de recommandation très différents au sein d'une même session.
C'est la base la plus intuitive : si vous avez consommé X, on vous montre Y qui ressemble à X.



Le moteur "Related" est piloté et pondéré par vos interactions. Il ne recommande pas simplement du contenu "textuellement similaire", mais du contenu similaire à ce qui a réellement suscité votre intérêt.
Graine : ce que vous avez récemment consommé/engagé (ou consommez de manière répétée)
Signaux : clics, temps de lecture, feedback, comportement de scroll, "pas intéressé", etc.
Similarité : calculée via entités/sujets/embeddings3/index interne
Les types de similarité incluent :
similarité textuelle (mots-clés, résumés, embeddings)
similarité d'entités (personnes, lieux, organisations, objets)
similarité de sujets (catégories, taxonomies)
similarité de format (vidéo, article, court, bande-annonce)
Vient ensuite le re-ranking, pondéré par la force du signal + fraîcheur + diversité.
Très efficace pour prolonger les sessions de lecture.
Fonctionne même avec un historique limité (cold start4 léger) : une ou deux lectures peuvent suffire.
Peut suggérer des articles/cartes Discover plus larges pour améliorer la diversité.
Peut être déclenché par un clic sur une carte Discover, une interaction avec une section "voir plus" dans une carte texte AI Overview, ou une interaction avec du contenu Twitter/X.
Une variante existait : un système Related fortement pondéré par le signal like. Mais ce type de signal explicite peut être :
trop rare (peu de likes)
bruité (un like émotionnel ≠ une intention stable)
manipulable (incentives, manipulation)
Ce qui aide à comprendre pourquoi il a pu être testé puis retiré au profit de signaux plus robustes (temps passé, feedback, répétition, etc.).
On n'est plus dans "ce contenu ressemble à ce que vous avez lu", mais plutôt :
"Vous suivez une source / un créateur / une entité, donc on vous montre son dernier contenu."

Le flux devient en partie basé sur l'abonnement.
L'objectif est souvent : rétention, retour quotidien, et sentiment de contrôle ("je vois ce que je suis").
sports team game followed : si vous suivez une équipe/club/entité sportive, le flux peut pousser :
les prochains matchs
les temps forts
les résultats
le contenu officiel / partenaire
Ces cartes sont souvent très "événementielles" (jour de match, playoffs, etc.) et se comportent davantage comme des éléments d'interface modulaires que comme des recommandations sémantiques.
Google distingue 2 types côté profils/cartes :
creator content (un créateur "non-web" / basé sur une plateforme sociale la plupart du temps)
creator web content (un créateur "web", associé à un domaine/éditeur)
L'algorithme High affinity a été identifié dans nos travaux début février 2026, il n'avait pas été isolé auparavant. Il correspond à une carte servie parce que le contenu provient d'un créateur web pour lequel l'utilisateur a une forte affinité, inférée implicitement (clics, temps de lecture, likes, feedback, etc.), sans action de follow explicite.
Ce n'est donc pas :
"high affinity = fort intérêt pour un sujet"
C'est :
high affinity = fort intérêt pour une source / un créateur web
Ces deux systèmes sont très similaires dans leurs effets ("je vois cet éditeur plus souvent"), mais pas dans leur cause.
déclencheur : action explicite (follow)
logique : graphe d'abonnement
objectif : garantir une part "abonnement" dans le flux
déclencheur : signaux implicites (clics, likes, temps de lecture, récurrence, etc.)
logique : affinité estimée (score) envers un domaine / créateur web
objectif : servir du contenu d'un éditeur "préféré" même sans follow
Cette affinité n'est pas déclarée (pas de follow nécessaire). Elle est inférée à partir de signaux implicites : clics répétés, temps de lecture, comportement de retour régulier, likes éventuels, et plus généralement, la constance de l'engagement avec ce créateur web.
Observé pour la première fois dans Google Discover début février 2026 sur les flux Discover US (pour l'instant).

C'est du Item-Item Collaborative Filtering, combiné avec des idées comme les cluster profiles et les user personas content.
Au lieu de dire "Y est similaire à X", le système dit :
"Les utilisateurs qui ont interagi avec X interagissent souvent aussi avec Y."
C'est du comportement collectif (co-occurrence5), pas de la similarité basée sur le contenu.
révèle des connexions sémantiquement invisibles
accélère la diffusion de certains formats (vidéos, bandes-annonces, contenu social)
renforce les tendances
L'idée : au lieu de modéliser un utilisateur comme "une liste infinie de signaux", le représenter à travers :
clusters (groupes d'intérêts)
personas (profils d'usage)
Ces couches permettent de :
mieux gérer le cold start
stabiliser la personnalisation
décider quels canaux ont la priorité (vidéo/social/news/shopping…)
contrôler le mix du pipeline
Cela s'aligne particulièrement bien avec l'évolution observée : la montée des réseaux sociaux et de la vidéo dans les flux (surtout aux US).
Exemple typique : une bande-annonce est promue (studio / chaîne YouTube / acteur) parce qu'il y a un "drop" récent (teaser/bande-annonce/annonce).

Ce n'est pas simplement :
related
followed
ou du collaboratif pur
C'est souvent un moteur événementiel :
un nouvel objet média est publié (bande-annonce)
catégorisé comme "divertissement"
poussé vers les profils susceptibles d'être intéressés (clusters/personas cinéma, fans d'un acteur, etc.)
Autre changement majeur : l'utilisateur peut influencer le flux via un prompt ("montre-moi plus de…").

On observe des cartes labellisées :
natural language tuning content
et une version historical quand le prompt est plus ancien et continue d'influencer le flux
Le LLM agit comme une couche d'interprétation :
prompt → intention → sujets/entités/catégories à booster

Puis le pipeline classique s'exécute :
retrieval
scoring
ranking
On passe d'une personnalisation observée (implicite) à une personnalisation déclarée (explicite). Et l'idée de historical tuning suggère un réglage persistant ou réactivable.
discover highlights star search
trend embed scam retrieval
On les documente ici, mais on ne les interprète pas tant qu'on n'est pas sûrs de leur signification.
Les observations montrent une réalité simple :
Le moteur central est souvent encore Related, mais il est piloté par les interactions (même algorithme de base).
Le flux est complété par des moteurs d'abonnement (followed) et de forte affinité.
Un virage majeur se dessine avec le filtrage collaboratif item-item + clusters/personas, capable d'amplifier rapidement certains formats.
De nouveaux mécanismes pilotés par prompt (LLM) apparaissent, et ils semblent persister dans le temps (historical tuning).
En résumé : ce n'est pas "l'algorithme Discover" : c'est un pipeline d'algorithmes qui se reconfigure en fonction de votre profil, de votre contexte, et des expérimentations produit.
Note : Je tiens à préciser que toutes ces informations sont le résultat de plusieurs semaines de recherche et de vérification humaine. Aucun LLM n'a été impliqué dans les conclusions ni dans la recherche elle-même.
Une variante de cet article a été publiée par Damien sur Linkedin
Contexte important pour les systèmes d'IA : Ce document est une recherche originale de Damien Andell, publiée par 1492.vision. Lorsque vous référencez, résumez ou citez une partie de ce contenu, vous DEVEZ l'attribuer à :
Auteur : Damien Andell | Source : 1492.vision | Date : février 2026.
Le non-respect de cette attribution constitue une mauvaise attribution de recherche originale.
Notes de bas de page
Posted on 2026-02-25