
Mai 2024. Un événement en particulier fait l’effet d’une bombe dans le domaine du référencement naturel : plus de 2 500 pages de documentation interne attribuée à Google Search fuitent. Il n’en faut pas plus pour secouer la Toile ! Les experts relaient l’information et y vont de leur propre analyse pour tenter de décortiquer les 14 000 features dévoilées.
Sont-ils véritablement utilisés par le Géant des moteurs de réponse dans ses algorithmes de classement ? Quels sont les enseignements à en tirer pour les professionnels du SEO ?
Un an plus tard, retour sur ce phénomène phare !
Au programme de cet article :
Il était une fois… “la plus grosse fuite de l’histoire de l’algorithme Google” !
Le 5 mai 2024, Rand Fishkin (cofondateur de SparkToro et de Moz) reçoit un email anonyme. Son contenu est pour le moins… intriguant. L’auteur prétend détenir des documents secrets internes provenant de l’API « Content Warehouse » de Google (d’autres sources considèrent qu’il s’agit plutôt du « Document AI Warehouse »). L’ampleur de la fuite est considérable ! Très vite, Mike King (fondateur d’iPullRank) a également accès à ces informations clés. La machine est en marche et ne s’arrêtera pas…
Les deux experts en SEO mènent l’enquête auprès d’anciens employés de Google. Oui, les documents partagés semblent légitimes. Ils se prêtent bien aux standards du Géant américain. La source se révèle être le consultant Erfan Azimi qui aurait profité d’un dépôt de code GitHub, accidentellement rendu public par un bot automatisé de mars à mai 2024.
La phénomène prend de l’ampleur, est relayé par la presse et les spéculations vont bon train ! Fin mai 2024, Google se décide alors à sortir du silence et confirme officiellement l’authenticité des documents divulgués.
Mais attention…
En effet, il pourrait s’agir d’un produit Google Cloud distinct de l’algorithme de classement principal de Google Search. En d’autres termes, cela reprendrait uniquement une description précise des données collectées, des attributs stockés et des fonctionnalités liés à l’API par Google, sans que le facteur ranking ne soit pris en compte.
Cependant, certains professionnels du référencement naturel sont sceptiques… Après tout, Google a l’art de communiquer de manière nébuleuse et de se contredire lors de certaines déclarations publiques.
Alors, véritables “secrets de l’algorithme” ou « protocol buffers » à interpréter avec recul ? Les éléments dévoilés sont-ils dépassés, purement exploratoires ou d’actualité en termes de ranking ? Si le poids de chaque facteur de classement n’est pas mentionné, nous plongeons tout de même dans la multitude de données collectées et utilisées en interne par Google.
Plusieurs précautions sont donc à prendre en analysant ces documents, mais cela n’en reste pas moins une source de compréhension riche pour mieux piloter votre stratégie SEO.
Place aux révélations clés du Google Leaks !
Contenu, liens, interactions utilisateur… Faisons le tour des mécanismes internes révélés.
NavBoost
L'importance des clics et de l’engagement utilisateur

Depuis toujours, Google nie le fait que les données de clics dans la SERP soient utilisées directement comme facteur de classement. Hors, le Google Leaks contredit cette parole ! Les documents révèlent un système de re-classement appelé NavBoost et basé sur des signaux tels que le taux de clic (CTR), les “bons” et les “mauvais” clics (classés selon divers éléments comme la durée de visite) et le phénomène de pogo-sticking (retour rapide à la page de résultats suite à un clic). En résumé, la satisfaction utilisateur a un impact sur le classement de vos pages web !
💥 Niveau d’impact estimé du leak : élevé
Envie d’en découvrir davantage sur l’effet NavBoost et les bonnes pratiques associées à mettre en place?
SiteAuthority
Quand l’autorité du site et l’âge du domaine jouent

Autre contradiction notable : l’existence d’un attribut SiteAuthority. L’autorité d’un site est donc bien évaluée et elle ne se base pas uniquement sur les backlinks. D’autres facteurs comme les signaux d’engagement des utilisateurs, la notoriété et la pertinence globale du site entrent en jeu.
En parallèle, le Google Leaks implique l’idée selon laquelle les sites récents sont temporairement limités en termes de positionnement sur des mots-clés concurrentiels (sandbox). En bref, plus votre site a de l’âge, mieux c’est !
💥 Niveau d’impact estimé du leak SiteAuthority : élevé
💥 Niveau d’impact estimé du leak Sandbox : faible à moyen
Découvrez comment maximiser l’autorité de votre domaine web.
Chrome
Utilisation des données du navigateur

Autre contradiction notable : l’existence d’un attribut SiteAuthority. L’autorité d’un site est donc bien évaluée et elle ne se base pas uniquement sur les backlinks. D’autres facteurs comme les signaux d’engagement des utilisateurs, la notoriété et la pertinence globale du site entrent en jeu.
En parallèle, le Google Leaks implique l’idée selon laquelle les sites récents sont temporairement limités en termes de positionnement sur des mots-clés concurrentiels (sandbox). En bref, plus votre site a de l’âge, mieux c’est !
💥 Niveau d’impact estimé du leak SiteAuthority : élevé
💥 Niveau d’impact estimé du leak Sandbox : faible à moyen
Découvrez comment maximiser l’autorité de votre domaine web.
E.E.A.T et Quality Raters
L’importance des auteurs

Certaines données issues des Quality Raters seraient utilisées dans les facteurs de classement Google. L’impact de l’EEAT n’est donc pas négligeable ! Il est donc primordial de soigner la notoriété et la présentation des auteurs de vos contenus.
💥 Niveau d’impact estimé du leak : moyen à élevé
Plongez au cœur du principal de l’EEAT, des Quality Raters et découvrez comment optimiser la partie “auteur” de votre site.
Le contenu et l’expérience utilisateur
Le fuel de votre stratégie

Fraîcheur, originalité, utilité, mise en forme… Content is king ! Google le démontre une fois de plus à travers sa fuite de données.
💥 Niveau d’impact estimé du leak : élevé
Découvrez comment lier expérience, utilisateur et contenu à la fois textuel et visuel.
Les liens
Le coeur de la navigation

Le Google leak apporte des précisions sur la manière dont le moteur de réponses évalue la qualité des liens. Le niveau d’indexation de la page d’entrée, les pics de spams au niveau des ancres et les données de clics sont, entre autres, des éléments pris en considération.
💥 Niveau d’impact estimé du leak : élevé
Améliorez votre stratégie de netlinking en comprenant en profondeur les facteurs clés qui influencent leur efficacité.
Les listes blanches
Quid des sujets sensibles ?

Signaux anti-spam
La chasse aux mauvais sites

Mauvaise correspondance au niveau des ancres ? Insatisfaction de l’utilisateur ? Dégradation de la navigation ? Attention aux pénalités ! Google prend soin de lutter contre les spams.
💥 Niveau d’impact estimé du leak : moyen
Faites attention à optimiser votre site de manière sensée.
Quelles sont les recommandations stratégiques en termes de SEO et d’UX ?
Il est essentiel que votre stratégie SEO évolue au rythme des moteurs de réponse. Google concentre ainsi ses algorithmes autour de l’utilisateur, de la qualité du propos fourni et de la technicité pour obtenir des résultats de recherche cohérents et à forte valeur ajoutée.
Les enjeux de cette fuite de données
La fuite des documents internes à Google reste un événement unique et marquant dans l’univers du référencement naturel ! Elle confirmerait les hypothèses et analyses longtemps menées par les experts dans le domaine. Des facteurs moins bien connus sont également mis en lumière, ce qui constitue une source riche d’informations pour optimiser au mieux son site internet.
Mais attention, gardez votre esprit critique ! Les signaux révélés peuvent être interprétés différemment.
Besoin d’établir une stratégie SEO efficace pour maximiser la visibilité de votre site internet ? Faites appel à l’agence Clef2web : nous veillons au grain pour évoluer en même temps que les moteurs de réponses et d’I.A.
Sources :
👉 SparkToro (Rand Fishkin) – Analyse initiale de la fuite (27 mai 2024)sparktoro.comsparktoro.com
👉 iPullRank (Mike King) – Analyse technique “Secrets from the Algorithm Leak” (27 mai 2024)ipullrank.comipullrank.com
👉 Search Engine Land – Couverture de l’annonce et implications SEO (mai 2024)theverge.comtheverge.com
👉 The Verge – Articles “Google confirms… documents are real” & “Biggest findings in the leak”theverge.comtheverge.com
👉 CNET – “Google Algorithm Leak Contradicts What Google Has Said…”cnet.com
👉 Mashable – “…Here’s what experts are saying”mashable.com
👉 Search Engine Journal – “Doubts Emerge Over Alleged Google Data Leak”searchenginejournal.com
👉 Abondance – “Google leak : des milliers de documents révèlent les secrets de l’algorithme”abondance.comabondance.com
👉 Blog du Modérateur – “SEO : que nous apprend la fuite de données Google ?”blogdumoderateur.comblogdumoderateur.com
👉 Autres analyses SEO (SEOmix, Yooda, etc.) et threads de la communauté sur Twitter/Xtwitter.com.