En mai dernier, Gary Illyes de Google a accordé une interview à la conférence SERP Conf 2024 en Bulgarie et a répondu à une question sur les causes de l’exploration mais non indexation, en proposant plusieurs raisons utiles pour déboguer et corriger cette erreur. Bien que l’interview ait eu lieu en mai, la vidéo de l’interview n’a pas été suffisamment médiatisée et peu de gens l’ont réellement regardée. Je n’en ai entendu parler que parce que la toujours géniale Olesia Korobka (@Giridja) a récemment attiré l’attention sur l’interview dans une publication Facebook. Même si l’entretien a eu lieu en mai, les informations sont toujours d’actualité et utiles.
- Google explique les raisons de la non-indexation des pages explorées par Gary Illyes.
- L'exploration mais non indexation peut être due à la similitude avec d'autres contenus déjà indexés.
- La qualité générale du site peut influencer l'indexation des URL explorées.
- D'autres raisons possibles incluent des changements de perception du site par Google et des problèmes techniques.
Raison de l’exploration – Actuellement non indexé
Exploré actuellement non indexé est une référence à un rapport d’erreur dans le rapport d’indexation des pages de Google Search Console qui avertit qu’une page a été explorée par Google mais n’a pas été indexée. Lors d’une interview en direct, quelqu’un a posé une question demandant : « Le fait qu’une page soit explorée mais non indexée peut-il être le résultat d’une trop grande similitude avec d’autres éléments déjà indexés ? Alors Google suggère-t-il qu’il existe déjà suffisamment d’autres choses et que vos choses ne sont pas assez uniques ? La documentation de la Search Console de Google ne fournit pas de réponse quant à la raison pour laquelle Google peut explorer une page et ne pas l’indexer, c’est donc une question légitime. Gary Illyes a répondu que oui, l’une des raisons pourrait être qu’il existe déjà d’autres contenus similaires. Mais il ajoute qu’il existe aussi d’autres raisons. Il a répondu: « Oui, cela pourrait être une chose que cela peut signifier. L’exploration mais non indexation est une chose, l’idéal serait de diviser cette catégorie en morceaux plus granulaires, mais c’est très difficile en raison de la façon dont les données existent en interne. Cela peut être un tas de choses, l’élimination des doublons est l’une de ces choses, où nous explorons la page, puis nous décidons de ne pas l’indexer parce qu’il existe déjà une version de celle-ci ou une version extrêmement similaire de ce contenu disponible dans notre index et elle a de meilleurs signaux. Mais oui, mais ça peut être plusieurs choses.
La qualité générale du site peut avoir un impact sur l’indexation
Gary a ensuite attiré l’attention sur une autre raison pour laquelle Google pourrait explorer mais choisir de ne pas indexer un site, en disant qu’il pourrait s’agir d’un problème de qualité du site. Illyes continua alors sa réponse : « La qualité générale du site peut également avoir une grande influence sur le nombre d’URL explorées mais non indexées que vous voyez dans la Search Console. Si le nombre de ces URL est très élevé, cela peut indiquer des problèmes de qualité générale. Et j’ai vu cela souvent depuis février, où soudainement nous avons décidé que nous indexerions une grande quantité d’URL sur un site simplement parce que… notre perception du site a changé.
Autres raisons pour lesquelles les données explorées ne sont pas indexées
Gary a ensuite proposé d’autres raisons pour lesquelles les URL pourraient être explorées mais pas indexées, affirmant qu’il se pourrait que la perception du site par Google ait changé, mais qu’il pourrait s’agir d’un problème technique. Gary a expliqué : « … Et une possibilité est que lorsque vous voyez ce nombre augmenter, que la perception de… la perception de Google du site a changé, cela pourrait être une chose. Mais il se peut aussi qu’une erreur se soit produite, par exemple sur le site, et que la même page ait été diffusée à chaque URL du site. Cela peut également être l’une des raisons pour lesquelles ce chiffre grimpe. Donc oui, il pourrait y avoir beaucoup de choses.
Plats à emporter
Gary a fourni des réponses qui devraient aider à comprendre pourquoi une page Web peut être explorée mais pas indexée par Google.
- Le contenu est similaire au contenu déjà classé dans les pages de résultats des moteurs de recherche (SERP)
- Le même contenu existe exactement sur un autre site qui a de meilleurs signaux
- Problèmes généraux de qualité du site
- Problèmes techniques
Bien qu’Illyes n’ait pas précisé ce qu’il voulait dire à propos d’un autre site avec de meilleurs signaux, je suis presque certain qu’il décrit le scénario dans lequel un site syndique son contenu sur un autre site et Google choisit de classer l’autre site pour le contenu et non l’éditeur d’origine. Regardez Gary répondre à cette question à la 9e minute de l’interview enregistrée :
Image en vedette par Shutterstock/Roman Samborskyi
FAQ
Comment fonctionne l'indexation de Google ?
L'indexation de Google consiste à parcourir les pages web et à les analyser afin de les classer dans son index. Pour cela, le moteur de recherche utilise des robots appelés "Googlebots" qui explorent en permanence le web.
Ces robots suivent des liens pour découvrir de nouvelles pages et utilisent un algorithme pour juger la pertinence du contenu. Ils stockent ensuite ces données dans l'index, une immense base de données qui répertorie toutes les pages trouvées sur internet. Grâce à cet index, lorsque vous effectuez une recherche sur Google, vous obtenez rapidement une liste de résultats correspondant à votre requête, triés selon leur pertinence et leur popularité. Cela permet aux utilisateurs d'accéder plus facilement aux informations recherchées sur le web.
Qu'est-ce que l'indexation des articles de blog sur Google ?
L'indexation des articles de blog sur Google est le processus par lequel les moteurs de recherche, tels que Google, identifient et répertorient les pages d'un site web dans leur base de données. Cela permet aux articles de blog d'être accessibles et visibles lorsqu'un utilisateur effectue une recherche en utilisant des mots-clés pertinents. L'objectif est d'améliorer la visibilité du contenu et d'augmenter le trafic organique vers le site web.
Pour être indexés, les articles doivent être optimisés avec des balises méta pertinentes et un contenu de qualité.
Qu'est-ce que signifie l'indexation de Google ?
L'indexation de Google est la manière dont le moteur de recherche classe et enregistre les pages web dans sa base de données. Cela permet aux utilisateurs d'accéder rapidement et facilement aux informations pertinentes lorsqu'ils effectuent une recherche.
L'objectif de l'indexation est donc d'aider à organiser la quantité énorme de contenu présent sur internet et de le rendre accessible aux internautes. En bref, l'indexation de Google est une étape essentielle pour que les sites web soient visibles et trouvables sur le moteur de recherche.
Quelle est la signification de l'expression "indexed by google" ?
L'expression "indexed by google" signifie que le contenu d'un site web est répertorié et enregistré par le moteur de recherche Google. Cela permet aux internautes d'accéder facilement au site lorsqu'ils effectuent une recherche sur Google.
Être indexé par Google augmente donc la visibilité du site et son potentiel de fréquentation.
Pourquoi mon site n'est-il pas indexé par Google ?
Vérifiez si votre site respecte les consignes de Google pour être indexé, notamment en utilisant un fichier sitemap et en évitant le contenu dupliqué. 3. Assurez-vous également que votre site est accessible aux robots d'exploration de Google en vérifiant la présence d'un fichier robots.txt et en évitant les blocages avec le fichier .htaccess. 4. Si malgré tout votre site n'est toujours pas indexé, il est possible que cela prenne du temps avant que Google ne le découvre et l'indexe. N'hésitez pas à prendre contact avec leur support si le problème persiste.