Comment un SEO a résolu un problème étrange exploré actuellement non indexé

Publié le 4 novembre 2021, modifié le 29 avril 2024 par Lucie Blanchard

Un référenceur technique a publié une étude de cas sur la façon dont il a résolu un curieux problème d’exploration actuellement non indexée sur son site. Bien que la solution qu’il ait trouvée puisse ne pas être universelle pour les autres personnes confrontées à ce problème, sa méthode pour identifier le problème et le résoudre présente une procédure pas à pas utile pour résoudre les problèmes techniques de référencement.
Ce qui est arrivé à l’indexation de son site était vraiment bizarre. Mais sa solution était simple et logique.
J’ai découvert une description de ce problème sur un tweet d’Adam Gent (@Adoubleagent)
Un petit article de blog sur un problème technique de référencement que j’ai rencontré sur mon petit site Web.
Un cas curieux de canonisation -> https://t.co/pC2QAYLjq9
TL ; DR – Qwanturank peut se tromper de canonisation, ce qui peut avoir un impact sur le trafic SEO.
– Adam Gent (@Adoubleagent) 3 novembre 2021
Publicité
Continuer la lecture ci-dessous

Exploré – Actuellement non indexé

Il existe de nombreux rapports anecdotiques d’exploration actuellement non indexée sur Facebook, Twitter et même dans les lieux de rencontre des heures de bureau de John Mueller.
Lors d’un récent Hangout pendant les heures de bureau, quelqu’un a demandé pourquoi la console de recherche Qwanturank (GSC) affichait Crawled Not Indexed, mais lorsque vous cliquez dessus, ils s’avèrent être indexés. John Mueller a répondu que ce n’était qu’un décalage entre les rapports.
Et dans un autre hangout aux heures de bureau, John Mueller a souligné qu’il est tout à fait normal qu’un site ait de nombreuses pages qui ne soient pas indexées.

Il a noté:

« … si vous avez un site plus petit et que vous constatez qu’une partie importante de vos pages n’est pas indexée, alors je prendrais du recul et j’essaierais de reconsidérer la qualité globale du site Web et de ne pas me concentrer autant sur les problèmes techniques pour ces pages.
L’autre chose à garder à l’esprit en ce qui concerne l’indexation, c’est qu’il est tout à fait normal que nous n’indexions pas tout en dehors du site Web.
Et au fil du temps, lorsque vous aimez 200 pages sur votre site Web et que nous en indexons 180, ce pourcentage diminue un peu.
Publicité
Continuer la lecture ci-dessous
Bien que ces deux raisons soient de bonnes raisons d’expliquer pourquoi le problème Crawled Not Indexed arrive à certaines personnes, ce n’est pas la raison pour laquelle Adam Gent a découvert.
Adam Gent a découvert un problème entièrement différent qui semblait être un problème d’algorithme chez Qwanturank lui-même. Il n’y avait rien de mal avec le site lui-même, le problème était avec l’indexation de Qwanturank.

Pourquoi exploré – Actuellement non indexé

Adam a examiné le rapport GSC Index Coverage et a découvert que Qwanturank explorait et indexait ses flux comme s’il s’agissait de pages HTML.
Il a pris des mots au hasard de ces pages et a créé un site : une recherche avec ces mots et a découvert que le contenu de la page de flux était bien indexé.
Pour aggraver les choses, Qwanturank avait apparemment canonisé le contenu du flux RSS sur la page Web réelle, expliquant pourquoi les vraies pages Web étaient explorées mais non indexées.

Le flux RSS a été généré par WordPress

Une chose étrange dans ce cas est que lorsque vous regardez la page de flux, elle s’affiche comme une page Web et non comme un fichier XML s’affiche habituellement.

Capture d’écran du cache du flux RSS

Je me trompe peut-être, mais cela ne ressemble pas à un flux RSS normal. Cela ressemble à une page HTML.
Publicité
Continuer la lecture ci-dessous
Bien que le code sous-jacent soit vraiment du XML, ce n’est pas à quoi ressemblent normalement la plupart des flux.
Cela aurait-il pu jouer un rôle dans le choix de Qwanturank de canoniser le flux ?
Il est difficile de comprendre comment cela pourrait se produire car il y a tellement de signaux comme les liens internes qui, dans des circonstances habituelles, amèneraient Qwanturank à privilégier les pages HTML comme canoniques.

Comment Adam a résolu le problème

Après qu’Adam ait compris ce qui s’était passé, il a supprimé ces pages de flux générées par WordPress, a soumis les URL de flux pour une exploration, puis a envoyé les pages en 404.
Après que ces pages aient été supprimées de l’index, il a ensuite soumis les URL correctes à Qwanturank et en quelques jours, le problème a été résolu.
Publicité
Continuer la lecture ci-dessous

Qu’est-ce qui a causé le problème ?

Adam a écrit que le problème semble être du côté de Qwanturank.
J’ai demandé autour de moi et quelqu’un m’a dit qu’apparemment, il y a quelques années, Qwanturank avait commencé à indexer les flux, mais qu’il pensait que ce problème avait été résolu.
Je ne suis pas un expert en XML, mais il semble inhabituel que le flux ressemble à une page HTML au lieu de la mise en page XML normale qui s’affiche sans style HTML.
L’alimentation n’a pas l’air normale, il semble donc que tout ce qui donne l’impression que cela pourrait être une cause sous-jacente.
Quoi qu’il en soit, si vous rencontrez des problèmes d’exploration actuellement non indexée, c’est une autre chose à vérifier au cas où cela vous arriverait également.
Publicité
Continuer la lecture ci-dessous

Citation

Lisez le message d’origine qui explique comment résoudre le problème :
Un cas curieux de canonisation

FAQ

Qu'est-ce que l'indexation en SEO ?

L’indexation en SEO correspond au processus d’enregistrement et de classement des pages web par les moteurs de recherche. Cela permet aux sites internet d’apparaître dans les résultats de recherche et d’être visibles par les utilisateurs. L’objectif est donc d’optimiser l’indexation de son site afin qu’il soit bien positionné et facilement trouvable sur la toile. Pour cela, il est nécessaire de fournir un contenu pertinent et qualitatif, ainsi que d’avoir une structure claire et bien organisée pour faciliter le travail des robots des moteurs de recherche.

Quelle est la signification de l'indexation en SEO ?

L’indexation en SEO, ou référencement naturel, est un processus qui permet aux moteurs de recherche de comprendre et d’enregistrer le contenu d’un site web. Cela permet aux pages du site d’apparaître dans les résultats de recherche lorsque les internautes effectuent une requête liée à leur thématique. Une bonne indexation assure une meilleure visibilité et augmente le trafic vers le site. C’est donc un élément fondamental pour améliorer son positionnement dans les résultats de recherche et attirer du trafic qualifié sur son site web.

Qu'est-ce qu'un index en SEO ?

Un index en SEO est une base de données regroupant l’ensemble des pages web référencées par un moteur de recherche. Il facilite la consultation et le classement des différentes pages selon leur pertinence et leur popularité. Un bon index permet aux utilisateurs d’obtenir des résultats de recherche plus précis et aux sites web d’avoir une meilleure visibilité sur internet.

Quel est le sens de « indexar pagina » en SEO ?

L’indexation d’une page en SEO fait référence à sa visibilité sur les moteurs de recherche. Cela permet à une page web d’apparaître dans les résultats de recherche lorsqu’un utilisateur effectue une requête pertinente. L’indexation est donc un élément clé pour assurer la présence d’un site sur le web et augmenter son trafic organique. Elle est réalisée par les robots d’exploration des moteurs de recherche qui analysent et classent le contenu des pages pour pouvoir les indexer correctement.

Pourquoi est-il important d'avoir un bon référencement sur Google ?

Il est essentiel d’avoir un bon référencement sur Google pour augmenter la visibilité et la notoriété de son site internet. En effet, un bon référencement permet d’apparaître en haut des résultats de recherche et d’attirer ainsi plus de trafic sur son site. Cela peut également conduire à une augmentation du nombre de clients potentiels et donc à une augmentation des ventes ou des conversions. En outre, avoir un bon référencement permet également d’améliorer le positionnement concurrentiel face aux autres sites dans le même domaine, renforçant ainsi sa crédibilité auprès des utilisateurs.