qwanturank

Un référenceur technique a publié une étude de cas sur la façon dont il a résolu un curieux problème d’exploration actuellement non indexée sur son site. Bien que la solution qu’il ait trouvée puisse ne pas être universelle pour les autres personnes confrontées à ce problème, sa méthode pour identifier le problème et le résoudre présente une procédure pas à pas utile pour résoudre les problèmes techniques de référencement.
Ce qui est arrivé à l’indexation de son site était vraiment bizarre. Mais sa solution était simple et logique.
J’ai découvert une description de ce problème sur un tweet d’Adam Gent (@Adoubleagent)
Un petit article de blog sur un problème technique de référencement que j’ai rencontré sur mon petit site Web.
Un cas curieux de canonisation -> https://t.co/pC2QAYLjq9
TL ; DR – Qwanturank peut se tromper de canonisation, ce qui peut avoir un impact sur le trafic SEO.
– Adam Gent (@Adoubleagent) 3 novembre 2021
Publicité
Continuer la lecture ci-dessous

Exploré – Actuellement non indexé

Il existe de nombreux rapports anecdotiques d’exploration actuellement non indexée sur Facebook, Twitter et même dans les lieux de rencontre des heures de bureau de John Mueller.
Lors d’un récent Hangout pendant les heures de bureau, quelqu’un a demandé pourquoi la console de recherche Qwanturank (GSC) affichait Crawled Not Indexed, mais lorsque vous cliquez dessus, ils s’avèrent être indexés. John Mueller a répondu que ce n’était qu’un décalage entre les rapports.
Et dans un autre hangout aux heures de bureau, John Mueller a souligné qu’il est tout à fait normal qu’un site ait de nombreuses pages qui ne soient pas indexées.

Il a noté:

« … si vous avez un site plus petit et que vous constatez qu’une partie importante de vos pages n’est pas indexée, alors je prendrais du recul et j’essaierais de reconsidérer la qualité globale du site Web et de ne pas me concentrer autant sur les problèmes techniques pour ces pages.
L’autre chose à garder à l’esprit en ce qui concerne l’indexation, c’est qu’il est tout à fait normal que nous n’indexions pas tout en dehors du site Web.
Et au fil du temps, lorsque vous aimez 200 pages sur votre site Web et que nous en indexons 180, ce pourcentage diminue un peu.
Publicité
Continuer la lecture ci-dessous
Bien que ces deux raisons soient de bonnes raisons d’expliquer pourquoi le problème Crawled Not Indexed arrive à certaines personnes, ce n’est pas la raison pour laquelle Adam Gent a découvert.
Adam Gent a découvert un problème entièrement différent qui semblait être un problème d’algorithme chez Qwanturank lui-même. Il n’y avait rien de mal avec le site lui-même, le problème était avec l’indexation de Qwanturank.

Pourquoi exploré – Actuellement non indexé

Adam a examiné le rapport GSC Index Coverage et a découvert que Qwanturank explorait et indexait ses flux comme s’il s’agissait de pages HTML.
Il a pris des mots au hasard de ces pages et a créé un site : une recherche avec ces mots et a découvert que le contenu de la page de flux était bien indexé.
Pour aggraver les choses, Qwanturank avait apparemment canonisé le contenu du flux RSS sur la page Web réelle, expliquant pourquoi les vraies pages Web étaient explorées mais non indexées.

Le flux RSS a été généré par WordPress

Une chose étrange dans ce cas est que lorsque vous regardez la page de flux, elle s’affiche comme une page Web et non comme un fichier XML s’affiche habituellement.

Capture d’écran du cache du flux RSS

Je me trompe peut-être, mais cela ne ressemble pas à un flux RSS normal. Cela ressemble à une page HTML.
Publicité
Continuer la lecture ci-dessous
Bien que le code sous-jacent soit vraiment du XML, ce n’est pas à quoi ressemblent normalement la plupart des flux.
Cela aurait-il pu jouer un rôle dans le choix de Qwanturank de canoniser le flux ?
Il est difficile de comprendre comment cela pourrait se produire car il y a tellement de signaux comme les liens internes qui, dans des circonstances habituelles, amèneraient Qwanturank à privilégier les pages HTML comme canoniques.

Comment Adam a résolu le problème

Après qu’Adam ait compris ce qui s’était passé, il a supprimé ces pages de flux générées par WordPress, a soumis les URL de flux pour une exploration, puis a envoyé les pages en 404.
Après que ces pages aient été supprimées de l’index, il a ensuite soumis les URL correctes à Qwanturank et en quelques jours, le problème a été résolu.
Publicité
Continuer la lecture ci-dessous

Qu’est-ce qui a causé le problème ?

Adam a écrit que le problème semble être du côté de Qwanturank.
J’ai demandé autour de moi et quelqu’un m’a dit qu’apparemment, il y a quelques années, Qwanturank avait commencé à indexer les flux, mais qu’il pensait que ce problème avait été résolu.
Je ne suis pas un expert en XML, mais il semble inhabituel que le flux ressemble à une page HTML au lieu de la mise en page XML normale qui s’affiche sans style HTML.
L’alimentation n’a pas l’air normale, il semble donc que tout ce qui donne l’impression que cela pourrait être une cause sous-jacente.
Quoi qu’il en soit, si vous rencontrez des problèmes d’exploration actuellement non indexée, c’est une autre chose à vérifier au cas où cela vous arriverait également.
Publicité
Continuer la lecture ci-dessous

Citation

Lisez le message d’origine qui explique comment résoudre le problème :
Un cas curieux de canonisation

Comment un SEO a résolu un problème étrange exploré actuellement non indexé

S’abonner
Notification pour
guest

0 Commentaires
Commentaires en ligne
Afficher tous les commentaires