Dans un récent article sur LinkedIn, l’analyste de Google, Gary Illyes, a attiré l’attention sur deux problèmes qui affectent les robots d’exploration : le logiciel 404 et d’autres erreurs de « crypto ». Ces erreurs apparemment anodines peuvent affecter négativement les efforts de référencement.
- Google met en garde contre les erreurs soft 404 et leur impact sur le référencement.
- Les erreurs soft 404 se produisent lorsque des pages inexistantes renvoient un code d'état "200 OK".
- Les conséquences vont au-delà de l'utilisation inefficace des ressources du robot.
- Résoudre ces erreurs peut améliorer la visibilité du site dans les résultats de recherche.
Comprendre les erreurs logicielles 404
Les erreurs soft 404 se produisent lorsqu’un serveur Web renvoie un code d’état HTTP standard « 200 OK » pour des pages qui n’existent pas ou qui contiennent des messages d’erreur. Cela induit les robots d’exploration Web en erreur, les obligeant à gaspiller des ressources sur du contenu inexistant ou inutile. Illyes a comparé l’expérience à la visite d’un café où chaque article n’est pas disponible bien qu’il soit indiqué sur le menu. Bien que ce scénario puisse être frustrant pour les clients humains, il pose un problème plus grave pour les robots d’exploration Web. Comme l’explique Illyes : « Les robots utilisent les codes d’état pour interpréter si une récupération a réussi, même si le contenu de la page n’est essentiellement qu’un message d’erreur. Ils pourraient revenir volontiers à la même page encore et encore, gaspillant vos ressources, et s’il existe de nombreuses pages de ce type, cela augmentera exponentiellement vos ressources.
Les coûts cachés des erreurs logicielles
Les conséquences des erreurs logicielles 404 s’étendent au-delà de l’utilisation inefficace des ressources du robot. Selon Illyes, il est peu probable que ces pages apparaissent dans les résultats de recherche car elles sont filtrées lors de l’indexation. Pour lutter contre ce problème, Illyes conseille de fournir le code d’état HTTP approprié lorsque le serveur ou le client rencontre une erreur. Cela permet aux robots d’exploration de comprendre la situation et d’allouer leurs ressources plus efficacement. Illyes a également mis en garde contre les robots d’exploration limitant le débit avec des messages tels que « TROP DE REQUÊTES RALENTISSENT », car les robots d’exploration ne peuvent pas interpréter de telles instructions textuelles.
Pourquoi SEJ s’en soucie
Les erreurs logicielles 404 peuvent avoir un impact sur l’exploration et l’indexation d’un site Web. En résolvant ces problèmes, les robots d’exploration peuvent se concentrer sur la récupération et l’indexation de pages contenant un contenu précieux, améliorant ainsi potentiellement la visibilité du site dans les résultats de recherche. L’élimination des erreurs logicielles 404 peut également conduire à une utilisation plus efficace des ressources du serveur, car les robots d’exploration ne gaspilleront pas de bande passante en visitant de manière répétée les pages d’erreur.
Comment cela peut vous aider
Pour identifier et résoudre les erreurs logicielles 404 sur votre site Web, tenez compte des étapes suivantes :
- Surveillez régulièrement les rapports d’exploration et les journaux de votre site Web pour identifier les pages renvoyant des codes d’état HTTP 200 malgré des messages d’erreur
- Implémentez une gestion appropriée des erreurs sur votre serveur pour garantir que les pages d’erreur sont servies avec les codes d’état HTTP appropriés (par exemple, 404 pour non trouvé, 410 pour supprimées définitivement)
- Utilisez des outils tels que Google Search Console pour surveiller la couverture de votre site et identifier toutes les pages signalées comme erreurs 404 logicielles
La résolution proactive des erreurs logicielles 404 peut améliorer la capacité d’exploration, l’indexation et le référencement de votre site Web.
Image en vedette : Julia Tim/Shutterstock
FAQ
Qu'est-ce qu'un "soft 404" sur Google ?
Un "soft 404" sur Google est un code d'erreur qui indique à Google qu'une page a été supprimée ou n'existe plus, mais qu'elle renvoie tout de même un contenu similaire à celui d'une erreur 404. Il peut s'agir par exemple d'une redirection automatique vers la page d'accueil du site. Ce type de comportement peut être pénalisé par Google car il ne permet pas aux utilisateurs de trouver facilement l'information recherchée.
Ainsi, pour éviter le "soft 404", il est recommandé de rediriger correctement les pages supprimées ou inexistantes en proposant du contenu pertinent aux utilisateurs.
Quelle est la problématique d'indexation de Google liée aux soft 404 ?
La problématique d'indexation de Google liée aux soft 404 est que ces pages sont considérées comme des erreurs par le moteur de recherche et peuvent nuire au référencement du site. Les robots d'exploration de Google risquent de ne plus indexer les véritables pages utiles du site si elles sont entourées de plusieurs soft 404.
Cela peut entraîner une baisse de visibilité et donc un impact négatif sur le trafic du site. Il faut donc veiller à corriger rapidement ces soft 404 pour éviter toute conséquence néfaste sur le référencement du site web.
Comment indexer un soft 404 sur Google ?
Pour indexer un soft 404 sur Google, il faut tout d'abord s'assurer que la page en question renvoie bien le code d'erreur 404. Ensuite, il est important de créer une redirection vers une autre page active pour éviter les erreurs répétitives. Il est également recommandé de mettre à jour le fichier robots.
txt en excluant la page en question pour empêcher Google de l'indexer à nouveau. Enfin, il est possible de soumettre manuellement la nouvelle redirection via l'outil "Inspecter l'URL" dans la console Google Search.
Comment chercher un soft 404 sur Google ?
Pour chercher une liste des erreurs 404 sur Google, il suffit de taper dans la barre de recherche "site:nomdusite.com/404".
Cela affichera les pages d'erreur qui ont été enregistrées par Google pour le site spécifié. Vous pouvez également ajouter des critères de recherche tels que la date ou un mot-clé précis pour affiner les résultats. Si vous souhaitez surveiller régulièrement ces erreurs, vous pouvez utiliser des outils SEO payants ou gratuits qui peuvent fournir un rapport détaillé et automatisé des soft 404 sur votre site. N'hésitez pas à consulter le centre d'aide Google pour plus d'informations sur ce sujet.
Où se trouve le rapport de "soft 404" dans la Search Console de Google ?
Le rapport de "soft 404" se trouve dans la section "Améliorations" de la Search Console de Google. Il permet de détecter les pages sur le site qui renvoient une erreur 404 mais qui sont considérées comme des erreurs temporaires par Google. Ce rapport offre également la possibilité de résoudre ces problèmes afin d'améliorer l'indexation et le classement du site.
Il est important de vérifier régulièrement ce rapport pour maintenir un site fonctionnel et bien référencé.