Publié le 9 décembre 2022 par Lucie Blanchard

Qu’est-ce que l’index Google ?

L’index Google est une base de données de toutes les pages Web que le moteur de recherche a explorées et stockées pour les utiliser dans les résultats de recherche. Chaque page qui apparaît dans les résultats de recherche de Google doit d’abord être indexée. Ainsi, si votre page n’est pas indexée, elle n’apparaîtra pas dans les résultats de recherche.Voici comment l’indexation s’intègre dans l’ensemble du processus :

  • Rampant: Googlebot explore le Web et recherche des pages nouvelles ou mises à jour
  • Indexage: Google analyse les pages et les stocke dans une énorme base de données
  • Classement: l’algorithme de Google sélectionne les pages les meilleures et les plus pertinentes de son index et les affiche comme résultats de recherche
  • Des algorithmes prédéterminés contrôlent l’indexation de Google. Cependant, vous pouvez influencer l’indexation en gérant la façon dont les bots découvrent votre contenu en ligne.

    Comment puis-je vérifier si Google a indexé mon site ?

    Google permet de savoir facilement si votre site a été indexé en utilisant l’opérateur de recherche « site : ». Voici comment vérifier :

  • Aller sur Google
  • Dans la barre de recherche, tapez l’opérateur de recherche « site : » suivi de votre domaine (par exemple, site:votredomaine.com)
  • Lorsque vous regardez sous la barre de recherche, vous verrez une estimation du nombre de vos pages indexées par Google
  • Si aucun résultat ne s’affiche, la page n’est pas indexée. S’il existe des pages indexées, Google les affichera en tant que résultats de recherche. C’est ainsi que vous vérifiez rapidement l’état d’indexation de vos pages. Mais ce n’est pas le moyen le plus pratique, car il peut être difficile de repérer des pages spécifiques qui n’ont pas été indexées. La façon alternative (et plus complexe) de vérifier si Google a indexé votre site Web est d’utiliser Console de recherche Google. Nous y reviendrons plus en détail dans le prochain chapitre.

    Comment faire pour que Google indexe mon site ?

    Si vous avez un nouveau site Web, Google peut mettre un certain temps à l’indexer. L’exploration peut prendre de quelques jours à quelques semaines. (L’indexation se produit généralement juste après cela, mais ce n’est pas garanti.) Ainsi, l’indexation peut prendre du temps. Vous pouvez cependant accélérer le processus. Le moyen le plus simple consiste à demander l’indexation dans Google Search Console.Google Search Console (GSC) est un ensemble d’outils Google gratuit qui vous permet de vérifier la présence de votre site Web sur Google et de résoudre tout problème connexe. Si vous n’avez pas encore de compte GSC, vous devrez :

  • Connectez-vous avec votre compte Google
  • Ajouter une nouvelle propriété (votre site Web) à votre compte
  • Vérifier la propriété du site Web
  • Besoin d’aide? Lisez notre guide détaillé qui vous aidera à configurer votre Google Search Console étape par étape.

    Créer et soumettre un sitemap

    Un sitemap XML est un fichier qui répertorie toutes les URL que vous souhaitez que Google indexe. Il indique à Google que ces pages sont importantes. Ce qui aide les robots à trouver vos pages principales plus rapidement. Cela ressemble à ceci : Vous trouverez probablement votre sitemap sur cette URL : https://votredomaine.com/sitemap.xmlSi vous n’en avez pas, lisez notre guide de création d’un sitemap XML (ou ce guide des sitemaps WordPress si votre site Web fonctionne sur WordPress). Une fois que vous avez l’URL de votre sitemap, accédez à la section « Plans de site” dans GSC. Vous le trouverez sous le « Indexage” dans le menu de gauche. Entrez l’URL de votre sitemap et appuyez sur « Soumettre.” Le traitement de votre sitemap peut prendre quelques jours. Lorsque c’est fait, vous devriez voir le lien vers votre sitemap et un statut vert « Succès » dans le rapport. L’envoi du plan du site peut aider Google à découvrir toutes les pages que vous jugez importantes. Et peut accélérer le processus de leur indexation.

    Utiliser l’outil d’inspection d’URL

    Pour vérifier l’état d’une URL spécifique, utilisez l’outil d’inspection d’URL dans GSC. Commencez par saisir l’URL dans la barre de recherche « Inspection d’URL » en haut. Si vous voyez le statut « L’URL est sur Google », cela signifie que l’URL inspectée a été explorée et indexée par Google. Vous pouvez vérifier les détails pour voir quand il a été exploré pour la dernière fois, ainsi que d’autres informations utiles. Si tel est le cas, vous êtes prêt et vous n’avez rien à faire. Mais si vous voyez le statut « L’URL n’est pas sur Google », cela signifie que l’URL inspectée n’est pas indexée et ne peut pas apparaître dans les résultats de recherche Google. Vous verrez probablement la raison pour laquelle la page n’a pas été indexée. Et vous devrez résoudre le problème (voir la section suivante). Une fois cela fait, vous pouvez demander l’indexation en cliquant sur le « Demande Indexage » lien.Noter: Si l’URL inspectée est relativement nouvelle, il se peut simplement que Google ne l’ait pas encore découverte. En cliquant sur « Demander l’indexation », vous pouvez accélérer le processus.

    Comment rechercher et résoudre les problèmes d’indexation

    Parfois, il peut y avoir des problèmes plus profonds avec le référencement technique de votre site Web. Il est donc possible que votre site (ou une page spécifique) ne soit pas indexé même si vous le demandez. Cela peut arriver si votre site n’est pas adapté aux mobiles, si votre site se charge trop lentement, s’il y a des problèmes de redirection, etc. un audit SEO technique pour trouver les problèmes sous-jacents qui peuvent empêcher l’indexation de votre site. Vous pouvez utiliser un outil d’audit comme Site Audit de Semrush.

  • Créez un compte Semrush gratuit (aucune carte de crédit nécessaire)
  • Configurez votre premier crawl (Nous avons un guide de configuration détaillé qui vous aidera avec cela.)
  • Clique le « Démarrer l’audit du site » bouton
  • Après avoir exécuté l’audit, vous obtiendrez une vue détaillée de la santé de votre site. Vous pouvez également voir une liste de tous les problèmes en cliquant sur le « Problèmes” onglet : Les problèmes liés à l’indexation apparaîtront presque toujours en haut de la liste, dans la section « Erreurs ». Examinons quelques raisons courantes pour lesquelles votre site peut ne pas être indexé et comment y remédier.

    Vérifiez votre fichier Robots.txt

    Votre fichier robots.txt indique aux moteurs de recherche de ne pas explorer certaines parties d’un site Web. Il ressemble à ceci : Vous trouverez le vôtre sur : https://votredomaine.com/robots.txt(Suivez ce guide pour savoir comment créer un fichier robots.txt si vous n’en avez pas.) Vous voudrez peut-être empêcher Google d’explorer des pages en double, des pages privées ou des ressources telles que des fichiers PDF et des vidéos. Mais si votre fichier robots.txt indique à Googlebot (ou aux robots d’exploration en général) que l’intégralité de votre site ne doit pas être explorée, il y a de fortes chances qu’il ne soit pas indexé non plus. Chaque directive du fichier robots.txt se compose de deux parties :

  • « User-agent » identifie le crawler auquel il s’adresse
  • L’instruction « Autoriser » ou « Refuser » indique au crawler que le site (ou sa partie) peut ou ne peut pas être crawlé
  • Par exemple : User-agent : *
    Interdire : /Cette directive indique qu’aucun robot d’exploration (représenté par un astérisque) ne peut explorer (interdire 🙂 l’ensemble du site (représenté par une barre oblique) :Inspectez votre fichier robots.txt et assurez-vous qu’il n’existe aucune directive susceptible d’empêcher Google d’explorer votre le site ou les pages/dossiers que vous souhaitez indexer.

    Gérez vos balises Noindex et canoniques

    L’un des moyens de dire aux moteurs de recherche de ne pas indexer vos pages est d’utiliser le balises meta robots avec un attribut « noindex ». Il ressemble à ceci :Si une page contient cette ligne de code, vous dites à Google de ne pas l’indexer. Vous pouvez vérifier quelles pages de votre site Web ont des balises méta noindex dans Google Search Console :

  • Clique le « pages” rapport sous la section “Indexation” dans le menu de gauche
  • Faites défiler jusqu’à la section « Pourquoi les pages ne sont pas indexées »
  • Chercher « Exclu par ‘noindex‘ étiquette. » Cliquez dessus
  • Si la liste des URL contient une page que vous souhaitez indexer, supprimez simplement la balise meta noindex du code source de cette page. L’outil d’audit de site vous avertira également des pages bloquées via le fichier robots.txt ou la balise noindex. Il vous informera également des ressources bloquées par la balise dite X-Robots, qui est généralement utilisée pour les non -Documents HTML (tels que les fichiers PDF). Une autre raison pour laquelle votre page peut ne pas être indexée est qu’elle contient un balise canoniqueLes balises canoniques indiquent aux robots d’exploration si une certaine version d’une page est préférée. Ils évitent les problèmes causés par l’apparition de contenu en double sur plusieurs URL. Si une page comporte une balise canonique pointant vers une autre URL, Googlebot suppose qu’il existe une autre version préférée de cette page. Et n’indexera pas la page avec la balise canonique, même s’il n’y a pas de version alternative.pages” rapport dans Google Search Console aidera ici encore. Faites simplement défiler jusqu’à la section « Pourquoi les pages ne sont pas indexées » et cliquez sur « Page alternative avec la balise canonique appropriée » raison.Vous verrez une liste des pages concernées. Parcourez la liste. S’il y a une page que vous souhaitez indexer (ce qui signifie que le canonique est utilisé de manière incorrecte), supprimez la balise canonique de cette page. Ou assurez-vous qu’il pointe vers la version de la page que vous souhaitez indexer. En savoir plus sur ce sujet dans notre guide des balises canoniques.

    Améliorez votre maillage interne

    Les liens internes aident les robots d’exploration à trouver vos pages Web. Ce qui peut aider à accélérer le processus d’indexation. Si vous souhaitez auditer vos liens internes, rendez-vous dans le rapport thématique « Lien interne » dans Site Audit. Le rapport listera tous les problèmes liés aux liens internes. Cela aiderait à les résoudre tous, bien sûr. Mais ces trois problèmes sont les plus importants en matière d’exploration et d’indexation :

  • Liens internes sortantscontient l’attribut nofollow: Les liens Nofollow ne passent pas l’autorité. S’il est utilisé en interne, Google peut choisir d’ignorer la page cible lors de l’exploration de votre site. Assurez-vous de ne pas les utiliser pour les pages que vous souhaitez indexer.
  • Les pages ont besoin de plus de 3 clics pour être atteintes: si des pages nécessitent plus de trois clics pour être atteintes depuis la page d’accueil, il est possible qu’elles ne soient pas explorées et indexées. Ajoutez plus de liens internes à ces pages (et revoyez l’architecture de votre site Web).
  • Pages orphelines dans le sitemap: Les pages qui n’ont pas de liens internes pointant vers elles sont appelées « pages orphelines ». Ils sont rarement indexés. Corrigez ce problème en créant un lien vers toutes les pages orphelines
  • Pour voir les pages qui sont affectées par un problème spécifique, cliquez sur le lien indiquant le nombre de problèmes trouvés à côté de celui-ci. Enfin, n’oubliez pas d’utiliser stratégiquement les liens internes :

  • Lien vers vos pages les plus importantes: Google reconnaît que les pages sont importantes pour vous si elles ont plus de liens internes
  • Lien vers vos nouvelles pages: Intégrez les liens internes à votre processus de création de contenu pour accélérer l’indexation de vos nouvelles pages
  • Consultez notre guide sur les liens internes pour en savoir plus sur les meilleures pratiques et stratégies.

    Améliorez la qualité globale de votre site

    Les problèmes d’indexation ne sont pas toujours liés à des problèmes techniques. Même si votre site répond à toutes les exigences techniques pour être indexé, Google peut ne pas indexer toutes vos pages. Surtout si Google ne considère pas votre site Web comme étant de haute qualité. Voici une citation de John Mueller de Google : Si vous avez un site plus petit et que vous constatez qu’une partie importante de vos pages n’est pas indexée, alors je prendrais prenez du recul et essayez de reconsidérer la qualité globale du site Web et de ne pas trop vous concentrer sur les problèmes techniques de ces pages. Si tel est votre cas, vous voudrez peut-être commencer à travailler sur les points suivants :

    Categories: SEO

    Lucie Blanchard

    Lucie Blanchard

    S’abonner
    Notification pour
    guest

    Commentaires
    Commentaires en ligne
    Afficher tous les commentaires
    0
    Nous aimerions avoir votre avis, veuillez laisser un commentaire.x