Qu’est-ce qu’un sitemap XML ?
Un sitemap XML est un fichier de site Web qui répertorie les pages que vous souhaitez que les moteurs de recherche indexent. Il fournit également des informations supplémentaires, comme la date de la dernière mise à jour de la page.XML signifie Extensible Markup Language. C’est un format qui permet un stockage facile des données d’URL et facilite l’analyse des données par les moteurs de recherche. Le sitemap XML ressemble à ceci : Avoir un sitemap XML n’est pas obligatoire. Mais cela peut aider les moteurs de recherche à découvrir vos pages nouvelles et mises à jour. Ce qui signifie qu’il peut booster votre référencement. Google a introduit les sitemaps XML en 2005. D’autres moteurs de recherche comme Yahoo et Microsoft ont rejoint peu de temps après. Dans cet article, nous verrons si vous avez besoin d’un sitemap, ainsi que divers types de sitemap et les meilleures pratiques. Ensuite, nous verrons comment créer, vérifier et soumettre votre sitemap XML.
Ai-je besoin d’un sitemap XML ?
Google fournit des exemples de cas où il n’est peut-être pas nécessaire d’avoir un sitemap. Il s’agit notamment des cas où votre site compte moins de 500 pages. Ou lorsque vos pages sont correctement liées en interne. Vous pouvez donc demander : Ai-je besoin d’un sitemap si j’ai un petit site Web avec des liens internes solides ?La réponse est: Vous ne le faites pas. Mais tu devrais en avoir un quand même.Voici pourquoi:
Comme l’a confirmé Gary Illyes de Google, les sitemaps XML sont la deuxième source la plus importante permettant à Google de découvrir de nouvelles URL. Pourquoi l’ignorer ? Et, bien sûr, avoir un plan de site XML est un must absolu si vous possédez un grand site Web (des milliers de pages) et/ou si votre site Web est nouveau et n’a pas beaucoup de liens.
Types de plan de site XML
Il existe différents types de plans de site XML. Google prend en charge les sitemaps pour différents types de contenu. À savoir : vous pouvez soit intégrer ces types de médias spéciaux dans un plan de site standard, soit créer des plans de site dédiés pour eux. Bien que la plupart des sites Web n’aient besoin que d’un seul plan de site simple, il existe des cas où vous pouvez avoir besoin de plusieurs plans de site ou de plans de site pour différents types de fichiers. Supposons que votre site comporte un grand nombre d’URL indexables. Les sitemaps XML ont une limite de taille de 50 000 URL ou 50 Mo. Vous devrez donc utiliser plusieurs sitemaps si vous dépassez cette limite.Enfin, vous pouvez utiliser des sitemaps distincts pour différents types de pages, tels que des articles de blog ou des pages d’auteur.Si vous utilisez plusieurs sitemaps XML, utilisez un index du plan du site. C’est un sitemap qui répertorie tous vos autres sitemaps. Voici à quoi peut ressembler un index de sitemap :
Meilleures pratiques pour les plans de site XML
Voyons maintenant les directives techniques et les meilleures pratiques de Google pour les sitemaps XML et comment configurer correctement votre sitemap XML :
La bonne nouvelle est que si vous utilisez un CMS (système de gestion de contenu), un plugin ou un générateur de sitemap pour créer un fichier sitemap.xml, il s’assurera qu’il répond à la plupart des exigences énumérées ci-dessus. Maintenant, vous êtes prêt à apprendre à créer un sitemap XML.
Comment générer un sitemap XML
La plupart des CMS créent et mettent à jour automatiquement votre sitemap XML. Ceux-ci incluent : Il y a généralement peu ou pas de place pour les modifications manuelles de votre sitemap dans un CMS. Mais ce n’est pas un problème pour la plupart des utilisateurs. Vous n’avez donc rien à faire si vous en utilisez un.Note: Si vous n’utilisez pas de CMS, passez à la section Générateurs de sitemaps XML.
Plugins de plan de site XML dans WordPress
Si vous êtes un utilisateur WordPress plus avancé qui souhaite avoir un contrôle total sur le fichier sitemap.xml, vous avez la possibilité de remplacer celui par défaut. Par exemple, il n’y a pas de moyen simple d’exclure certaines pages d’un sitemap XML généré par WordPress (autre que la modification du code PHP). C’est là que les plugins sont utiles. En général, vous pouvez utiliser deux types de plugins WordPress pour créer un Plan du site XML : nous examinerons de plus près Yoast SEO, l’un des plugins de référencement WordPress les plus populaires.Note: Si vous n’avez pas encore de plugin SEO, suivez nos instructions détaillées sur la façon d’en configurer un dans notre guide SEO WordPress. Une fois installé, Yoast SEO crée à la fois un nouveau plan du site et remplace automatiquement le plan du site WordPress natif. Tu peux aller à « Yoast SEO” Paramètres dans le menu de gauche du tableau de bord WordPress. Aller à « Général » paramètres et cliquez sur le « Caractéristiquesonglet « . Ici, vous trouverez le « XML Plan du site » section. La fonctionnalité sera « Au” automatiquement. Pour afficher votre sitemap XML réel, cliquez sur le symbole du point d’interrogation. Ensuite, cliquez sur le « Voir le plan du site XML” lien.Yoast crée automatiquement un sitemap d’index composé de plans de site individuels pour les articles, les pages, les catégories, les auteurs, etc. : Si vous souhaitez exclure certaines pages de votre sitemap, vous pouvez simplement désactiver leur indexation via le plugin Yoast. Cela signifie que les moteurs de recherche n’afficheront pas ces pages dans les résultats de recherche. Et Yoast les supprimera du sitemap. Exclure une URL individuelle, vous devez accéder à l’éditeur de cette page ou publication spécifique. En bas, vous trouverez les paramètres Yoast SEO. Étendre le « AvancéEnsuite, dans la section « Autoriser les moteurs de recherche à afficher cette publication dans les résultats de recherche ? » section, sélectionnez « Non. « Pour exclure tout type de contenu, les archives, et taxonomiesvous devrez vous rendre sur le Yoast SEO « Rechercher Apparence » Les paramètres. Supposons que vous ne souhaitiez pas que Google indexe vos archives d’auteurs. Allez dans le « Les archivesonglet « .Puis, sous « Afficher les archives des auteurs dans les résultats de recherche ?« , basculez le bouton sur « Désactivé. « Ce paramètre supprimera également le sitemap de l’auteur de votre index de sitemap. Pour en savoir plus sur la personnalisation de votre index de sitemap, lisez ce guide de Yoast.
Générateurs de plans de site XML
Si vous n’utilisez pas de CMS, vous avez deux options pour créer un sitemap XML :
La création manuelle d’un sitemap peut convenir si vous avez un site Web statique avec quelques pages. Mais cette option est fastidieuse pour les grands sites dont le contenu change fréquemment. Il est généralement plus pratique d’utiliser un générateur de sitemap, un outil qui crée automatiquement le sitemap pour vous. Nous vous recommandons d’utiliser un outil de bureau téléchargeable (comme Inspyder Sitemap Creator ou Sitemap Writer Pro) qui met à jour votre sitemap chaque fois qu’une page est créée ou modifiée. Pointe: Lisez notre article sur les meilleurs générateurs de sitemap pour en savoir plus sur vos options.
Comment vérifier votre sitemap XML
Pour vérifier la fonctionnalité de votre sitemap, vous pouvez utiliser l’outil d’audit de site de Semrush. Il vous suffit de créer un compte gratuit (aucune carte de crédit nécessaire) et de configurer votre premier crawl. (Ce guide de configuration vous aidera à démarrer.) L’aperçu de votre audit ressemblera à ceci :ProblèmesEnsuite, recherchez « sitemap » pour ne voir que les problèmes liés à votre fichier sitemap.xml. Les problèmes seront divisés en trois catégories (erreurs, avertissements et avis) en fonction de leur gravité. Si le problème concerne plusieurs URL répertoriées dans votre sitemap, vous pouvez cliquer sur le lien associé à ce problème et voir toutes les URL concernées. Pour en savoir plus sur le problème, vous pouvez toujours cliquer sur « Pourquoi et comment y remédier » lien. Une fenêtre modale apparaîtra, décrivant le problème et proposant des moyens de le résoudre.Voici un exemple de ce modal pour l’avertissement « Sitemap.xml non indiqué dans robots.txt » : si vous souhaitez en savoir plus sur l’outil d’audit de site et le divers aspects techniques du référencement de votre site Web qu’il peut vérifier pour vous, consultez notre guide détaillé d’audit de site. Envisagez également d’effectuer un audit technique global du référencement pour votre site Web.
Comment soumettre votre sitemap XML à Google
Bien que les robots d’exploration de Google finiront par récupérer votre sitemap par eux-mêmes, il est recommandé de soumettre l’URL du sitemap à Google. Principalement parce que:
Vous pouvez le faire dans Google Search Console.Note: Si vous n’avez pas de compte Google Search Console, lisez notre article sur l’outil et comment le configurer. Tout d’abord, ouvrez le « Plans de site” tableau de bord dans Google Search Console. Vous le trouverez dans le menu de gauche, sous le « Indexage » Section.Copiez et collez l’URL de votre sitemap dans le champ « Ajouter un nouveau sitemap » et appuyez sur « Nous faire parvenir. « Si vous avez plusieurs sitemaps, vous n’avez pas besoin de les soumettre séparément. Soumettez simplement votre sitemap d’index qui répertorie tous vos autres sitemaps. Votre sitemap ne sera pas traité immédiatement. (En fait, cela peut prendre jusqu’à quelques jours.) Une fois que Google a indexé votre plan de site, il affichera un statut vert « Succès » à côté de votre plan de site dans la section « Plans de site soumis ». S’il y a des problèmes avec votre sitemap, le statut sera « A des erreurs » ou « Impossible de récupérer ». Pour afficher les problèmes détectés, cliquez sur la ligne contenant votre sitemap. Google fournit également des instructions détaillées pour chacune des erreurs possibles.
FAQ
Toutes les pages doivent-elles figurer dans un sitemap XML ?
Votre sitemap ne doit inclure que les pages que vous souhaitez que les moteurs de recherche indexent et affichent dans leurs résultats de recherche. Il ne doit donc pas inclure les pages que vous souhaitez exclure des résultats de recherche. Celles-ci peuvent inclure des pages en double non canoniques, des pages d’administration, des pages cachées derrière un paywall, des pages de remerciement, etc. De plus, un sitemap XML ne doit répertorier que les pages valides (pages qui renvoient un code de statut 200). Assurez-vous qu’il n’inclut pas de pages avec d’autres codes d’état, tels que :
Quelle est la différence entre les sitemaps HTML et XML ?
La principale différence entre les sitemaps HTML et XML est leur objectif. Les sitemaps HTML aident les visiteurs à naviguer, tandis que les sitemaps XML aident les moteurs de recherche à découvrir les pages. Google recommande d’utiliser des sitemaps XML à des fins de référencement. En ce qui concerne les sitemaps HTML, Google Search Advocate John Mueller recommande de se concentrer sur une navigation claire et une bonne architecture de site au lieu d’utiliser des sitemaps HTML. Il déclare qu' »ils ne devraient jamais être nécessaires ».
Dois-je utiliser les attributs « Priority » et « Changefreq » dans mon sitemap XML ?
« Priority » et « changefreq » sont deux attributs facultatifs qui peuvent être ajoutés à chaque URL répertoriée dans un sitemap XML. ce qu’ils font:
Bien que ces attributs puissent sembler utiles à inclure dans un sitemap, l’URL d’une page et l’attribut « lastmod » sont vraiment les deux seules choses qui sont importantes pour Google, comme John Mueller l’a confirmé sur Twitter : L’URL + la date de dernière modification est ce qui nous intéresse pour la recherche sur le Web.— John Mueller n’est généralement pas là 🐀 (@JohnMu) 17 août 2017
Comment savoir si mon sitemap XML est configuré correctement ?
Avec L’outil d’audit de site de Semrush, vous pouvez auditer n’importe quel site Web et rechercher divers problèmes liés aux sitemaps XML. Il vous suffit de créer un compte gratuit (aucune carte de crédit nécessaire). L’outil vérifiera si un fichier sitemap.xml est présent. Ensuite, il listera toutes les erreurs de formatage et les pages qui ne devraient pas apparaître dans un sitemap. Il vérifiera également si votre sitemap répond aux exigences techniques (par exemple, la limite de taille) et aux meilleures pratiques (par exemple, être lié à partir de votre fichier robots.txt).