Sitemap: tout ce qu’il faut savoir

Qu’est-ce qu’un sitemap

Un sitemap est un fichier en langage XML. C’est littéralement une liste avec les URL’s d’un site à indexer ainsi qu’une façon de faciliter la tâche des robots de Google (et des autres moteurs de recherche).

C’est important de noter que Google peut décider de ne pas indexer toutes les pages trouvées sur ce fichier-là.

Dans un sitemap, il peut y avoir une liste pour les images, une autre pour les articles, pour les vidéos, etc.

Il est préféré que les « araignées » ou robots des moteurs de recherche puissent bien lire et comprendre un site. Cependant, il ne faut jamais négliger les visiteurs humains ! Ceux-ci sont les plus importants, puisqu’un des critères de classement de Google est une bonne expérience utilisateur (EU) ou user experience (UX) en anglais.

C’est pourquoi le fait d’ajouter un sitemap HTML est aussi une bonne pratique. Son but est le même que pour la version XML, sauf que maintenait, l’intérêt est que les visiteurs du site comprennent ce dernier et qu’ils puissent naviguer à travers toutes les pages et sections.

Par exemple, c’est une bonne idée d’inclure ta map HTML dans la page 404. Ainsi, les visiteurs qui n’ont pas trouvé ce qu’ils cherchaient pourront consulter la liste de toutes les pages existantes sur ton site web.

Ça sert à quoi ?

Le fait d’avoir un sitemap ne sera pas une action magique qui positionnera ton site web en première page. En fait, ce n’est même pas un critère de classement.

Cependant, cela peut aider les moteurs de recherche à mieux comprendre ton site.

Les pages ou articles les plus importants d’un site peuvent être spécifiés à Google, en plus de la date de création et de modification de ceux-ci, la fréquence des modifications, etc.

Cet outil peut également aider à repérer des problèmes de « communication » entre un site et Google. Par exemple, si 50 pages sont publiées et que Google n’en a indexées que 20, cela veut dire que Google ne comprend pas le site de la façon dont le créateur le souhaiterait.

Un autre avantage est que si un site possède un sitemap qui se met à jour automatiquement (comme celui généré par le plugin Yoast SEO), il y a possibilité d’y protéger le contenu. Ce que je veux dire par là, c’est que si jamais un article est publié et que quelqu’un fait littéralement juste copier/coller et utiliser le contenu dans un autre site, Google peut savoir grâce au sitemap le jour, et même l’heure exacte de la publication de cet article-là.

De cette façon, le moteur de recherche comprend qui était la première personne à publier le contenu et l’auteur original ne sera pas pénalisé pour du contenu dupliqué (source)

Comment générer un sitemap ?

Je vais t’expliquer maintenait comment créer un sitemap de 2 façons différentes. Ainsi, tu seras en mesure de te servir de cet outil, que tu utilises WordPress ou que tu possèdes un site en HTML.

En ce qui concerne les limites, essaie de ne pas dépasser 50,000 URLs ni 50MB de taille du fichier. S’il est plus gros que cela, il faudra créer un XML index avec plusieurs sitemaps.

WordPress

Bien qu’il existe plusieurs plugins pour cet effet, seulement la création d’un sitemap pour WordPress à l’aide de Yoast SEO sera abordée ici.

Si tu ne connais pas Yoast SEO, laisse-moi juste te dire que c’est un plugin très populaire qui te donne la possibilité d’optimiser facilement les pages de ton site (titres, URLs, meta descriptions, indexer, désindexer, follow, non-follow, définir tes mots clés ciblés, etc.)

De plus, cet outil te permettra de générer des sitempas automatiques. Pour ce faire, il faut juste cliquer « on » dans l’option XML sitemap que tu trouveras dans « features »

Sitemap avec Yoast SEO

C’est aussi simple que cela ! Bien sûr, si tu veux personnaliser ton sitemap en incluant ou excluant des posts, taxonomies, tags, etc., tu peux le faire dans les options avancées.

Créer ton prope sitemap XML

Si tu veux « coder » ton map par toi-même, je vais t’expliquer brièvement comment le faire.

Pour commencer, il faut utiliser le protocole du site https://www.sitemaps.org/. Ensuite, il faut indiquer chaque URL à inclure, ainsi que sa priorité, sa date et sa fréquence de modification.

Dans l’image suivante, je te montre un exemple de sitemap d’un site web de 2 pages (franchement, si tu as seulement 2 pages sur ton site, tu n’as même pas besoin d’un sitemap)

Sitemap en XML

Tu peux remarquer que chaque URL est indiquée avec la balise <url>. Dedans, tu dois indiquer la localisation (<loc>) À noter que l’URL dans cette balise doit obligatoirement commencer par le protocole HTTP ou HTPS. Ensuite, il y a <lastmod> pour indiquer la date de la dernière modification et <changefreq> pour annoncer la fréquence des changements sur cette URL en particulier.

Finalement, la balise <prioirity> est utilisée pour assigner la priorité de ladite URL. Dans cet exemple, la priorité la plus haute (1.0) a été assignée à la page d’accueil et une priorité mineure (0.9) à la page des services.

Su tu trouves que cela devient compliqué, sache que seulement les balises <urlset>, <url> et <loc> sont obligatoires. Les autres sont optionnelles et en fait, Google ne fait pas très attention à elles.

Sitemaps Jorge Marcoux

Si tu veux utiliser cette image sur ton site web, tu as juste a indiquer la source 😉

 

Tu peux également générer un sitemap sur le site https://www.xml-sitemaps.com/.

Il suffit simplement d’indiquer le site pour lequel tu veux créer un map et par la suite télécharger le fichier généré.

Comment soumettre son sitemap à Google

Une fois ton map créé, tu dois le soumettre via la Search Console.

Si tu as utilisé Yoast SEO, il est recommandé de le soumettre lorsque tu viens de créer ton site web ou d’effectuer des modifications importantes. Même si Google dit que ce n’est pas nécessaire de renvoyer un sitemap, il est suggéré de le faire pour accélérer le processus d’exploration des robots.

Le plugin Yoast génère un index des sitemaps que tu peux trouver sur https://TonSiteWeb.com/sitemap_index.xml.

Maintenant, il faut juste que tu écrives sitemap_index.xml dans l’espace après htps://TonSiteWeb.com/ dans la Search Console:

Soumettre sitemap Google Search Console

Si tu as créé ton sitemap XML manuellement, tu dois nommer ce fichier-là comme « sitemap.xml » et après, il faut que tu le soumettes sur Search Console de la façon présentée un peu plus haut. La seule différence est que, si tu en as créé juste un et pas un index, tu dois écrire htps://TonSiteWeb.com/sitemap.xml.

En plus, il faudrait que tu le mettes à jour à chaque modification sur ton site. Pour te faciliter la vie, tu peux te servir de l’outil Screaming Frog, qui fait un excellent travail en ce qui concerne la création semi-automatique de maps de ton site.

En fait, ce logiciel est très utile pour plusieurs aspects du « technical SEO ». Un tutoriel sera bientôt ajouté ici afin de te présenter comment l’utiliser !

Si tu es curieux, tu te poses déjà la question: « Est-ce qu’on peut supprimer un sitemap et en envoyer un autre ? » Pour satisfaire ta curiosité, voici la réponse officielle de Google par rapport à cela:

Supprimer sitemap selon GoogleDifférence entre sitemap et bots.txt

J’approche le sujet ici parce que je me suis déjà fait poser la question quelques fois. Je me suis dit qu’il y a peut-être d’autres personnes qui se demandent la même chose et que ma réponse pourrait aider mes chers lecteurs !

Premièrement, le bots.txt est un fichier de texte qui indique aux différents moteurs de recherche quelles pages « crawler » ou explorer et lesquelles ne pas « crawler ». En fait, c’est comme si la permission était donnée aux robots de « passer par ici » ou de « ne pas passer par ici ».

De cette façon, il est possible d’empêcher les moteurs d’explorer certaines pages qui ne sont pas vraiment importantes ou qui peuvent rester cachées, telles que les pages de remerciement après la soumission d’un formulaire, la politique de confidentialité, etc.

D’un autre côté, la fonction d’un sitemap est d’informer les moteurs de recherche sur la structure du contenu d’un site, pour qu’il soit compréhensible et facile à explorer. Son travail est aussi d’aider à l’indexation et de protéger un contenu en indiquant aux moteurs que le site a été le premier à publier un certain article.

CTA VF

En conclusion, le sitemap est un outil qui ne « boost » pas le référencement web, mais qui est très important pour la bonne communication avec Google.

Avec lui, il est possible d’indiquer aux moteurs de recherche quelles pages sont considérées importantes pour être indexées, quelles URLS sont liées, etc. Aussi, la tâche d’exploration des robots sera facilitée.

Si tu as des questions, n’hésite pas à me laisser un commentaire. Cela me fera plaisir de te répondre ! 🙂

Sources:

0 replies

Leave a Reply

Want to join the discussion?
Feel free to contribute!

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *