Quand on gère un site web, la question des sitemaps finit toujours par se poser. Faut-il un sitemap XML, un sitemap HTML, les deux, ou aucun ? La réponse dépend entièrement de votre site. Voici ce qu’il faut savoir pour faire le bon choix.
1. Le sitemap XML : un outil conçu pour les robots
Le sitemap XML est un fichier qui liste les URLs de votre site que vous souhaitez soumettre aux moteurs de recherche. Il peut aussi embarquer des métadonnées utiles : date de dernière modification d’une page, durée d’une vidéo, date de publication d’un article.
Ce fichier n’est pas destiné aux visiteurs. Son seul interlocuteur, c’est le robot d’exploration du moteur de recherche.
À quoi ça sert concrètement ?
Le sitemap XML aide les robots à découvrir des pages qui seraient difficiles à trouver autrement. C’est le cas des pages orphelines, de celles qui reçoivent peu de liens internes, ou encore des pages récemment modifiées que vous voulez faire recrawler rapidement.
Les règles à respecter
La majorité des robots fonctionnent avec le protocole défini sur sitemaps.org. Ce protocole fixe l’emplacement du fichier sur le serveur, le schéma à utiliser et les règles de référencement inter-domaines.
Deux limites techniques s’imposent : le fichier ne doit pas dépasser 50 Mo non compressé, et il ne peut pas contenir plus de 50 000 URLs. Si votre site est plus grand, vous devrez créer plusieurs sitemaps et les regrouper dans un fichier index.
En règle générale, les URLs listées doivent retourner un code 200, correspondre à la version canonique de la page et ne comporter aucune restriction d’indexation.
Un cas particulier à connaître
Il arrive qu’on s’écarte de ces règles, et c’est justifié. Par exemple, si vous venez de mettre en place un grand nombre de redirections 301, inclure les anciennes URLs dans un sitemap temporaire peut accélérer la prise en compte des redirections par les robots. Surtout si vous avez pris soin de supprimer les liens internes pointant vers ces anciennes adresses.
Lire Aussi : SEO : la longue traîne à l’ère de l’IA
2. Le sitemap HTML : une aide à la navigation
Le sitemap HTML est une page web classique, accessible aux visiteurs, qui centralise les liens vers les pages importantes de votre site. On le trouve souvent dans le pied de page, mais il ne fait pas partie de la navigation principale.
À quoi ça sert ?
C’est un filet de sécurité pour les utilisateurs qui n’arrivent pas à trouver ce qu’ils cherchent via le menu principal ou le moteur de recherche interne. Sur les petits sites, il peut lister toutes les pages. Sur les sites plus volumineux, on se concentre sur les pages les plus importantes.
Ce type de sitemap joue aussi un rôle secondaire pour le référencement : les robots suivent les liens présents dans les pages HTML, donc un sitemap HTML bien construit peut aider à faire découvrir des pages peu liées ailleurs sur le site.
Comment bien le construire
Il n’y a pas de format imposé. L’essentiel est que les liens soient suivables par les robots, c’est-à-dire qu’ils ne comportent pas d’attribut nofollow et que les URLs cibles ne soient pas bloquées dans le fichier robots.txt. Si ces conditions ne sont pas remplies, le sitemap reste utile pour les humains, mais perd son intérêt pour les moteurs.
Un point souvent négligé : Si un visiteur consulte votre sitemap HTML, c’est que votre navigation principale a échoué. Ce n’est pas un outil à mettre en avant, c’est un recours de dernier ressort. Gardez ça en tête quand vous concevez votre arborescence.
#. Lequel des deux choisit-on pour le SEO ?
Ni l’un ni l’autre n’est supérieur à l’autre. Tout dépend de la taille et de la structure de votre site.
Un site de moins de vingt pages, bien maillé et avec une navigation claire, n’a probablement besoin d’aucun des deux. Les robots et les utilisateurs trouveront les pages sans aide supplémentaire.
En revanche, sur un site à plusieurs millions de pages avec une navigation à plusieurs niveaux de profondeur, les deux sitemaps ont leur utilité. Ils répondent à des besoins différents et s’adressent à des audiences différentes.
Quand le sitemap XML devient vraiment utile
Au-delà de la découverte des pages, le sitemap XML est précieux pour le diagnostic. En le soumettant à Google Search Console, vous obtenez des alertes en cas de problème sur les URLs listées et vous pouvez surveiller leur statut d’indexation. Sur les grands sites, c’est un outil de suivi indispensable.
Le sitemap XML parle aux robots, le sitemap HTML parle aux humains. Les deux peuvent coexister sans se concurrencer. Le bon choix, c’est celui qui correspond aux besoins réels de votre site.
