Erreur 404 : définition et impact sur le SEO
Il est fréquent de tomber sur des pages introuvables dans la navigation Internet. Que se passe-t-il lorsque cela arrive ? Quelles en sont les conséquences pour les SEO d'un site ?
Qu'est-ce qu'une erreur 404 ?
L'erreur 404, généralement accompagnée du message "File Not Found" (fichier non trouvé), est un code d'erreur appartenant au protocole de communication http sur Internet. Il est envoyé par un serveur HTTP et indique que ce dernier n'a pas réussi à trouver la ressource recherchée (le plus souvent une page). L'internaute qui reçoit un message d'erreur 404 doit comprendre que la page qu'il recherche n'existe pas.
Le problème peut provenir tout simplement d'une erreur de saisie dans l'URL ou de l'obsolescence d'une page Web (c'est ce qu'indique le premier 4 du chiffre 404). Il peut également s'agir d'une restriction instaurée par les créateurs d'un site Web.
Depuis plusieurs années, la culture Web encourage certains webmasters à personnaliser ces pages d'erreur 404 avec des messages, parfois humoristiques. L'enjeu consiste surtout à rediriger l'internaute vers une page Web fonctionnelle et à le renseigner sur les raisons pour lesquelles il s'est retrouvé sur une page d'erreur, plutôt qu'à le perdre.
Impact des pages 404 sur les SEO
Il est normal, sur un site de moyenne ou grande taille, de trouver des pages d'erreur 404. Les Googlebots peuvent en tolérer une petite quantité. En revanche, si la proportion de pages revoyant une erreur 404 devient importante, ils risquent d'espacer leurs visites sur le site. Or, un site moins souvent crawlé est moins bien indexé.
Cela fait partie du travail des SEO de suivre la quantité de pages d'erreur pour les réparer régulièrement afin que leur nombre ne devienne jamais un obstacle au passage des robots de crawl. Accessoirement, les pages d'erreur 404 ne constituent pas une bonne expérience pour les internautes. S'ils en rencontrent plusieurs au cours de leur navigation, ils risquent de quitter le site.
Erreur 404 externe ou interne
Il existe deux types d'erreur 404, toutes deux importantes pour le SEO d'un site.
- Erreur 404 interne : il s'agit d'une page introuvable sur le site. Un changement d'URL sans redirection 301 peut en être la cause. Lorsqu'un webmaster se rend compte que leur nombre augmente, il doit en comprendre la cause.
- Erreur 404 externe : elle intervient lorsqu'une page destinataire d'un lien depuis votre site n'existe plus. Elle fait perdre de l'autorité à la page qui comprend ce lien, car le "jus" de lien est alors perdu.
Comment gérer les erreurs 404 sur son site ?
Des outils comme Screaming Frog ou la search console de Google permettent de traquer les pages introuvables sur son site. Il faut régulièrement faire des audits pour s'assurer que le nombre est stable. Des redirections 301 permettent de réparer les erreurs en redirigeant les internautes et les robots de crawl vers la bonne page, qui sera dûment indexée.
Pour les erreurs externes, il faut supprimer les liens. Ils peuvent être remplacés par un lien pointant vers la nouvelle URL de la page si cette dernière existe.