Avec l’évolution rapide du marketing digital, les entreprises doivent régulièrement refondre leur site web pour rester compétitives. Or, cette refonte est un projet délicat, avec des bénéfices importants en branding et conversion, mais aussi des risques, notamment en SEO.
L’un des problèmes les plus fréquents est l’indexation involontaire du site en construction par Google, exposant une version non finalisée aux internautes. Cela peut nuire à l’image de marque et au référencement.
Pour éviter cette situation, voici les bonnes pratiques à adopter afin de bloquer l’indexation d’un site en développement.
Vous l’avez compris, le meilleur moyen pour ne pas avoir à désindexer un site en construction, c’est de faire ce qu’il faut en amont pour qu’il ne soit pas indexé par les moteurs de recherche. Il y a essentiellement 5 méthodes pour cela, dont les 2 premières figurent dans les guidelines de Google.
Ajoutez ce fichier à la racine de votre site avec les lignes suivantes :
User-agent: *
Disallow: /
⚠️ Cela n’empêche pas totalement l’indexation si des liens vers le site existent ailleurs.
Dans le <head> de chaque page :
<meta name="robots" content="noindex, nofollow">
Cela empêche les moteurs de recherche d’indexer la page et de suivre les liens.
Ajoutez ces lignes pour restreindre l’accès :
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{REQUEST_URI} !/maintenance.html$
RewriteRule .* /maintenance.html [R=503,L]
</IfModule>
Ou pour limiter par IP :
Order deny,allow
Deny from all
Allow from VOTRE_IP
Utilisez un .htpasswd avec .htaccess :
AuthType Basic
AuthName "Accès restreint"
AuthUserFile /chemin/vers/.htpasswd
Require valid-user
Certains CMS (WordPress, etc.) permettent d’empêcher l’indexation via les paramètres.
Ces méthodes combinées assurent une protection efficace contre l’indexation du site en développement.
Si votre site en développement s’est retrouvé indexé par Google malgré vos précautions, tout n’est pas perdu ! Il est encore possible d’y remédier.
Avant toute chose, retirez les limitations mises en place dans le fichier robots.txt, les accès restreints par mot de passe ou par adresse IP. L’objectif est que Googlebot puisse scanner l’ensemble du site et prendre en compte les consignes de désindexation.
Ajoutez cette balise dans la section <head> de vos pages :
<meta name="robots" content="noindex">
Cela signalera aux moteurs de recherche que ces pages ne doivent plus apparaître dans les résultats.
Si ce n’est pas encore fait, ajoutez votre site comme propriété dans la Search Console.
Soumettez un sitemap pour accélérer l’analyse du site par Google.
Utilisez l’outil de suppression d’URL pour retirer les pages concernées.
Si le site de développement est sur un sous-domaine, vous pouvez supprimer en une seule fois toutes les URL associées en sélectionnant l’option dédiée.
Une fois que les pages ont bien disparu de Google, remettez en place les restrictions nécessaires (robots.txt, protections d’accès, etc.) pour éviter un nouvel incident d’indexation.
Empêcher l’indexation d’un site en construction est essentiel pour éviter qu’il ne soit référencé trop tôt par Google, ce qui pourrait nuire à votre SEO et à votre image de marque.
En supprimant temporairement les restrictions d’accès, en ajoutant la balise meta ‘noindex’ et en utilisant la Google Search Console pour demander la suppression des URL, vous pouvez corriger rapidement cette situation.
Une fois votre site désindexé, pensez à remettre en place toutes les protections nécessaires pour éviter qu’il ne soit à nouveau exploré par les moteurs de recherche.
Empêcher l’indexation Empêcher l’indexation Empêcher l’indexation Empêcher l’indexation