Comment supprimer rapidement une page Web de l’index de Google ?

Guide SEO – Indexation

Niveau : Débutant

Pré-requis : avoir un site Web sur la Google Search Console

“Besoin de supprimer rapidement du contenu de la recherche Google ?” Suppressions temporaires, contenu obsolète, filtrage Safesearch…

  1. Demande de suppression via la Google Search Console
  2. Crawl, indexation, positionnement

La suppression d’URL sur Google est une question assez fréquente. Il est nécessaire avant de lire ce tutoriel de bien comprendre les notions de crawl, d’indexation et de positionnement.

Demande de suppression via la Google Search Console

Pour effectuer une demande de suppression il vous suffit de vous rendre sur la Google Search Console : “Index >> Supressions >> Nouvelle Demande” ou de vous rendre directement sur https://search.google.com/search-console/removals puis de sélectionner la propriété (site Web) de votre choix.

Votre demande devra concerner une page ou un ensemble de pages :

  • Une URL précise (ex. pour supprimer /ma-page.html),
  • L’ensemble des URL contenant un préfixe (ex. pour supprimer toutes les pages situées dans /mon-dossier/).

Google indique que “l’utilisation de cet outil dans certains cas de figure peut générer des problèmes au niveau de votre site”. Google suggère d’utiliser cet outil uniquement en cas d’urgence et de laisser les robots traiter “naturellement” les pages de votre site dans tous les autres cas.

“L’ancienne vers la nouvelle Search Console” présentait un outil permettant aux webmasters de “Supprimer temporairement” une page des résultats de recherche. La nouvelle Search Console présente un outil similaire avec 3 onglets :

  • Suppressions temporaires (anciennement “Masquer temporairement”) :
    • Supprimer temporairement l’URL,
    • Effacer l’URL mise en cache.
  • Contenu obsolète,
  • Filtrage Safesearch.

Dans la Google Search Console, seul le premier onglet présente un formulaire de “Nouvelle demande”, il s’agit de l’onglet “suppressions temporaires”. Pour faire une demande dans un des deux autres onglets, vous devez vous rendre directement sur les outils respectifs :

La fonctionnalité “Suppressions temporaires“, par exemple, utile dans les cas suivants :

  • Modification sur un nombre important d’URL nécessitant d’être impacté rapidement : on fera par exemple désindexer l’ensemble d’un sous-dossier,
  • Demande de suppression légitime formulée par un tiers (ex. respect du RGPD),
  • Supprimer la version d’une page dans le cache de Google uniquement.

Cette fonctionnalité permet de supprimer 1 seule URL à la fois ou toutes les URL “correspondant à ce préfixe” (ex. pour supprimer toutes les pages situées dans /mon-dossier/).

“Supprimez la ou les URL des résultats de recherche Google pendant environ six mois et éliminez l’extrait ainsi que la version mise en cache (qui seront recréés lors de la prochaine exploration). Pour une suppression permanente, empêchez l’indexation des pages concernées ou supprimez-les entièrement de votre site.”

A noter : pour faire en sorte que cette URL ne soit pas réindexée par Google au bout de la période indiquée par l’outil, vous devrez faire en sorte :

  • Qu’elle retourne un code d’erreur accepté par Google (404, 410, voir dans certains cas 401, 403),
  • D’indiquer une directive “noindex” dans une balise “meta” ou dans l’en-tête “X-Robots-Tag” pour cette URL,
  • Qu’elle soit en redirection 301 vers une autre URL.

À noter : Google déconseille l’utilisation du Robots.txt comme “mécanisme de blocage”. Il est toutefois possible, sous certaines conditions d’utiliser la règle Disallow pour interdire l’accès aux robots de Crawl sur une ou plusieurs pages.

Notons également la particularité de “Contenu obsolète” qui permet de supprimer “Si vous voyez un résultat de recherche que vous ne possédez pas, et que l’extrait du résultat ou le résultat en cache (stocké) dans les résultats de recherche diffèrent de la page actuelle, OU que la page n’existe plus.”

Crawl, indexation, positionnement

Ces trois notions sont essentielles pour bien comprendre à quel stade la demande de suppression intervient et la nécessité pour “supprimer durablement” une page de mettre en place des implémentations techniques.

  • Crawl : Google parcours la page,
  • Indexation : Google ajoute la page à son index,
  • Positionnement : Google positionne votre page et présente un snippet dans les pages de résultats.

Comment contrôler à quelle étape en est une page de mon site ?

  • Crawl : logs Apache / plugin de statistique stockant les accès de Google ou Google Search Console.
  • Indexation : via la commande “site:” ou via la Google Search Console (onglet “Couverture” ou la fonction d’Inspection d’une URL).
  • Positionnement : en suivant une ou plusieurs requêtes avec un outil de relevé de position ou via la Google Search Console (onglet Performances).

Ajoutons à ces 3 étapes, une étape préliminaire (avant le Crawl) et une mettant fin à la séquence (après Positionnement) :

  • Autorisation (avant le Crawl) : avant de parcourir une page, Google s’assure d’être autorisé pour le faire en consultant le robots.txt. La règle “Disallow”, peut donc empêcher le Crawl. Cette règle est à ne pas confondre avec le “Noindex” qui interdit (au moment du Crawl) à Google d’indexer la page.
  • Suppression (après le positionnement) : une fois une page indexée, voire positionnée, il est possible à tout moment de la supprimer. Cette suppression entraînera la disparition temporaire ou permanente de la page de l’index de Google. La durée de la suppression dépendra de l’implémentation technique qui a été faite.