Navigation

Toutes les catégories

Filtrer par auteur

Voir les derniers articles

Balise meta robots : comment l’utiliser ?

Les métas directives pour les robots (parfois appelées « balises méta robots ») sont des éléments de code qui fournissent des instructions sur la manière dont les robots doivent...

Publié par Sebastien Turbe

Les métas directives pour les robots (parfois appelées « balises méta robots ») sont des éléments de code qui fournissent des instructions sur la manière dont les robots doivent explorer ou indexer le contenu des pages d’un site Web.

Alors que les directives du fichier robots.txt donnent aux robots des suggestions sur la manière d’explorer les pages d’un site Web, les balises en question fournissent des instructions plus fermes quant à la manière d’explorer et d’indexer le contenu d’une page donnée.

 

A quoi servent ces balises méta robots ?

Les balises méta robots donnent aux robots d’exploration des instructions sur la manière d’explorer et d’indexer les informations qu’ils trouvent sur une page Web spécifique. Lorsque ces directives sont découvertes par les robots, leurs paramètres servent de suggestions fortes sur le comportement d’indexation des crawlers.

Malheureusement, comme c’est le cas pour les instructions placées dans le fichier robots.txt, les robots d’exploration ne sont pas tenus de suivre vos indications : il y a donc fort à parier que certains robots malveillants ignoreront vos directives et « avaleront » le contenu de vos pages sans aucun scrupule.

En effet, il est bon de rappeler que les balises robots ne constituent pas un bon mécanisme de sécurité : si vous disposez d’informations privées et que vous ne souhaitez pas qu’elles soient accessibles au public, choisissez une approche plus sûre, telle que la protection par mot de passe, pour empêcher visiteurs et robots de consulter ces pages confidentielles.

Les 2 types de balises méta robots

Il existe deux types de balises :

  • celles qui font partie de la page HTML (« robots »)
  • celles que le serveur Web envoie sous la forme d’en-têtes HTTP (« x-robots-tag »)

Les mêmes paramètres (comme « noindex » et « nofollow ») peuvent être utilisés à la fois par la balise méta robots et la balise x-robots : la seule différence est la manière dont ces paramètres sont communiqués aux robots.

Les 2 types de balises méta robots

Balise meta robots

La balise méta robots fait partie du code HTML d’une page Web. Elle apparaît sous forme d’éléments de code dans la section <head> d’une page Web, comme par exemple :

<code> <meta name="robots" content="[PARAMETRE]"></code>

Si la balise <meta name="robots" content="[PARAMETER]"> est standard, vous pouvez également fournir des directives à des crawlers spécifiques en remplaçant « robots » par le nom d’un user agent spécifique.

Par exemple, si vous souhaiter indiquer une directive spécifique à l’attention de Googlebot, vous pouvez utiliser le code suivant :

<meta name="googlebot" content="[PARAMETRE]">

Vous voulez utiliser plus d’une directive sur une page ? Tant qu’elles s’adressent au même robot, plusieurs directives peuvent être incluses dans une même balise méta – il vous suffit de les séparer par des virgules.

Voici un exemple :

<meta name="robots" content="noimageindex, nofollow, nosnippet">

Comme nous le verrons plus bas, cette portion de code indique aux robots de ne pas indexer les images de la page, de ne suivre aucun des liens et de ne pas afficher un extrait de la page, lorsqu’elle apparaît dans les résultats de recherche.

Si vous souhaitez donner des instructions différentes à différents robots de recherche, vous devrez utiliser des balises distinctes qui s’adresseront à chaque robot.

Balise X-robots

Alors que la balise meta robots vous permet de contrôler le comportement d’indexation au niveau de la page, la balise x-robots est incluse dans l’en-tête HTTP pour contrôler l’indexation d’une page dans son ensemble, ainsi que des éléments très spécifiques d’une page.

Bien que vous puissiez utiliser la balise x-robots pour exécuter les mêmes directives d’indexation que la balise méta robots, la directive x-robots offre plus de souplesse et de fonctionnalités que cette dernière.

En effet, la directive x-robots permet d’utiliser des expressions régulières, d’exécuter des directives d’indexation sur des fichiers non-HTML et d’appliquer des paramètres à un niveau global.

Pour utiliser la balise x-robots, vous devez avoir accès au fichier header.php, .htaccess ou au fichier d’accès au serveur de votre site Web. À partir d’un de ces fichiers, ajoutez le balisage x-robots-tag de votre configuration de serveur spécifique, y compris les paramètres éventuels. Voici quelques exemples de ce que vous permet l’utilisation de la balise x-robots :

  • Contrôler l’indexation de contenu non écrit en HTML (comme une vidéo)
  • Bloquer l’indexation d’un élément particulier d’une page (comme une image ou une vidéo), mais pas celle de la page elle-même.
  • Contrôler l’indexation si vous n’avez pas accès au code HTML d’une page (en particulier à la section <head>) ou si votre site utilise un en-tête global qui ne peut être modifié.
  • Ajouter des règles pour déterminer si une page doit être indexée ou non (par exemple, si un utilisateur a commenté plus de 20 fois, indexer sa page de profil).
Balise meta robots : comment l'utiliser ?

 

Quels sont les paramètres des balises robots ?

Vous trouverez ci-dessous les paramètres que les robots des moteurs de recherche comprennent et suivent (ou pas) lorsqu’ils sont utilisés dans les balises méta robots.

À savoir
Ces paramètres ne sont pas sensibles à la casse, notez toutefois qu’il est possible que certains moteurs de recherche ne suivent qu’un sous-ensemble de ces paramètres, ou traitent certaines directives de manière légèrement différente.

All

C’est la balise par défaut, vous n’avez pas besoin de la mettre : elle indique au moteur de recherche d’indexer une page.

Follow

Même si la page n’est pas indexée, le robot d’exploration doit suivre tous les liens contenus dans cette page et transmettre l’équité aux pages liées.

Noindex

Indique à un moteur de recherche de ne pas indexer une page.

Nofollow

Indique au robot d’exploration de ne pas suivre les liens d’une page et donc de ne pas transmettre l’équité des liens.

None

Équivaut à l’utilisation simultanée des balises noindex et nofollow.

Noimageindex

Comme nous l’avons vu précédemment, ce paramètre indique au robot d’indexation de ne pas indexer les images d’une page.

Noarchive

Les moteurs de recherche ne doivent pas afficher de lien en cache vers cette page sur un moteur de recherche.

Nocache

Identique à noarchive, mais utilisé uniquement par Internet Explorer et Firefox.

Nosnippet

Indique à un moteur de recherche de ne pas afficher un extrait de cette page (c’est-à-dire la méta-description) sur un résultat de recherche.

Max-snippet : [nombre]

Remplacez la variable [nombre] par le nombre maximal de caractères que vous souhaitez appliquer à un extrait de texte pour ce résultat de recherche.

Mettre [0] équivaut à l’instruction nosnippet. Mettre [-1] donnera à Google le soin de déterminer lui-même la longueur de l’extrait.

Unavailable_after [DATE et HEURE]

Les moteurs de recherche ne doivent plus indexer cette page après une date particulière.

Exemple : <meta name= »robots » content= »unavailable_after : 2020-09-21″>

Notranslate

Lorsque cette instruction n’est pas spécifiée, Google peut afficher un lien à côté du résultat pour aider les utilisateurs à afficher le contenu traduit sur votre page.

Si vous ne souhaitez pas proposer de traduction pour cette page dans les résultats de recherche, utilisez cette directive.

max-image-preview : [PARAMETRE]

Cette instruction sert à définir la taille maximale d’un aperçu d’image pour cette page dans les résultats de recherche. Si vous ne spécifiez pas l’instruction max-image-preview, Google affichera un aperçu d’image avec la taille par défaut.

Trois valeurs sont acceptées :

  • « none » : aucun aperçu d’image ne doit s’afficher
  • « standard » : un aperçu d’image par défaut peut s’afficher
  • « large » : un aperçu d’image de grande taille peut apparaître

 

Conclusion

Et voilà, vous savez tout sur l’utilisation de ces balises méta robots. Si vous ne savez pas comment en tirer parti pour améliorer votre référencement, n’hésitez pas à faire appel à un professionnel !

5
/
5
(
1

vote

)
Lire la suite de l'article
Afficher les commentaires (0)

Commentaires

Newsletter WebActus

Abonnez-vous pour recevoir notre sélection des meilleurs articles directement dans votre boîte mail.

Nous ne partagerons pas votre adresse e-mail.

Articles similaires

Webmarketing

Les achats de biens virtuels plus rentable que la publicité

Flurry vient de présenter des résultats étonnant d’une étude qui montrent que la vente des biens virtuels dans les applications mobiles rapporte bien plus d’argent que...

Publié le par Team WebActus
Webmarketing

[Infographie] – Le triangle gagnant du marketing

Si comme moi, vous n’êtes pas un gourou du marketing et que vous êtes curieux et touche à tout alors cette infographie est pour vous. Elle vous présente le triangle vertueux...

Publié le par Team WebActus