Disallow: { document à exclure }

But de la commande

Interdire l'indexation d'un site, d'un répertoire ou d'un fichier

Syntaxe :

 Disallow:/index2.htm
  Indique aux robots qu 'ils ne doivent pas indexer la page /index2.htm situé à la racine du site
 Disallow:/admin/
     Indique aux robots qu 'ils ne peuvent indexer les fichiers contenus dans le répertoire admin.
 Disallow: 
  Indique aux robots que tout doit être indexé. Identique à un fichier robots.txt inexistant.

Ecarts par rapport au standard (Google, msn)

Le caractère * peut être utilisé pour remplacer n'importe quel caractère dans l'adresse.

Le caractère $ à la fin d'une instruction Disallow fera en sorte que cette instruction sera interprètée de manière non standard. Googlebot ne visitera pas les adresses correspondant exactement au texte qui précède le signe $. Les caractères * et $ peuvent être utilisés séparément ou dans la même ligne.

Disallow: /*.pdf$
    L'instruction interdit de lire les fichiers .pdf partout sur le site.
Disallow: /*-commande
  Cette instruction interdit de lire les adresses dont le nom inclut la chaîne de caractères -commande.
Il s'agira, par exemple, des adresses /robot-commande.php ou /commande.html.
Disallow: /*?
  Cette instruction interdit à Googlebot d'accéder aux adresses comprenant un point d'interrogation (?).
Il s'agira, par exemple, des adresses /index.php?ref=45 et /robots.php?debut=2, mais l'accès à /index.php et /contenu.php est autorisé.