[Imc-france-paris] [tech site] no robots

jeppe jeppe at no-log.org
Ven 3 Oct 12:59:58 PDT 2003


suite à la demande d'Oli, pour éviter que les pages listants les articles 
cachés et que les articles cachés eux-mêmes soient indexés par les robots 
des sites de recherche comme Google, Lycos et autres, j'ai ajouté les META 
suivants :
<meta NAME='ROBOTS' CONTENT='NOINDEX, NOFOLLOW'>
<meta NAME='robots' CONTENT='noindex, nofollow'>

que les experts vérifient bien que c'est bien ça!

fichiers touchés :
mesfonctions.php3
une nouvelel fonction norobots($id_article) affiche ces tags si le statut 
de l'article est refusés


le fichier indy_haut a les 3 lignes SPIP suivantes pour inclure ces META 
dans la première section <HEAD> de la page
         <BOUCLE_art(ARTICLES){id_article}>
         [(#ID_ARTICLE|norobots)]
         </BOUCLE_art>

les fichiers article.html, article-theme.html et article-moderer.html
ont leur appel du fichier indy_haut modifié
<INCLURE(indy_haut.php3){id_article}>

NB 1 : je ne connaissais pas avant cette façon de passer les parametres 
dans INCLURE. ça va permettre de réécrire en les simplifiant tout ce qui 
touche aux pages thématiques (disparition par exemple du besoin de 
article_theme.html) -> chantier de nettoyage à prévoir.


NB 2 : j'ai aussi supprimé le fichier standard par défaut de SPIP 
article-dist.html afin de décourager les petits malins

NB 3 : si ces changements marchent, il ne seront d'abord que 
rétrospectifs, tout ce qui a été indexé auparavant restera pendant pas mal 
de temps disponible dans les différents index et caches des sites de 
recherche...




Plus d'informations sur la liste de diffusion Imc-france-paris