Notizie seo Notizie google in italiano

     
Approfondimenti seo e posizionamento nei motori di ricerca
Meta Tag Robots
Approfondimenti seo e posizionamento
Scritto da Nicola Antonelli   
Giovedì 11 Settembre 2008 00:00

Se il tuo web host ti proibisce di caricare il robots.txt nella root, o semplicemente vuoi limitare i crawlers di alcune pagine del tuo sito, o vuoi utilizzare comandi che nel robots.txt non sono possibili, l'alternativa al robots.txt è l'utilizzo del meta tag robots.

Il meta tag "robots" è simile a tutti gli altri meta tag e deve essere inserito all'interno della sezione HEAD della o delle pagine in questione:

<head>
<title>titolo della pagina</title>
<meta name="robots" content="index,follow" />

Il meta tag robots è indirizzato in modo esclusivo agli spider ai quali fornisce due principali direttive: se indicizzare o no la pagina, o se seguire o no i link in uscita da questa pagina:

index per indicare che la pagina può essere indicizzata;

noindex per indicare che la pagina non deve essere indicizzata;

follow per far seguire allo spider i link della pagina;

nofollow per non far seguire allo spider i link della pagina.

 

Poi ci sono altri comandi ma meno utilizzati:

archive per permettere al motore di ricerca di salvare e mostrare la copia cache;

noarchive per non permettere la copia cache della pagina;

nosnippet impedisce che nelle serp vengano mostrati i link interni al sito;

noodp impedisce che venga mostrata come descrizione quella contenuta in ODP.

 

Proviamo a buttare giù degli esempi pratici:

  • Tutti gli spider indicizzano e seguono i links:
    <meta name="robots" content="index,follow" />
  • Gli spiders indicizzano ma non seguono i links:
    <meta name="robots" content="index,nofollow" />
  • Gli spider seguono i link della pagina senza indicizzarla:
    <meta name="robots" content="noindex,follow" />
  • Gli spider non indicizzano e non seguono:
    <meta name="robots" content="noindex,nofollow" />
  • Gli spider indicizzano, seguono, ma non archiviano la copia cache:
    <meta name="robots" content="index,follow,noarchive" />
    Se non indicato, i crawler archiviano la copia cache di default
  •  

    Quando le istruzioni del file robots.txt e del meta tag robots entrano in conflitto, gli spider prenderanno in considerazione la più restrittiva:

  • se nel robots.txt viene impedito allo spider di accedere alla pagina, esso non arriverà mai a leggere il meta tag e quindi non ne prendderà istruzioni
  • se si permette col robots.txt l'indicizzazione della pagina, ma la si blocca con ili meta, lo spider accederà alla pagina, leggerà i meta e di conseguenza non la indicizzerà.
  •  

    Sai già come utilizzare nel modo migliore i meta tag title, description e keywords

    Commenti (0)add
    ....

    busy
     

    © Copyright Nicola Antonelli 2008 - Vietata la riproduzione anche parziale
    joomla made