Notizie seo Notizie google in italiano

     
Antonico.com Home Motori di ricerca
I motori di ricerca: cosa sono e come funzionano
Giovedì 07 Agosto 2008 00:00
Cos'è un motore di ricerca?

Il motore di ricerca è un sito internet, o meglio un sistema che analizza automaticamente una quantità enorme di dati e contenuti spesso da lui stesso immagazzinati e restituisce una lista dei contenuti disponibili classificandoli ed ordinandoli in base ad algoritmi matematici che ne indicano il grado di attinenza e rilevanza data una determinata chiave di ricerca.

In rete ci sono numerosi motori di ricerca attivi. Sicuramente il più famoso ed utilizzato a livello mondiale è Google, con i suoi quasi 9 miliardi di pagine in archivio. Molto utilizzati anche Yahoo e Live Search di Microsoft, pur rimanendo notevolmente indietro rispetto a Big G. Google è stato fondato da Larry Page e Sergei Brin dell'Università di Stanford nel 1998 con la convinzione che le relazioni esistenti tra i siti presenti nel web potessero fornire la miglior base per la creazione del nuovo sistema.

 

Come funziona il motore di ricerca?

Il funzionamento del motore di ricerca si può suddividere in tre principali fasi:

  • Analisi e scoperta di dati e contenuti da parte del crawler o spider;
  • Indicizzazione e catalogazione del materiale ottenuto;
  • Risposta alle richieste dell'utente con la presentazione dei risultati di ricerca

Analisi

Per analizzare il web ed immagazzinare dati, il motore di ricerca utilizza dei software chiamati spider o crawler. Per semplificare possiamo immaginare appunto la rete web (tutte le pagine e documenti presenti in tutti i siti internet mondiali... si parla di miliardi di dati) e gli spider (ragni virtuali) che vagano per la stessa, tenendo in memoria ogni posto visitato. Ma come fanno gli spider a trovare tutti i contenuti presenti in rete? Partendo dai siti che il sistema ha immagazzinato in archivio (o meglio indicizzato) i ragnetti seguono tutti i link che trovano nelle pagine passando di pagina in pagina, da portale a portale, memorizzando tutto quello che vedono.

Cosa vede lo spider del motore di ricerca?

Per capire intuitivamente cosa il motore, o meglio gli spider non leggono basta aver presente il loro obiettivo: tenere traccia di quali informazioni il sito presenta ed indicare al navigatore quei siti che hanno maggior attinenza reale con la ricerca che sta eseguendo. Attinenza reale in quanto allo spider non interessano parole inserite a caso nei testi, piuttosto considera la totalità dei contenuti della pagina, del sito, dei siti collegati ad esso.

Per far si che questo sia possibile il software del motore di ricerca deve poter leggere le informazioni ed indicizzarle: tutto quello che non è leggibile, non è indicizzabile. Il crawler tenta di assomigliare il più possibile all'occhio umano ma ovviamente non potrà mai avere le stesse capacità di apprendimento. L'immagine di un tramonto al mare non può comunicare al motore di ricerca ciò che comunica all'utente ma i dati che l'immagine porta dentro di se (tag alt, nome del file ed eventuale link ad essa collegato) fanno capire allo spider se essa fornisce indicazioni importanti a chi la vede. Quindi in generale possiamo dire che lo spider tiene in considerazione i dati visibili del codice HTML e se ne frega di javascript, delle parti in ASP e PHP, e dei contenuti nascosti. Idem per Flash che, essendo un'immagine o un insieme di fotogrammi, non può essere interpretato dal crowler al pari dell'occhio umano.

Indicizzazione

Come dicevamo, lo spider memorizza tutto ciò che riesce a vedere dei siti internet e archivia, o meglio indicizza, le pagine ottenute negli immensi database. I processi di indicizzazione variano da motore di ricerca a motore di ricerca in quanto gli algoritmi differenti dànno maggiore importanza a certi parametri piuttosto che ad altri. La parte testuale che è stata archiviata durante questa fase verrà successivamente analizzata per fornire le risposte alle ricerche degli utenti. La maggior parte dei motori di ricerca dànno la possibilità al navigatore di vederela copia dei dati testuali di ogni pagina archiviata per quando la risorsa originale è irraggiungibile: questa è la copia cache.

Presentazione dei risultati della ricerca (serp)

Quando si effettua una ricerca sul motore, esso restituisce i risultati organizzando per importanza tutti i siti internet trovati per la data frase di ricerca. I motori di ricerca utilizzano algoritmi sempre più 'sottili' per stabilire quali siti far apparire nelle prime posizioni o comunque per stabilire l'ordine di presentazione dei risultati. Non dobbiamo mai dimenticare lo scopo principale del motore ovvero trovare il sito internet più coerente, completo e in generale il più utile per l'utente che effettua una ricerca nella rete: per questo motivo sono di fondamentale importanza i contenuti che il portale contiene e in che modo sono organizzate le pagine dello stesso. Si deve ricordare che i sistemi di classificazione dei siti nelle serp tengono conto soprattutto dell'utilità del sito, della sua popolarità e della sua capacità di soddisfare la richiesta dell'utente.

I principali (ma assolutamente non gli unici) parametri in base ai quali i siti vengono presentati e 'promossi' nei risultati sono:

  • I contenuti testuali delle pagine internet

Senza dubbio il principale fattore che incide sul posizionamento di un sito internet nei risultati delle ricerche di un motore di ricerca è rappresentato dai contenuti testuali che si trovano nelle pagine del portale. Più un argomento è trattato nel sito e più sarà preso in considerazione nella ricerca, ecco perchè i contenuti testuali sono molto importanti per l'attività di posizionamento.

  • Parole chiave o meglio 'key phrases'

Le parole chiave sono quelle parole che l'utente inserisce nella casella di ricerca del motore per trovare le informazioni che desidera conoscere. Esse non vengono più intese come singole parole, ma come 'key phrases' ovvero frasi chiave: è ormai molto raro che vengano ricercate singole parole tramite i motori, ma anzi due o più keys... migliorano i motori di ricerca e migliorano anche le capacità di ricerca degli utenti. All'interno delle pagine del sito devono essere quindi presenti le keys per le quali il sito vuol essere posizionato: se il motore non trova nemmeno una volta la frase che l'utente cerca come può essere preso in considerazione nelle serp? Ecco perchè è importantissimo lo studio e l'analisi di keywords e key phrases (vedi la guida al posizionamento nei motori di ricerca).

  • Popolarità del sito

Negli ulimi anni ha acquistato sempre più peso la popolarità o l'autorevolezza di un sito internet nei criteri usati dai motori di ricerca per la stabilire la classifica dei risultati: i siti più popolari riescono a scalare le serp ed occupare le prime posizioni nelle stesse a discapito dei portali meno conosciuti o stimati. I vari motori di ricerca usano differenti parametri nel conteggio dei link in ingresso al sito (sono i backlink a far diventare il sito popolare) che ne rappresentano appunto l'autorevolezza. Il peso dei link in ingresso non è uguale per ognuno di essi infatti link spontanei provenienti da siti di società importanti e conosciute, magari che trattano lo stesso tema hanno molto più peso rispetto ad un link scambiato con siti di pochissima rilevanza.

A proposito è utile menzionare il PageRank. Esso è un algoritmo di analisi che prende nome dal suo inventore, Larry Page, fondatore di Google, e che assegna un peso numerico ad ogni collegamento ipertestuale (link) all'interno della rete di documenti del World Wide Web con l'intento di quantificare la sua importanza relativa all'interno della serie. Il PageRank è riconducibile semplificando alla concezione di popolarità in un ambiente sociale e si prefigge di indicare le pagine con maggiore rilevanza in relazione alle query di ricerca. Tale dato è utilizzato dai motori (sostanzialmente da Google) per definirne la posizione nei risultati della ricerca. Il PageRank è assolutamente democratico nel quale la votazione è permessa dalla semplice pubblicazione di un link in una pagine web; maggiore sarà la popolarità di un sito e maggiore sarà il valore dei voti (link) espressi.

 

I principali motori di ricerca

Google

Google

Senza dubbio il principale motore di ricerca utillizzato a livello mondiale e nazionale è Google. Con il suo 61.9% del totale dei motori di ricerca utilizzati occupa la posizione dominante nell'universo Search Engine. Il termine google deriva dalla definizione del matematico americano Milton Sirotta "googol" col quale si definisce il numero 1 seguito da 100 zeri. Come indicato nella parte istituzionale il termine, modificato in google per questioni di stile, indica perfettamente la mission del motore di ricerca che si prefigge di organizzare e categorizzare l'immenso numero di dati che si trovano nel World Wide Web.

Yahoo

E' un'importante società americana di servizi internet. Yahoo! è stata fondata nel 1994 da David Filo e Jerry Yang allora studenti della Stanford University, nasce come directory per la categorizzazione di link ampliando poi il suo campo d'azione integrando la directory con il motore di ricerca. Il nome è acronimo di Yet Another Hierarchical Officious Oracle ed è anche il nome di una delle città infernali citate da Calvino in Città Invisibili e il nome del popolo primitivo incontrato da Gulliver. Il secondo motore di ricerca per traffico generato offre una serie di funzionalità interessanti per l'utenza finale come ad esempio le Yahoo! answer.

Live Search

Live Search 

Sviluppato da Microsoft, in precedenza era MSN Search, Live Search occupa una parte marginale nel complesso delle ricerche sui motori di ricerca quasi monopolizzate da Mister Google. Offre comunque diverse funzionalità interessanti come la capacità di mostrare i risultati per più query di ricerca contemporaneamente o la possibilità di regolare le opzioni di ricerca come titolo, breve riassunto o descrizionie. Permette anche di salvare le ricerche e di vederle aggiornate su Live.com.

Altri motori di ricerca nazionali ed internazionali

Altavista - Lycos - Virgilio - Excite - Arianna - Ask - Alltheweb

 

Le directory

C'è una sostanziale differenza fra i motori di ricerca e le così dette directory. I primi, come abbiamo visto, riescono ad effettuare una ricerca tra tutte (ovvero tutte quelle che è in grado di trovare e analizzare) le pagine web presenti nella rete e rispondono alla richiesta dell'utente ordinando i siti per attinenza alla chiave di ricerca. Le directory invece sono dei portali che raggruppano un notevole numero di siti suddividendoli per categoria o argomento. Sono una sorta di grande elenco ordinato nel quale l'utente può trovare la risorsa che più si avvicina alla sua richiesta. La madre delle directory è senza dubbio DMOZ che suddivide i siti di tutto il mondo in categorie territoriali e tematiche: spesso i motori di ricerca si "appoggiano" alle directory per acquisire siti utili come google ad esempio che a volte prende la descrizione del portale in oggetto da DMOZ e la inserisce automaticamente sotto il titolo nelle serp. L'inserimento nelle directory non è immediato e viene effettuato manualmente seguendo regole di usabilità, utilità e correttezza del sito segnalato.

Directory Yahoo - Directory Google - DMOZ

Commenti (0)add
....

busy
 

© Copyright Nicola Antonelli 2008 - Vietata la riproduzione anche parziale
joomla made