Notizie seo Notizie google in italiano

     
Antonico.com Home Notizie seo Notizie google Google indicizza i file in .pdf provenienti da scanner
Notizie su google italiano, novità e strumenti google
Google indicizza i file in .pdf provenienti da scanner
Notizie google in italiano
Lunedì 03 Novembre 2008 10:27

file adobe pdfE' arrivato il giorno in cui i documenti pdf provenienti da scanner vengono analizzati ed indicizzati da Googlebot, lo spider di Google, secondo i loro contenuti. Fin'ora Google riusciva ad effettuare le ricerche solamente all'interno di files in PDF che venivano convertiti da un file di testo. Lo spider googlebot lasciava fuori quei documenti in PDF provenienti da scanner perchè considerati immagini. Non succede più così.

Il blog ufficiale di Google ha appena annunciato che il crawler di google riuscirà ad analizzare i contenuti dei pdf provenienti dallo scanner.

Ma come può google fare questo? Attraverso "Optical Character Recognition". Gli utilizzatori di Adobe Acrobat Professional conoscono questo processo.. Quando un documento stampato è convertito in PDF attraverso uno scanner, l'unico modo per permetterne l'indicizzazione da parte del motore di ricerca, è attraverso il processo OCR che è una funzionlità di Adobe Acrobat Professional (e altri programmi con funzioni simili).

Questa "semplice" ma molto utile caratteristica delle ricerche di Google, evidenzia ancora una volta come Google sappia prevalere sulla sua concorrenza. Con così tanti documenti in PDF resi disponibili nella rete, era giunto il momento per i motori di ricerca di organizzare i documenti in PDF non solamente in base ai loro metadata, ma soprattutto in base ai loro contenuti.

Commenti (0)add
....

busy
 

Nicola Antonelli
My Facebook
LinkedIn profile
Twitter profile


© Copyright Nicola Antonelli 2008 - Vietata la riproduzione anche parziale
joomla made