|
Notizie su google italiano, novità e strumenti google
|
Il blog ufficiale di Google ha appena annunciato che il crawler di google riuscirà ad analizzare i contenuti dei pdf provenienti dallo scanner. Ma come può google fare questo? Attraverso "Optical Character Recognition". Gli utilizzatori di Adobe Acrobat Professional conoscono questo processo.. Quando un documento stampato è convertito in PDF attraverso uno scanner, l'unico modo per permetterne l'indicizzazione da parte del motore di ricerca, è attraverso il processo OCR che è una funzionlità di Adobe Acrobat Professional (e altri programmi con funzioni simili). Questa "semplice" ma molto utile caratteristica delle ricerche di Google, evidenzia ancora una volta come Google sappia prevalere sulla sua concorrenza. Con così tanti documenti in PDF resi disponibili nella rete, era giunto il momento per i motori di ricerca di organizzare i documenti in PDF non solamente in base ai loro metadata, ma soprattutto in base ai loro contenuti.
Condividi articolo
invia
Hits: 783 Commenti
(0)
|
© Copyright Nicola Antonelli 2008 - Vietata la riproduzione anche parziale
joomla made