blog.intermol.com.br

JAVASCRIPT - MYSQL - PHP

Arquivo de 31 de Outubro de 2008

Google indexa conteúdo de texto digitalizado em formato PDF

O Google anunciou há pouco que agora é capaz de indexar documentos que tenham sido digitalizados para o formato PDF.

Isso significa que se alguém passa um livro num scanner, grava em formato PDF e coloca na web, o Google é capaz de ler este arquivo e utilizando sua tecnologia OCR, encontrar palavras individuais dentro do documento.

A tecnologia do sistema de busca varre cada vez mais tipos de documentos na web.

Sem comentários »