Arquivo de 31 de Outubro de 2008
Google indexa conteúdo de texto digitalizado em formato PDF
O Google anunciou há pouco que agora é capaz de indexar documentos que tenham sido digitalizados para o formato PDF.
Isso significa que se alguém passa um livro num scanner, grava em formato PDF e coloca na web, o Google é capaz de ler este arquivo e utilizando sua tecnologia OCR, encontrar palavras individuais dentro do documento.
A tecnologia do sistema de busca varre cada vez mais tipos de documentos na web.
Sem comentários »