TEI - Tecnologia e Igualdad. Home // Centro CAO. UBA. FADU. DGPC. Cátedra Díaz Cortez. Leonardo Caggiano, Rodrigo Ayala, Alejandro Moran

			Registrate GRATIS en nuestra base de datos y accede a los foros de debate y recibi nuestro newsletter semanal.
usuario
contraseña

Google y los textos escaneados en PDF

Fuente: GoogleBlog

Google indexa con tecnología OCR (Reconocedor de Caracteres Ópticos) contenidos de documentos PDF de textos escaneados.

La mayoría de los documentos con textos en formato PDF que hay en la WWW son generados a partir editores de texto, con lo que cualquiera (un usuario con un programa como 'Adobe Reader' o Evince, o el propio robot de Google) puede extraer de manera muy fácil los contenidos.

Pero un porcentaje de estos ficheros PDF son imágenes escaneadas de otros documentos, con lo que ya no podemos extraer el texto con nuestro lector PDF. Pero el robot de Google, gracias a su tecnología OCR propia (Reconocedor de Caracteres Ópticos) , ya es capaz de convertir estas imágenes en textos, e indexarlos para incorporarlos al buscador web.

Link Relacionado:	Buscador Google optimizado para personas con discapacidad visual

20.11.08

TELETRABAJO

¿Es el teletrabajo una opción de inclusión laboral para personas con discapacidad?

ver noticia

15.11.08

TALLERES

Taller de accesibilidad Web para sitios gubernamentales.

Accesibilidad Web

Telefonia pública para hipoacúsicos

Normativa vigente

Ubicación de los teléfonos

Tecnología asistiva

Información general

¿Está de acuerdo con el proyecto de ley por el cumplimiento de normas de internet obligatorias para los sitios argentinos?

Sí, estoy de acuerdo.

No, no serviría de nada.

No, no es importante.

home - info - quienes somos - descargas - prensa - web - contacto
© Todos los derechos reservados. 2008
Este sitio está realizado de acuerdo a las directríces de Accesibilidad para el contenido Web de acuerdo al W3C en su código XHTML y CSS