Bajando Libros Completos con Restricciones en Google Books

Aquí conseguiréis ayuda sobre todos los temas relacionados con la digitalización.

Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor Fabio Picasso » 16 Dic 2008, 23:38

BAJANDO LIBROS COMPLETOS CON COPYRIGHT DE GOOGLE BOOKS

Introducción:
Todos hemos bajado libros de Google Books alguna vez, indudable se trata de una fuente inagotable de información , sobretodo cuando se puede acceder por una búsqueda por palabras. Los libros disponibles en formato PDF pueden ser descargados a una apreciable velocidad sin mayores contratiempos.
Pero que hay de aquellos no disponibles (con copyright vencido) y los que poseen copyright vigente pero están COMPLETOS.
En ambos casos no pueden descargarse directamente. En este post explico brevemente como hacerse de ellos con más o menos esfuerzo.

1-Libros con derechos sin vigencia:
Muchas veces Google Books pone en su búsqueda que no se hayan disponibles pero desde que se han asociado a Internet Archive es posible que allí se encuentren alojados los ansiados PDFs. Para ello comenzar la búsqueda en Google Books y ante la eventualidad de hallar un libro sin descarga y con copyright libre ponerlo en el buscador de Internet Archive: http://www.archive.org/details/texts
Allí en la ficha de cada obra aparece en el cuadro de la izquierda los formatos de descarga. Si uno acciona el pdf directamente desde allí es muy probable que lo lleve a la página de Google Books desde la cual partimos. Un poco más abajo en el mismo recuadro figura un link que dice HTTP, se trata de una página con formato INDEX en la que aparecen TODOS los formatos de imagen del libro, incluyendo los PDFs. Y hasta las imágenes ORIGINALES con máxima resolución. Desde allí podemos descargarlos sin problemas.

2-Libros con Copyright:
Se trata de los más difíciles de obtener. Por cuanto no aparecen los PDFs en ningún sitio, ni Google Books ni Internet Archive. Tampoco los formatos de imágenes pueden capturarse desde cada libro con programas como Hypersnap y otros capturadores de pantalla. Esto es debido a que las imágenes NO ESTÁN DONDE UNO CREE QUE ESTÁN. Google ha implementado este sistema en el cual cada imagen de una hoja del libro es el FONDO o BACKGROUND de la página web.
¿Cómo hacer entonces? En diseño web el fondo de una página puede ser un color liso o bien una imagen. Cuando es una imagen la misma está vinculada a una URL. Por lo tanto si Google pone esas páginas como fondos deben tener una URL específica.
La solución aunque lenta es sencilla. En el navegador Internet Explorer ir al menú VER. Y allí seleccionar CODIGO FUENTE. Es el código de diseño de cada página.
Para trabajar ordenadamente debemos primero seleccionar en el libro que tenemos para bajar la opción VISTA EN HTML que se halla en el extremo inferior derecho de la página.
Luego avanzamos una a una y en el menú VER revelamos el CÓDIGO FUENTE.
El código es una tremendo lío de letras y números, pero nosotros buscamos la URL que figura luego de la palabra BACKGROUND. Simplemente ponemos buscar “background” y aparece la URL. La copiamos en el mouse y la ponemos en el navegador.
¡¡¡Eureka!!! Habremos conseguido la imagen SOLA limpia en formato PNG. Bastará bajarla a la PC y luego de numerarlas compilarlas en PDF.

Conclusiones:
He medido el tiempo necesario para bajar cada página realizando esa operatoria y lo podemos estimar en 30 segundos dependiendo de la velocidad. Un libro de 300 páginas podría demorar unos 2,5 horas en bajarse completo. Bien vale la pena realizar este trabajo. La idea sería asociarnos varios colegas para acelerar los tiempos y lograr más eficiencia y mejores resultados. Desde ya estoy a disposición para cualquier consulta respecto a este procedimiento.
Avatar de Usuario
Fabio Picasso
 
Mensajes: 143
Registrado: 11 Mar 2008, 22:32
Ubicación: Buenos Aires , Argentina

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor Jose Vergara » 19 Dic 2008, 20:32

Hola Fabio, muy interesante tus técnicas y muchísimas gracias por compartirlas.

Vamos a ver cómo cae tu propuesta entre los usuarios del foro. Esperaremos un tiempo prudencial.
Avatar de Usuario
Jose Vergara
Administrador del Sitio
 
Mensajes: 1042
Registrado: 26 Feb 2008, 00:50

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor umagana » 23 Mar 2009, 10:05

Hola Fabio, sabes que he seguido tus instrucciones pero no he tenido éxito, en las páginas que aparecen selecciono MODO HTML BASICO y después, en el código fuente donde encuentro la palabra BACKGROUND, copio la liga que se encuentra a la derecha entre paréntesis en otra pestaña del IE donde me muestra la imágen (PNG) pero sólo de las páginas que permiten ver. ¿Podrías ayudarme para saber qué paso estoy omitiendo o estoy haciendo mal?
umagana
 
Mensajes: 4
Registrado: 23 Mar 2009, 09:34

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor Jose Vergara » 23 Mar 2009, 12:01

Bienvenido al foro, umagana. Si quieres, puedes presentarte a los demás miembros del foro en el área correspondiente.

Para tu pregunta, los libros con copyright te permiten ver un número limitado de páginas.

A veces unas, a veces otras, o a veces siempre las mismas. También depende del navegador que uses. Fabio ha descubierto que en Windows 98 y el Internet Explorer puede ver cosas que con sistemas operativos modernos no puede.

Por ejemplo, pongamos este libro con copyright.

http://books.google.com/books?id=mRx5Da ... utput=html

Fabio, umagana y quien quiera probarlo, decirme qué páginas podeis descargaros y qué navegador usais y con qué sistema operativo.

Yo por ejemplo, me he descargado la portada pero en formato JPG.
Avatar de Usuario
Jose Vergara
Administrador del Sitio
 
Mensajes: 1042
Registrado: 26 Feb 2008, 00:50

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor umagana » 23 Mar 2009, 17:26

Jose Vergara escribió:Bienvenido al foro, umagana. Si quieres, puedes presentarte a los demás miembros del foro en el área correspondiente.

Para tu pregunta, los libros con copyright te permiten ver un número limitado de páginas.

A veces unas, a veces otras, o a veces siempre las mismas. También depende del navegador que uses. Fabio ha descubierto que en Windows 98 y el Internet Explorer puede ver cosas que con sistemas operativos modernos no puede.

Por ejemplo, pongamos este libro con copyright.

http://books.google.com/books?id=mRx5Da ... utput=html

Fabio, umagana y quien quiera probarlo, decirme qué páginas podeis descargaros y qué navegador usais y con qué sistema operativo.

Yo por ejemplo, me he descargado la portada pero en formato JPG.


Gracias amigo, pues creo que lo voy a intentar con Windows 98 e Internet Explorer instalado en una máquina virtual para ver cómo funciona.
umagana
 
Mensajes: 4
Registrado: 23 Mar 2009, 09:34

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor Jose Vergara » 23 Mar 2009, 23:31

He estado mirando en Taringa por curiosidad las maneras que exponen ahí de cómo bajar los libros de Google Books.

He probado este método y este otro método y ninguno me ha convencido. Sobre todo porque te automatiza la descarga de imágenes que en teoría te "permite" Google ver. Pero no las que están ocultas...

Ahora después cuento lo que he descubierto para solucionar eso. Pero es un método manual. ;)
Avatar de Usuario
Jose Vergara
Administrador del Sitio
 
Mensajes: 1042
Registrado: 26 Feb 2008, 00:50

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor umagana » 25 Mar 2009, 08:54

Ya he probado con Win 98 e IE 5 instalados en una máquina virtual creada con Virtual PC y lo que se puede observar es que la url es un poco diferente al IE 7 con Win XP SP3, pero además algunas de las páginas que no se pueden visualizar normalmente, si se muestran tecleando el número de la página directamente en la url, pero sólo algunas.
umagana
 
Mensajes: 4
Registrado: 23 Mar 2009, 09:34

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor Jose Vergara » 25 Mar 2009, 13:28

umagana escribió:Ya he probado con Win 98 e IE 5 instalados en una máquina virtual creada con Virtual PC y lo que se puede observar es que la url es un poco diferente al IE 7 con Win XP SP3, pero además algunas de las páginas que no se pueden visualizar normalmente, si se muestran tecleando el número de la página directamente en la url, pero sólo algunas.


Sí, algo así he detectado yo también.

A ver si tengo tiempo y pongo un pequeño tutorial de cómo conseguir páginas que están ocultas.
Avatar de Usuario
Jose Vergara
Administrador del Sitio
 
Mensajes: 1042
Registrado: 26 Feb 2008, 00:50

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor ecege » 07 Abr 2009, 19:15

Hola, me presento soy Eleonora y estoy muy interesada en saber si se pudo solucionar la descarga de las páginas que están "restringidas", "ausentes" o cómo sea que se les diga... Pasa que desde mi país, los libros que he descargado de forma incompleta son muy caros y realmente en uno en particular, lo necesito. Gracias por ser tan claro y didáctico para explicar todo. ¿Qué programa puedo usar para convertir la extensión png a pdf? Uso windows vista. Eleonora, saludos a todos... :mrgreen:
ecege
 
Mensajes: 1
Registrado: 07 Abr 2009, 19:07

Re: Bajando Libros Completos con Restricciones en Google Books

UNREAD_POSTpor Jose Vergara » 08 Abr 2009, 15:53

Hola Eleanora, mujer bonaerense, después de investigar y poder descargar casi la totalidad de un libro hemos hallado que siempre quedan un par de hojas del libro que son imposibles de descargar, así que siempre te quedarías con un libro cojo.
Avatar de Usuario
Jose Vergara
Administrador del Sitio
 
Mensajes: 1042
Registrado: 26 Feb 2008, 00:50

Siguiente

Volver a Soporte técnico digitalización

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 1 invitado