sábado, 7 de abril de 2012

Búsquedas de libros en Internet

Voy a describir un método que uso para buscar libros en Internet.


Este método lo he utilizado varias veces con éxito desde que se me ocurrió allá por Mayo de 2011.
Si buscamos por ejemplo en Google, un libro por su título, ello seguramente nos lleve a varias referencias al libro, notas, comentarios, citas, etc. Pero difícilmente nos lleve al libro en sí.
Por otro lado el saber popular indica que los "bots" o "web crawlers" de los motores de búsqueda visitan incansablemente las páginas de la web, buscando, indexando y reindexando páginas. De modo que si buscando un libro por su título, la cosa se pone difícil, podríamos probar de buscarlo por su contenido.
Entonces lo que necesitamos es alguna parte o trozo del libro. Esto se puede conseguir con Google books (http://books.google.com/) al menos para libros en inglés. Allí buscamos el libro y tratamos de encontrar una edición que contenga un "snippet view" (algo asi como una "miradita"). Una vez allí, buscamos alguna línea de texto, que contenga un texto "significativo" es decir una secuencia de palabras que no sean demasiado frecuentes, como por ejemplo "era una noche fría y lluviosa", pero tampoco demasiado significativo, de modo que lo podamos encontrar en citas, como por ejemplo "todos los hombres son mortales". Este texto que elijamos lo ponemos en el buscador de Google entre comillas (") y con un poco de surte (el método no es infalible) nos aparecerán algunos lugares en la web, donde aparezca esa secuencia de palabras exacta incluyendo, el libro mismo.
Por ejemplo hace poco estaba buscando el libro de Vance Packard: "The Mechanical Bride"
El link al libro en google books es:


http://books.google.com.ar/books?id=o3imPQAACAAJ


una vez allí, abajo en "Other Editions" seleccionamos alguna edición que tenga "Snippet view", por ejemplo:


http://books.google.com.ar/books?id=68nZAAAAIAAJ


notar que en algunos casos (como este) en esta pantalla no se menciona que este libro tenga snippet view, en la parte de "From inside the book" ponemos allí alguna palabra muy frecuente , como ser "the", en seguida se nos van a mostrar varias páginas. Elegimos por ejemplo de la página 123: "This ad presents a drama which touches many themes"
Poniendo estas palabras entre comillas en el buscador estándar de Google (http://www.google.com/), el resultado es:


http://dave.lab6.com/acid/dump/2003/McLuhanMechanicalBride.htm


que es justamente una página que en este caso contiene el texto completo del libro en cuestión.
Es conveniente revisar bastante los textos antes de ponerse a leerlos, ya que a veces se encuentran incompletos, con errores de OCR, etc. Pero con algo de trabajo y paciencia, en general es posible hacerse de muy buenos libros de esta forma.


Nota 1: Si al libro no lo puedes encontrar en Google Books, puedes probar con Amazon, que también para algunos libros permite "look inside".


Nota 2: Si bien Google books, nos muestra versiones "crippled" es decir tullidas o limitadas de los libros, y no nos permite marcar y copiar texto y en general sólo nos deja ver algunas páginas, esto suele ser suficiente para poder encontrar la obra completa en algún otro lado.


Comentario:
El primer libro que encontré de este modo fue "Ubik" de Philip K. Dick, que incluso hoy aun se lo puede encontrar donde yo lo halle, en una página rusa:


http://sickmyduck.narod.ru/dick25-0.html


sin embargo, cuando ahora pruebo de encontrarlo por este método, no lo puedo hallar. Es curioso pensar por qué esta página que en algún momento estuvo indexada por Google, ya no lo está.


7 de Abril de 2012.

esta imágen fue creada con wordle (http://www.wordle.net/)