Cómo proteger nuestras imágenes de los robots

Hay sitios que deliberadamente buscan e indexan imágenes agregándolas en su servidor. De esta forma, cualquiera que busque en Internet información referente a vuestra imagen, puede fácilmente llegar a ella, copiarla y re-publicarla después como propia, aunque nuestra imagen esté claramente protegida con copyright, y lo que es peor, sin siquiera haber pasado por vuestro sitio.

Es lo que le sucede a miles de fotógrafos, artistas, diseñadores Web, etc. Hasta se ha llegado a demandas judiciales en algunos casos.

Pero hay una manera muy sencilla de evitar esto, y más fácil es aún si poseemos nuestro propio dominio. Sólo es necesario un simple Robot.txt, del que ya hemos hablado antes.

Compondremos el Robot.txt de la siguiente manera:

User-agent: vscooter
User-agent: DittoSpyder
User-agent: Googlebot-image
User-agent: psbot
Disallow: /

User-agent: Googlebot
Disallow: /*.gif$
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.png$

En el caso de VSCOOTER, éste es el nombre del rastreador de imágenes de Alta Vista, con este código evitamos que la molesta arañita llamada “Scooter” entre en nuestro sitio para indexar archivos, pero al agregarle el prefijo V hablitamos al robot a indexar el sitio para figurar en las búsquedas. Lo mismo pasa con Google, al que sólo impediremos indexar imágenes con el código “GOOGLEBOT-IMAGES“.

DITTOSPYDER es el robot de Ditto.com. Lo único que hace este sitio es indexar imágenes, así que no lo queremos para nada dentro del nuestro, ¿verdad?. PSBOT, de Picsearch, otro sitio que sólo indexa imágenes, tampoco lo dejaremos entrar.

Vale aclarar que hemos puesto como ejemplo los archivos de imagen, pero también sirve para otros archivos, como los multimedia (Wav, MP3, Zip, Mid, etc.), sólo basta con agregarlos al Robot.txt y poner los códigos de los robots que queramos evitar.

Otra forma de proteger nuestras imágenes es el uso de algunos Meta Tag, entre <head> y </head> en nuestro html, pondremos lo siguiente:

<META NAME=”robots” CONTENT=”noimageindex”>

El problema con este sistema es que no todos los robots reconocen este tag, aunque funciona perfectamente con Alta Vista. Pero si verdaderamente queremos proteger nuestras imágenes, cambiaremos el tag por este:

<META NAME=”robots” CONTENT=”noindex”>

Este tag es como un arma de doble filo, ya que corremos el riesgo de que la totalidad de nuestro sitio quede fuera del rastreo.

Luego de hacer esto, deberemos confirmar que los sitios han eliminado nuestras imágenes de su servidor. Con Alta Vista, deberemos indexar nuestro sitio nuevamente y ellos automáticamente removerán el material prohibido una vez que encuentren el Robot.txt.

En el caso de Ditto, deberemos pedir que eliminen nuestro sitio de su base de datos, mediante el link de contacto.

Google borrará automáticamente las imágenes la próxima vez que rastree nuestra página, por lo que no es necesario realizar ninguna acción además del Robot.txt.

You may also like...

3 Responses

  1. David dice:

    Pues yo tengo montones de errores del tipo:

    public_html/wp-content/themes/mitheme/images/mini-footer-comments.gif/

    Que como siempre son imágenes imagino que es un bot de imágenes. Tengo puesto en el robots:

    # Disallow directory
    User-agent: *
    Disallow: /web/
    Disallow: /wp-admin/
    Disallow: /wp-includes/
    Disallow: /wp-content/
    Disallow: /wp-
    Disallow: /feed/
    Disallow: /trackback/
    Disallow: /rss/
    Disallow: /comments/feed/
    Disallow: /page/
    Disallow: /date/
    Disallow: /comments/
    Disallow: /galeria/

    que entre ellos están los directorios de las imágenes.
    Ahora he puesto lo que nos propones a ver que tal.

  2. ARC 7 dice:

    Me gustaria saber si el bot de google para imagenes es Googlebot-image o Googlebot-images porque en un sitio lo pones de una manera y un poco más abajo le añades la s final, muchas gracias y muy buen post!.

  3. ARC 7: Mil perdones por la demora en responderte, es que recién veo tu comentario :s

    Efectivamente, la ‘S’ que puse después está de más, es en singular.

    Saludos!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>