Tengo un Spider malvado que no atiende a bloqueos en robots.txt y me ataca desde multiples IP y por tanto no puedo bloquearlo por IP.
Lo he detectado porque me tira mi sitio web (tiene millones de paginas) detecta accesos bestiales de un agente de un spider conocido por su dificultad de bloqueo, pues no atiende a ningún tipo de peticiones (es un sitio 80legs.com que actúa así con premeditación y es mas que oscuro el motivo de sus búsquedas, por no decir vulgares spammers).
Me voy a log de mi servidor apache:
Quote::
cd /var/www/vhosts/midominio.com/statistics/logs
tail -200 access_log
Abro las ultimas lineas y me lo encuentro alli, pidiendo páginas como una metralleta.
74.129.176.213 - - [12/Sep/2010:15:35:33 +0200] "GET /index.php?name=Your_Account&profile=54753 HTTP/1.1" 200 4539 "-" "Mozilla/5.0 (compatible; 008/0.83; www.80legs.com/spider.html) Gecko/2008032620"
24.23.117.201 - - [12/Sep/2010:15:35:34 +0200] "GET /foros.php?p=2022478 HTTP/1.1" 200 11844 "-" "Mozilla/5.0 (compatible; 008/0.83; www.80legs.com/spider.html) Gecko/2008032620"
74.129.176.213 - - [12/Sep/2010:15:35:35 +0200] "GET /foros.php?p=2024284 HTTP/1.1" 200... Leer más ... |