Algunos bots inadecuado ignorar htaccess?

  • mico
  • Beginner
  • Beginner
  • Avatar de Usuario
  • Registrado: Ago 14, 2007
  • Mensajes: 54
  • Loc: Neo Universe
  • Status: Offline

Nota Mayo 31st, 2010, 11:08 pm

ive estado tratando de agregar algunos robots de mal a mi htaccess pero ¿por qué los bots siguen llegando y hormigueo en mi sitio?
no lo escribo mal? aquí está (con esos de mantenimiento de venir-back bots):
Código: [ Select ]
RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [OR] <--or Baiduspider+ ?
RewriteCond %{HTTP_USER_AGENT} ^Googlebot [OR] <--i hate it much!
RewriteCond %{HTTP_USER_AGENT} ^msnbot [OR] <--directory index forbidden
RewriteCond %{HTTP_USER_AGENT} ^Twiceler [OR] <--the worst! worst! worst! directory index forbidden
RewriteCond %{HTTP_USER_AGENT} ^spbot
RewriteRule ^.* - [F,L]
  1. RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [OR] <--or Baiduspider+ ?
  2. RewriteCond %{HTTP_USER_AGENT} ^Googlebot [OR] <--i hate it much!
  3. RewriteCond %{HTTP_USER_AGENT} ^msnbot [OR] <--directory index forbidden
  4. RewriteCond %{HTTP_USER_AGENT} ^Twiceler [OR] <--the worst! worst! worst! directory index forbidden
  5. RewriteCond %{HTTP_USER_AGENT} ^spbot
  6. RewriteRule ^.* - [F,L]


cualquier error?

Y si añado "Yahoo! Slurp" a la lista, mi sitio web en el código de error 500 para que se accede.
cómos la forma correcta de escribir Yahoo! Slurp en la lista anterior?

gracias de antemano
  • Anonymous
  • Bot
  • No Avatar
  • Registrado: 25 Feb 2008
  • Mensajes: ?
  • Loc: Ozzuland
  • Status: Online

Nota Mayo 31st, 2010, 11:08 pm

  • joebert
  • Sledgehammer
  • Genius
  • No Avatar
  • Registrado: Feb 10, 2004
  • Mensajes: 13455
  • Loc: Florida
  • Status: Offline

Nota Junio 1st, 2010, 6:18 am

No hay nada que pueda hacer para evitar que se volver . Sólo se puede controlar lo que ven. Si usted mira en los archivos de registro para ellos, ¿está usted viendo HTTP 200 códigos de estado en Aceptar para sus peticiones, o estás viendo 403 Forbidden códigos de estado HTTP?

Cuando se agrega Yahoo, utilice "Slurp" en lugar de "Yahoo!".
Strong with this one, the sudo is.
  • mico
  • Beginner
  • Beginner
  • Avatar de Usuario
  • Registrado: Ago 14, 2007
  • Mensajes: 54
  • Loc: Neo Universe
  • Status: Offline

Nota Junio 1st, 2010, 8:49 am

Bien lo entiendo.
Ellos enviaron a 403.

Pero esta Twiceler seguir tratando de rastrear incluso prohibido / áreas protegidas y de los enlaces rotos ive fijos más tarde (era de su caché del acto anterior, tal vez?), Pero lo envió a 403 y 404 (un this me arrastra hacia fuera!) En d final de todos modos.

Gracias por ayudarme de nuevo, joebert maestro.
  • webmaster[+-]
  • Beginner
  • Beginner
  • Avatar de Usuario
  • Registrado: Dic 05, 2009
  • Mensajes: 44
  • Loc: UK
  • Status: Offline

Nota Junio 4th, 2010, 5:42 pm

Tal vez se le olvidó su vez Reescribirmotor en?

Esto debe ser antes de que su "badbot" líneas...

Código: [ Select ]
Options +FollowSymlinks
RewriteEngine on
  1. Options +FollowSymlinks
  2. RewriteEngine on


Utilice nombres bot exacta y redirigir a otra parte...Esto detendrá el rastreo de su sitio para siempre.


Pero realmente <3 Googlebot...:roll:
  • mico
  • Beginner
  • Beginner
  • Avatar de Usuario
  • Registrado: Ago 14, 2007
  • Mensajes: 54
  • Loc: Neo Universe
  • Status: Offline

Nota Junio 5th, 2010, 8:05 am

Gracias por responder webmaster d + [-]
Ive encendido. Pero de alguna manera esta maldita Twiceler parece fuera de control. Incluso optándose en la mayoría intenta tener acceso a zonas prohibidas. Apenas me divierte.

En realidad necesito Googlebot también ^ ^
Pero no me gusta su forma de lista de todas mis páginas enlazan cuando se supone que debe ser visto en cierto modo quiero (como marcos, significa que yo no quiero que nadie sabe d ruta enlaces directamente de google). Feo!

@ Clcheapshoes520
¿Cómo saber qué?
  • tastysite
  • Proficient
  • Proficient
  • Avatar de Usuario
  • Registrado: Abr 09, 2008
  • Mensajes: 349
  • Loc: Brighouse, West Yorkshire, England
  • Status: Offline

Nota Junio 6th, 2010, 12:39 am

Hay algunos robots que hacen caso omiso de sus htaccess no puede hacer mucho al respecto pero espero que vaya. sin embargo yo desorbitados Twiceler y costuras legítima por lo que no estoy seguro ¿Estás seguro de saber lo que responde a? Nunca he oído hablar de él y tiendo a bloquear todo el msn, pero (ahora bing) google (sé que lo han bloqueado, pero creo que el hecho de que es la búsqueda más utilizados compensa el ancho de banda) yahoo y todas las otras que encontramos que son buenas.

más - esto puede ser cierto para la mayoría de los sitios de búsqueda, pero hay dos googlebot Los robots de Google para los sitios y googleimagebot para obtener las imágenes de tu sitio si usted bloquea una que no bloquee el otro.
^__^
  • mico
  • Beginner
  • Beginner
  • Avatar de Usuario
  • Registrado: Ago 14, 2007
  • Mensajes: 54
  • Loc: Neo Universe
  • Status: Offline

Nota Junio 6th, 2010, 8:25 am

tastysite @
"Hay algunos robots que hacen caso omiso de htaccess"
WOW! Eso es sorprendente! Yo Tho htaccess es el todopoderoso que nada puede escapar de sus comandos. * * Pálida

No me importa si es legítimo o Twiceler sumthing, sabiendo que seguir intentando el acceso a directorios prohibido en mi sitio web.
Al final, puedo bloquear todas las IPs contra los robots de Twiceler.

Puse Granda bot googles en mi vigilancia. Pero no me gusta su ImageBot: p

Gracias por tu ayuda, tastysite!
  • mico
  • Beginner
  • Beginner
  • Avatar de Usuario
  • Registrado: Ago 14, 2007
  • Mensajes: 54
  • Loc: Neo Universe
  • Status: Offline

Nota Junio 14th, 2010, 8:45 pm

por cierto tengo un diablo más seguir tratando de agarrar mis datos a través de libwww-perl.
ive que añadir algunas formas de mi htaccess pero siguen viniendo. Alguien sabe cómo echar a libwww-perl de mi web?
sus siguen llegando todo el tiempo, todos los días :evil:

heres mi htaccess para que
Código: [ Select ]
RewriteCond %{HTTP_USER_AGENT} ^libwww-perl [OR]
RewriteCond %{HTTP_USER_AGENT} ^libwwwperl [OR]
RewriteCond %{HTTP_USER_AGENT} ^(libwww-perl|widow|wisenutbot|wwwoffle|xaldon|xenu|zeus|zyborg|anonymouse) [NC]
RewriteRule ^.* - [F,L]
  1. RewriteCond %{HTTP_USER_AGENT} ^libwww-perl [OR]
  2. RewriteCond %{HTTP_USER_AGENT} ^libwwwperl [OR]
  3. RewriteCond %{HTTP_USER_AGENT} ^(libwww-perl|widow|wisenutbot|wwwoffle|xaldon|xenu|zeus|zyborg|anonymouse) [NC]
  4. RewriteRule ^.* - [F,L]

Publicar Información

  • Total de mensajes en este tema: 8 mensajes
  • Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 107 invitados
  • No puede abrir nuevos temas en este Foro
  • No puede responder a temas en este Foro
  • No puede editar sus mensajes en este Foro
  • No puede borrar sus mensajes en este Foro
  • No puede enviar adjuntos en este Foro
 
 

© 2011 Unmelted, LLC. Ozzu® es una marca registrada de Unmelted, LLC