Willkommen in der Webstatt Zum Webstatt Blog und Stories
Kevz am 17.07.06 22:12

Greetz,
gibt es eine möglichkeit anhand des User Agenten von Bots und Usern zu unterscheiden? Sprich, irgendwelche kennzeichen durch die sich Bots immer äußern, bzw. sich herausfinden lassen? Wenn ja wie?, weil ich suche derzeit nach einer möglichkeit eine Statistik ziemlich sauber zu halten...
Doch die Bots, nya, muss man erstmal Filtern...

netcup.de Warum gibt es hier Werbung?
bastey bastey am 18.07.06 01:54

Es gibt eine Liste mit IPs der bekanten Bots.

RewriteEngine on
# Spambots nach User_agent aussperren
RewriteCond %{HTTP_USER_AGENT} ^.*Whacker.*$ [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailCollector [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailSiphon [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailWolf [OR]
RewriteCond %{HTTP_USER_AGENT} ^.*FileHound.*$ [OR]
RewriteCond %{HTTP_USER_AGENT} ^.*TurnitinBot.*$ [OR]
RewriteCond %{HTTP_USER_AGENT} ^.*JoBo.*$ [OR]
RewriteCond %{HTTP_USER_AGENT} ^.*adressendeutschland.*$
RewriteRule ^.* - [F]


Weitere Informationen: http://www.modrewrite.de/13.13.0.0.1.0.phtml
Die Liste mit SpamBot-IPs: http://www.spywareinfo.com/harvest_project/spambots.txt

fish fish am 09.08.06 13:17

ich habe die liste mit den ips mal komplett auf meine seite angewandt gehabt, ergebis: ich min ein spambot und durfte auch nicht hinein.

Franky Franky am 09.08.06 15:54

wenn ich ein spambot wäre würde ich mich als mozilla identifizieren ;D
da helfen nur captchas...

Barabbas Barabbas am 09.08.06 16:59

Falls du aber Suchmaschinenbots meinst: Die geben sich eigentlich immer zu erkennen, auch dazu gibt es Listen. So kannst du die zumindest rausfiltern.

lG

brb

Creative Commons Lizenzvertrag
Alle Inhalte des Webstatt-Archivs stehen unter einer Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Unported Lizenz.

Impressum & Kontakt