Zugriff auf Webserver für hartnäckige Spammer blockieren

In diesem Artikel habe ich euch das Plugin WP-SpamFree-Plugin vorgestellt. Ich habe es nun einige Wochen erfolgreich im Einsatz und bin über den Wirkungsgrad hoch erfreut. Nahezu 100% Trefferquote. Mittlerweile sind schon weit über 200 Spam-Kommentare geblockt worden. Wenn ich die alle manuell hätte löschen müssen…

Nun ist ja bekannt, dass Spam von sogenannten Spambots in Umlauf gebracht werden. Wikipedia erklärt Spambots wie folgt:

Ein Spambot ist ein Programm (Bot), welches das Internet gezielt nach E-Mail-Adressen (auch Telefonnummern) oder Blogs absucht, um an diese Werbung (Spam) zu verschicken. Manche Webcrawler sind in der Lage, Webseiten im World Wide Web, ebenso wie Newsgroups und Chatkonversationen zu durchsuchen. Da E-Mail-Adressen einem einheitlichen Format folgen, sind Spambots vergleichsweise einfach zu schreiben.

Der Begriff Spambot wird zum Teil auch für Programme genutzt, die unerwünschte Werbe-E-Mails ausfiltern. Solche Programme werden jedoch häufiger Spamfilter genannt.

Um Spam-E-Mails zu entgehen, werden verschiedene Verfahren eingesetzt, die einen Spambot davon abhalten sollen, E-Mail-Adressen zu erkennen. Diese werden im Artikel Spam näher beschrieben.

Eine andere Form von Spambots durchsucht beispielsweise Forensoftware oder auch Gästebücher nach Lücken, registriert sich automatisch und schreibt unerwünschte Artikel.

Andere Spambots verfolgen das Ziel, ihre Werbebotschaft durch eine auffällige Bezeichnung als Browserkennung in möglichst vielen Logdateien zu hinterlassen.

Nun ist es dem Spambot natürlich egal, ob der Eintrag Erfolg hatte oder durch ein Plugin geblockt wird. Er wird das gar nicht merken. Auch dem Urheber wird das egal sein, ob sein Spambot nun auf meiner Webseite Erfolg hatte, oder nicht. Dem Urheber geht es um Quantität, nicht um Qualität. Die Masse macht es. Wenn er bei einer von tausend Webseiten Erfolg hatte, hat er sein Ziel erreicht. Und genau das stört mich.

Wenn ich die Log-Dateien des WP-SpamFree-Plugins durchforste, fällt mir auf, dass der Spam von einigen wenigen IP-Adressen ausgeht.

Es gibt nun die Möglichkeit auf oberster Ebene eurer Webseite eine Art Blacklist anzulegen. Dort könnt ihr IP-Adressen oder auch IP-Bereiche angeben, die auf euren Webserver zugreifen dürfen, oder eben auch nicht. Die Datei, die dafür verantwortlich ist, nennt sich ‚.htaccess‘ (man beachte den Punkt). Möchte jemand eure Webseite abrufen, wird vor dem Zugriff die .htaccess auf zugelassen oder verweigert überprüft. Quasi ein Türsteher für eure Webseite.

Die Datei liegt im Root-Verzeichnis eures Webservers und kann mit jedem Editor bearbeitet werden. Habt ihr nun einen hartnäckigen Spammer identifiziert und möchtet diesem den Zugang zu eurer Webseite verwehren, ladet die Datei per FTP herunter und öffnet diese. Natürlich macht ihr zunächst ein Backup der Datei!

Sollten in der Datei schon Einträge vorhanden sein, lasst diese unverändert und fügt folgendes nach dem letzten Eintrag hinzu:

order allow,deny
deny from 91.201.66.14
deny from <andere IP-Adresse eines Spammers>
deny from <noch eine andere IP-Adresse eines Spammers>
allow from all

Die IP-Adresse 91.201.66.14 war in meinem Fall unter anderem für den Spam verantwortlich. Habt ihr andere Spammer identifiziert, dann ändert ihr die IP einfach ab. Abspeichern und zurück auf den Webserver damit. Dem Spammer wird nun künftig der Zutritt zu eurer Webseite verwehrt.

Habt ihr Spam-Kommentare von mehreren IP-Adresse eines bestimmten Segmentes, beispielsweise von 91.201.66., dann braucht ihr nicht alle IP-Adressen einzeln einzutragen. Nehmt folgenden Eintrag vor:

order allow,deny
deny from 91.201.66.
deny from <andere IP-Adresse eines Spammers>
deny from <noch eine andere IP-Adresse eines Spammers>
allow from all

Nun werden alle IP-Adressen des Segmentes geblockt. Klasse, oder?

Update 29.07.2011:

Es gibt ein sehr interessantes Projekt von Aaron Logan, der nicht nur auf IP-Adressen zum blocken von Spammern setzt, sondern auch bestimmte Wörter im Referrer aussondert und bestimmte Bots blockiert. Die Webseite findet ihr hier (die .htaccess in der Sidebar rechts). Die Datei wird immer mal wieder von ihm angepasst.

Dein Kommentar