Comment bloquer un trafic de spam référentiel avec Apache Webserver
- 968
- 102
- Zoe Dupuis
Dans cette configuration, vous apprendrez ce qu'est un trafic de spam référentiel, comment il est généré et surtout comment bloquer le spam du référence sur le serveur Web Linux Apache.
Qu'est-ce qu'un spam référentiel?
Un spam référent est encore une autre nuisance inventée par des spammeurs, ce qui fait visiter ou le lier par inadvert. Cela peut par conséquent conduire à un classement des moteurs de recherche plus bas, ainsi qu'à vider les ressources de votre serveur.
Étant donné que vous lisez cet article, il est probable que vous ayez déjà remarqué un étrange trafic de référence frappant votre serveur lorsque vous suivez un lien, vous atterrissez sur un site Web complètement sans rapport.
Comment ça fonctionne
Tous les coups générés à l'aide de la technique du spam référend. Vous trouverez ci-dessous un échantillon du journal d'accès de l'Apache:
dix.1.1.8 - - [10 / mars / 2015: 11: 56: 55 +1100] "get / http / 1.1 "200 10543" http: // Exemple.com / "" Mozilla / 5.0 (x11; Linux x86_64) Applewebkit / 537.36 (khtml, comme gecko) Chrome / 40.0.2214.111 Safari / 537.36 "
À partir de ce qui précède, nous pouvons lire que certains formulaires dix.1.1.8
L'utilisation de Chrome Browser a visité une page racine de notre serveur Web, d'où le lien de référer est à partir de exemple.com
domaine. Une telle entrée de journal peut être générée par toute personne ayant un accès à des outils appropriés. Utilisons boucle
commande de générer une fausse référence à partir de mydomain.local:
$ curl -s -e mydomain.http local: // mysite.local> / dev / null
Maintenant, lorsque nous examinons les journaux d'Apache, nous pouvons trouver une entrée suivante:
dix.1.1.8 - - [10 / mars / 2015: 12: 26: 20 +1100] "Get / http / 1.1 "200 433" http: // mydomain.Local "" Curl / 7.32.0 "
De plus, avec une utilisation du boucle
Commande Nous pouvons également modifier un type d'agent:
$ curl -a "Mozilla / 5.0 (x11; Linux x86_64) Applewebkit / 537.36 (khtml, comme gecko) Chrome / 40.0.2214.111 Safari / 537.36 "-s -e http: // mydomain.http local: // mysite.local> / dev / null
Ce qui entraînera la connexion de votre serveur Web:
dix.1.1.8 - - [10 / mars / 2015: 12: 31: 17 +1100] "Get / http / 1.1 "200 433" http: // mydomain.Local "" Mozilla / 5.0 (x11; Linux x86_64) Applewebkit / 537.36 (khtml, comme gecko) Chrome / 40.0.2214.111 Safari / 537.36 "
Ce qui précède est un spam référentiel et il peut tromper vos outils de statistique Web tels que Google Analytics ainsi que les ressources du serveur de vidange de votre serveur.
Comment bloquer un spam référentiel
Ce que nous aimerions réaliser ici, c'est simplement bloquer le trafic à partir de toute référence suspecte. Par exemple, nous allons bloquer tout trafic de exemple.com
domaine de référence ainsi que pour bloquer tout trafic à partir d'un lien de référence contenant un mot-clé courrier indésirable
n'importe où dans l'URL.
Pour cela, nous aurons besoin d'Apache récrire
module à activer. Pour voir si récrire
Le module est activé sur votre serveur Entrez:
# apache2ctl -m | Grep Rewrite Rewrite_Module (partagé) Syntaxe OK
Si vous ne voyez aucune sortie récrire
Le module n'est pas activé. Pour activer la réécriture du module:
# a2enmod réécriture du module d'activation. Pour activer la nouvelle configuration, vous devez exécuter: Service Apache2 Restart # Service Apache2 Restart […] Redémarrage du serveur Web: apache2apache2: . d'accord
Ensuite, changez votre hôte virtuelAutoriser Override
paramètres. Par exemple:
De: Index d'options suitSymLinks MultiViews ALLERNOOVERRIDE Aucune commande Autoriser, refuser Autoriser de tous à: Index d'options Suivant Suivre
Une fois que vous avez effectué les modifications ci-dessus, redémarrez votre serveur Web:
# Service Apache2 Redémarrer
À ce stade, nous aurons deux options sur la façon d'utiliser nos réécritures pour bloquer le spam pour références.
La première option consiste à insérer nos instructions de réécriture dans le fichier de configuration de notre site. Cette approche est recommandée car elle ne met pas beaucoup de pression sur les ressources du serveur, car toutes les instructions de réécriture ne sont lues qu'une seule fois pendant la séquence de démarrage Apache. Pour ce faire, entrez une ligne de réécriture suivante dans le fichier de configuration de votre site:
Index d'options Suivre Suivre Multiviews ALLERVERRIDE Aucune commande Autoriser, refuser l'autorisation de tous les réécritures sur RewriteCond% http_referer Exemple.com |.* Spam [NC] réécriture .* - [F]
Une fois que vous avez effectué les modifications ci-dessus, veuillez redémarrer votre serveur Web Apache. L'inconvénient de la configuration ci-dessus est que vous devez avoir un accès racine au serveur. Si vous n'avez pas d'accès administratif de serveur, vous disposez d'option pour insérer .htaccess
Fixez-vous dans un répertoire racine de votre site Web avec un contenu suivant:
Réécriture de la conduite sur RewriteCond% http_referer Exemple.com |.* Spam [NC] réécriture .* - [F]
L'inconvénient de ce qui précède .La méthode HTACCESS est qu'elle peut réduire considérablement les performances de votre serveur Web comme le .htaccess
Le fichier doit être lu chaque fois qu'une demande HTTP est faite.
D'une manière ou d'une autre, votre serveur doit maintenant nier tout trafic de référentiel exemple.com
ou si l'URL du référence contient un mot-clé courrier indésirable
. Pour tester une exactitude ou votre filtre de spam référentiel boucle
commande tout en faisant simulant une source de référence. Votre demande devrait maintenant entraîner un accès interdit (erreur Apache 403) causée par .* - [F]
Réécriture.
Tutoriels Linux connexes:
- Introduction aux moteurs de stockage MySQL
- Analyseur de journal Linux Apache
- Ubuntu 20.04 WordPress avec installation Apache
- Choses à installer sur Ubuntu 20.04
- Comment gérer et dépanner les journaux Kubernetes
- Comment configurer le serveur Linux Apache MySQL Python
- Système linux hung? Comment s'échapper vers la ligne de commande et…
- Guide de dépannage général GNU / Linux pour les débutants
- Choses à faire après l'installation d'Ubuntu 20.04 Focal Fossa Linux
- Utilisation de la commande JournalCTL et exemples sur Linux
- « Comment insérer la ligne au début du fichier sur Linux
- Comment convertir entre les nombres binaires et décimaux en utilisant Perl »