Uno degli aspetti più fastidiosi del web è il cosiddetto SPAM. La definizione più comune associa la parola spam all’invio di messaggi indesiderati che risultano essere, nella maggior parte dei casi, di natura commerciale. Esiste, però, anche un’altra forma di SPAM che riguarda da vicino i webmaster e tutti coloro che gestiscono un sito web; Il cosiddetto “Referrer spam”.
SPAM classico
Lo SPAM legato all’invio di email non richieste di carattere commerciale non è solo un fastidio, ma, rubando banda utile al sito, può diventare un problema serio (i.e. rallentamento eccessivo) costringendo i webmaster ad aumentare le risorse a disposizione e mantenere, così, uno standard di servizio all’altezza delle aspettative.
Come prevenirlo:
- Non inserire l’indirizzo mail nel sito. Il contatto con i clienti può avvenire tramite un semplice form dotato di captcha. Utilizzare script in javascript spesso non è una soluzione in quanto molti programmi utilizzati dagli spammers sono in grado di decifrarli. Inserire l’indirizzo email sotto forma di immagine può essere un’altra soluzione anche se questo non ci mette a riparo da eventuali inserimenti manuali delle mail in liste di spamming.
- Blackhole. Un’altra tecnica utilizzata dagli spammers consiste nell’inviare email ad indirizzi “plausibili” specificando correttamente solo il nome del dominio (ad esempio prova@iltuodominio.it). I mailserver sono infatti configurati in modo tale da gestire eventuali errori inoltrando le mail riportate in maniera non corretta ad indirizzi reali (prova@iltuodominio.it viene inoltrato automaticamente ad un indirizzo esistente tipo info@iltuodominio.it). Purtroppo quello che è un servizio utile il cui scopo è di recapitare mail digitate in maniera errata diventa, per gli spammer, un mezzo efficace per raggiungere le caselle di posta. Il modo per evitare che ciò avvenga è quello di implementare i filtri direttamente sul mailserver e di bannare automaticamente le email provenienti da IP presenti sua una black list.
Referrer SPAM
Il referrer SPAM è una tecnica che utilizza mezzi diversi dalle email ed ha obiettivi legati al SEO e non alla vendita di prodotti commerciali (almeno non direttamente). Agisce tramite crawlers (software simili allo spider Googlebot) che scansionano la rete visitando un altissimo numero di siti. A differenza di quanto avviene per un nomale bot, la scansione avviene falsificando l’user agent contenente i dettagli dell’utente visitatore in modo tale da far comparire nel referer (la parte che indica il sito web di provenienza) un URL specifico. Questi indirizzi, inseriti nei log di accesso del sito, sono visibili non solo dal software di monitoraggio del traffico (Google Anlytics per esempio), ma anche dai crawlers di Google che identificano i link inseriti nei log come dei backlink che, come ben sappiamo, apportano un importante contributo al SEO. Il problema per il webmaster nasce quando gli algoritmi dei crawlers di Google, valutando come spam gli URL dello spammer, entrano in azione eliminando questi indirizzi e penalizzando il sito ospite (quello visitato) con rank più bassi o, nei casi peggiori, inserendolo in una black list.
Un sito che ha utilizzato questa tecnica in maniera massiva è Semalt, un sito che offre software di monitoraggio e che, grazie al referrer spam, è riuscito a raggiungere i primi posti nelle ricerche di Google.
Come difendersi dal referrer SPAM
- Htaccess. Il modo più semplice consiste nell’insrire il seguente codice nel file .htaccess:
## SITE REFERRER BANNING RewriteCond %{HTTP_REFERER} semalt.com [NC,OR] RewriteCond %{HTTP_REFERER} buttons-for-website.com [NC,OR] RewriteCond %{HTTP_REFERER} seoanalyses.com [NC] RewriteRule .* - [F]
- Per chi non ha accesso al file htaccess ed utilizza wordpress può utilizzare un plagin creato da Peading chiamato Semalt Blocker for wordpress.
- Filtro di Google Analytics. Creare un filtro su Google Analytics può essere un’altra soluzione.
- Uno script in grado di evitare che Semalt riesca ad inserire i suoi dati nei nostri log è scaricabile da github.
- Un altro script molto valido è scaricabile qui.
Cosa facciamo noi di HostingPerTe
La nostra infrastruttura monitora e filtra tutti i dati prima che essi vengano elaborati dai server prevenendo i problemi legati allo SPAM sia in entrata che in uscita. Il sistema, benché supportato da hardware e software avanzati, non è infallibile. Consigliamo, pertanto, di adottare tutte le accortezze necessarie per prevenire e limitare i danni derivanti dallo SPAM.