Je me suis fait spammer un wiki

planté Grrr putain chiotte bordel!

Il y a quelques semaines (quelques mois en fait), j’avais créé un wiki sur la sécurité incendie. ça allait avec le site de QCM sur ce thème: http://qcm.tinad.fr je l’avais mis dans un sous dossier du site : /wiki/

j’ai rédigé quelques pages du wiki. Puis me suis dit que ce serait très fastidieux de faire une documentation complète. J’ai fait quelques recherches pour trouver un plan de cours et en j’ai conclu qu’il valait mieux mettre en pause ce projet car je serai trop tenté de faire un bête plagiat. Depuis, j’ai mis un forum en place, mis à jour les questions sur les IGH, continué des développements top secrets qui ont du mal à avancer. j’ai changé d’appartement, passé de bonnes fêtes de fin d’année etc... Bref, j’avais oublié le wiki.

D’une dizaine de pages le wiki est passé à 382 pages qui avaient pour titres anglais des références à la pillule bleue, des solutions pour perdre 130kg en 1 heure etc... et les nombreuses pages utilisateurs.

Google les a indexées, voici une impression d’écran des "outils pour les webmasters":

outils-webmasters-spam.png

Oui, le site de qcm, c’est 7 URLs différentes uniquement.

Et d’un site sur les thématiques "SSIAP" "sécurité incendie", aux yeux du robot les thématiques principales ne sont plus les mêmes. Des mots clés de contenu sont passés devant.

Attention, je n’incrimine pas médiaWiki. cet accident aurait pu arriver avec un blog spammé dans les commentaires, un forum laissé à l’abandon, bref avec n’importe quel CMS assez répandu pour que les "méchants" aient pris le temps d’écrire les scripts permettant de les spammer automatiquement.

Voici les actions que j’ai fait et que je recommande de faire dans ce cas là:

1) Créer une archive du CMS puis le mettre hors ligne

2) Dans les outils pour les webmasters, j’ai demandé la suppression des pages:



outils-webmasters-spam1.png

3) interdire l’accès aux robots via robots.txt Ça permet de confirmer la demande de suppression des pages de l’index google.

User-agent: *
Disallow: /wiki/

4) Prier pour que la suppression soit rapide, et qu’elle soit répercutée sur la liste des "keywords" associés au site pour google.

Conclusion:

Je pense avoir réagi juste à temps[1], l’indexation des pages spammées du wiki étant récentes, je n’ai pas d’avertissement concernant la sécurité du site dans les outils pour les webmasters. La baisse actuelle de la fréquentation du site est liée au faible nombre d’examens SSIAP pendant les fêtes. D’ici quelques jours tout sera rentré dans l’ordre. Je pense que ce genre de boulette peut entrainer une baisse sérieuse de la fréquentation d’un site pendant des semaines, même après avoir "dé-spammé" le site. Ça peut faire mal sur les revenus.

Dans l’avenir:

  • Ne pas laisser pourrir de CMS dans un coin
  • Le wiki, le blog, le forum, etc... : chacun sur son sous-domaine blog.site.fr wiki.site.fr et pas de site.fr/wiki. ça permet de limiter les conséquences de ce genre d’incident, et ça ne coute rien avec un serveur dédié.
  • Pour un petit wiki, être notifié par e-mail lors de la création d’une nouvelle page semble être une bonne pratique.

Si pour vous c’est trop tard

Si votre site est marqué ainsi par google:

example-interstitial.png

et/ou les outils pour les webmasters:

example-phishing.png

Voici les conseils de google. bon courage!

Complément du 14 janv 2014:

Quelques jours après, google indique qu’il a indexé 5469 pages dans les outils pour les webmasters OUNCH: siteqcmtinadfrwebmasters.jpeg

Mais ces résultats n’apparaissent pas dans le moteur de recherche OUF:

siteqcmtinadfr.jpeg

je suppose qu’il (google) garde les résultats dans sa base de données afin de permettre au webmaster d’annuler la suppression des index pendant 90 jours

Note

[1] Comme quoi ça sert de lire quotidiennement des extraits des logs des serveurs

Ajouter un commentaire

Les commentaires peuvent être formatés en utilisant une syntaxe wiki simplifiée.

La discussion continue ailleurs

URL de rétrolien : https://blog-du-grouik.tinad.fr/trackback/854

Fil des commentaires de ce billet

Page top