Les (très) curieux Twitterbot/1.0 et ses amis

Ils sont partout, ils nous entourent à chaque pas clic sur le web, à la fois discrets et pourtant si présents dans nos plus sombres archives. Non je ne parle pas des hommes-lézards, mais des bots, ces petits salopios identifiables par un user-agent propre (ou pas) dans nos logs Apache.

Pwned !

Pwned !

Un peu d’histoire

Non je ne vais pas m’épancher sur un quelconque et ennuyeux historique des bots qui parcourent sans relâche le web, mais sur la raison de ce billet.

Je travaille ces dernière semaines sur un projet de fond, qui à la base n’était qu’un bête outil interne, mais qui est devenu au fur et à mesure un peu plus ambitieux, et avec un avenir public éventuel. Tout dépendra de ma rapidité à coder une vraie beta publiable sur les internets sans risquer de laisser un trou dans le pantalon (OMFG il a pas sanitizé ses vars le n00b). Bah oui, je suis pas dèv’, à la base.

Bref ! il s’agit d’une interface complète pour spammer tweeter-direct-marketing intelligemment et under the radars. Deux versions se battent sur mon disque: Mark 1 (code procédural, portes, fenêtres, et garage ouvert, aucune gestion d’user) et Mark 2 (Objet, secure, cache, top moumoutte toussa). Mark 2 avance lentement (n00b objet secure etc) et n’a commencé alors que Mark 1, avec la gestion et les features de bases, était déjà à peu près fonctionnel. Revirement: il faut pousser Mark 1 dans ses retranchements, et donc continuer les tests sur l’Alpha interne avant de proposer une Beta privée/publique.

Depuis 3 jours Mark 1 tourne, et alors que j’augmentais le pool de comptes pour diversifier les thématiques, j’ai relevé une 1ère incohérence dans mes stats de clics.

5 comptes sur ce lien pour ce résultat ? Une grande joie m'envahit

5 comptes sur ce lien pour ce résultat ? Une grande joie m’envahit

La dure réalité.

La dure réalité.

Ce que vous voyez est extrait de l’interface du Club Partenaire d’Amazon, et des stats de Bit.ly. Chaque outil de stats de visites fait sa petite tambouille perso et provoque ainsi toujours des différences, ok. Mais à ce point là, c’est à se frapper la tête contre les murs. Je fais donc un test, et balance un lien qui passe d’abord par un url shortener perso avant d’aller sur Amazon.

Et là… C’est le drame !

OH MY GOD !

A peine ai-je balancé le lien en pâture à tous ces gens qui ne demandent qu’à consommer aveuglément (non, c’est pas ça ?) que le couperet tombe: mon url shortener affiche 55 hits. Comme ça, direct, just because on est des warriors 2.0.

Je me suis rappelé qu’il comptait les bots (de toutes façons, c’était devenu clair…), et d’un coup, un branchement s’est fait dans mon cerveau. Celui qui manquait et qui te faisait passer à côté d’un truc essentiel dans ta lutte du NAN J’SPAMME PAS M’SIEUR TWITTER J’TE JURE:

TwitterBot 1.0 ! 

Parfaitement, je me suis fait chier à détourner une affiche de film.

Parfaitement, je me suis fait chier à détourner une affiche de film.

Don’t be evil

Twitter a tellement un énorme modjo qu’on en oublierait presque que toutes ses petites personnalisations (suggestions de comptes…) ne se font pas sans épier ce que l’on poste. Oh oui bien sûr, c’est aussi une arme anti-spam (je regrette d’ailleurs de ne pas percuté plus tôt, et vais devoir opérer certains ajustements), mais c’est surtout un pic-vert affamé de links.

Je m’étais en plus fais la réflexion pas plus tard que y’a pas longtemps (parfaitement, oui !). Il y a tout pile 1 mois, j’avais remarqué ceci après la publication du dernier article sur les jeux vidéo AAA.

https://twitter.com/kjbstar/status/324918010911522816

https://twitter.com/kjbstar/status/324918632738078720

Quasi immédiatement après le tweet, Twitterbot/1.0 est passé me faire un petit coucou. Et dans les 2 heures qui suivirent, Twitter a adapté ses suggestions selon mon dernier lien posté (et donc qui couvre un centre d’intérêt: « je partage, donc j’aime »).

Mais il n’est pas seul, plusieurs potes au bot pic-vert sont également prêt à dégainer et bouffer vos liens encore plus vite que Lucky Luke. Peut être même plus vite Chuck Norris, oserais-je dire. Parfaitement. J’ai osé.

Attack of the bots from outer-web

C’est une déferlante d’user-agents qui viennent crawler vos pages tweetées. Outre Twitter, on peut retrouver Topsy et Gnip (data mining), Ning (réseau social), mais aussi des bots plus discrets qui se cachent derrière de bêtes browsers.

Ils peuvent venir tellement force qu’ils peuvent faire tomber un site (en carton, je vous l’accorde). Je vous invite à lire ce billet dans lequel le proprio explique comment son site est tombé à cause de ces bots. La 2ème partie est d’ailleurs plus intéressante, la 1ère n’étant que cette histoire de DDOS-like dont on se contrefout un peu.

Plus récent, « What happens when you post a link on Twitter ? » détaille chronologiquement la petite vie de ces bouffeurs de l’ombre quand ils choppent un lien à étudier. Très intéressant également.

Fort heureusement, mais après vérification quand même, aucun de ces vampires ne montrent le bout de leurs dents lorsque votre compte Twitter est privé. Seul Twitter Bot passera voir ce que vous partagerez…

So what ?

Tu râles, t’avertis, tu dénonces ?

Oh non rien de tout ça. Ce système ne me choque pas outre-mesure, ce sont les règles du jeu (n’est-ce pas ma pôv’ Lucette ?), et il faut faire avec.

Non, c’est juste que j’ai tilté sur une facette importante de Twitter, qui était pourtant sous mes yeux, mais que j’ai ignoré, trop focus sur d’autres éléments qui ne sont pas moins importants (dans la démarche du design de mon outil), mais qui ne sont pas les seuls. J’ai de plus trouvé tout ce joli monde très intéressant, et poser par écrit approfondi la réflexion et en ouvre d’autres, surtout vis à vis de Google Bot.

Qu’il passe sur les tweets n’est pas une nouveauté loin de là, mais on peut tout imaginer, même un bot spécial pour Twitter qui prend en compte les occurences / retweets, etc… Ok, j’extrapole beaucoup…

Quoiqu’il en soit, ce que je retiens de tout cela, c’est que je vais devoir revoir une partie de mon système. Je spinnais le texte, mais j’en oubliais les links, qui même derrière un Bit.ly, restent à chaque campagne… Le même linkET le même contenu derrière ! On va donc ruser un peu, et dire adieu à l’API de Bitly pour les stats de clics (dommage, c’était bien pratique…).

Auteur: Johan Biré

Auto-didacte, curieux et passionné, je prend le gentil visiteur par la main, lui dit où aller, et analyse ses pas. #marketing #analytics #bizdev

2 réflexions au sujet de « Les (très) curieux Twitterbot/1.0 et ses amis »

  1. Ping : [MAKING OF] Un tool twitter avorté pour faire du spa... Marketing | Donemat!

  2. Adrien Bacchi

    Hey je découvre looongtemps après ta publication… mais très bon article Johan ;) . Bon contenu, bon style, bonne gueule.
    Et la bonne nouvelle > il y a pas tant que ça à mettre à jour pour que l’article soit d’actualité en 2016 ;) .

Laisser un commentaire