Bon à savoir | Les systèmes de filtrage anti-spam s’affinent !

Publié par Service Communication dans Délivrabilité Email Publié le 14 mars 2019 Temps de lecture : 2 min

Réputé pour faire évoluer rapidement les systèmes de filtrage anti-spam, Gmail s’est à nouveau imposé comme un précurseur. En début d’année, le géant de la messagerie a officiellement lancé TensorFlow. Un outil open source d’apprentissage automatique qui lui permet de traquer ceux qui ont toujours tenté de passer au travers des mailles du filet.

L’intelligence artificielle au service du machine learning

Depuis que le filtrage est basé sur le comportement des usagers, les spammeurs s’efforcent de se comporter comme des expéditeurs légitimes à l’aide de volumes inférieurs afin de contourner les systèmes. Communément appelés « spams gris », ces imposteurs du net sont difficiles à identifier. En combinant sa plateforme de machine learning et l’utilisation de l’intelligence artificielle, Google a su créer de nouveaux filtres anti-spam pour optimiser sa plateforme. L’objectif ? Filtrer les e-mails non consentis par le destinataire. Mais également personnaliser davantage les filtres anti-spam. Ce qu’une personne considère comme spam, une autre personne peut le considérer comme message important. Alors que Google était déjà capable de stopper 99,9% des spams mondiaux, cette nouvelle évolution technique lui permet d’en arrêter 100 millions de plus par jour.

Les e-mails commerciaux passés à la loupe

En injectant de l’intelligence artificielle dans une plateforme de machine learning, un service de messagerie a désormais la capacité de rechercher des e-mails commerciaux dans des environnements complexes. En clair, chaque e-mail contient des milliers de signaux potentiels. Certains sont considérés comme du spam, d’autres sont bien légitimes. C’est pourquoi le service de messagerie doit être d’autant plus vigilant lorsque les e-mails :

Sont basés sur des images (car leur contenu réel peut être dissimulé)
Intègrent un contenu incorporé caché (exemple : pièces attachées)
Proviennent d’un nom de domaine nouvellement créé (et tentent de faire passer un faible volume de messages de spam dans le trafic légitime)

Grâce au machine learning, les services de messagerie peuvent évaluer tous ces éléments, prendre des décisions en fonction et s’adapter rapidement aux tentatives de spam en constante évolution.

Le système continue d’apprendre

Pour chaque nouveau lancement naît une phase de test. Et TensorFlow n’échappe pas à la règle. Bien que le système ait déjà fait ses preuves, persistent encore des défauts de jeunesse. L’un des plus gros sur lesquels le service de messagerie travaille actuellement concerne le retard de livraison des e-mails. Exemple : un e-mail identique peut être livré immédiatement à un moment donné mais en différé s’il est envoyé à un autre instant T. L’explication ? Une mise en quarantaine supplémentaire du système qui retarde la livraison. D’après Gmail, ces imperfections devraient se régler automatiquement car le système est en apprentissage permanent.

Fort de son premier succès, Google vient actuellement de lancer la version alpha 2.0 de TensorFlow (lancement officiel prévu au 2^e trimestre 2019). Elle permettra notamment d’identifier et résoudre les éventuels problèmes. Nul doute que comme chaque évolution majeure dont Gmail est pionner, les géants d’internet (Microsoft, Yahoo…) se mettront rapidement au diapason.

Auteur : Stéphane Bricard, Responsable Délivrabilité

Contactez le service délivrabilité de Dolist au 05 57 26 25 70 ou par e-mail.

*Source : Gmail 2019